Loading...

AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 15:53
2 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,197 / 2 페이지
한국이오픈AI의인공지능챗봇챗GPT국가별매출에서미국에이어세계2위를차지한것으로나타났다.앱마켓분석업체센서타워가26일공개한'챗GPT앱분석보고서'에따르면,한국의누적매출액은2억달러(약2922억원)로전체의5.4%를차지하며미국(35.4%)에이어2위에올랐다.​특히주목할점은한국의다운로드순위는21위(1.5%)에불과하지만,매출에서는압도적인2위를기록했다는것이다.이는한국사용자들의유료결제의향이매우높다는것을보여준다.실제로한국의다운로드당매출(RPD)은8.7달러로미국(8.8달러)과단0.1달러차이에불과했다.​AI시장의뜨거운관심입증한국에서챗GPT는지난8월역대최고다운로드수를,10월에는최고매출을기록했다.센서타워에따르면올해1월1일부터11월20일까지챗GPT는한국앱마켓전체에서다운로드1위,매출4위를차지했다.상위권이대부분게임으로채워진가운데비게임앱으로이같은성과를거둔것은이례적이라는평가다.​경쟁사대비우위도두드러진다.구글의제미나이와비교해다운로드는3배,일일활성사용자는8배이상많았으며,앤스로픽의클로드보다매출은10배이상높았다.웹에서도챗GPT는유튜브,네이버,구글,다음에이어전체5위를기록했으며,방문자1인당월평균체류시간은367분으로2위네이버의1.7배에달했다.​글로벌AI기업들의한국진출가속화이러한시장성을인식한글로벌AI기업들이한국진출을가속화하고있다.오픈AI는지난5월한국법인설립과서울사무실개설을공식발표했으며,앤스로픽도10월2026년초강남에서울사무실을개설할계획을밝혔다.앤스로픽의폴스미스최고상업책임자는"전세계앤스로픽사용자상위5개국중3개국이한국,일본,인도등아시아에위치하고있다"고설명했다.​센서타워는"전통적인검색엔진중심의상위순위속에서AI기반서비스가본격적으로자리잡기시작했다"며"한국의정보탐색방식이빠르게변화하고있음을시사한다"고분석했다.
2 조회
0 추천
16:01 등록
화요일TheInformation이보도한내부전망에따르면,OpenAI는2030년까지최소2억2천만명이ChatGPT구독료를지불할것으로예상하고있다.이전망은인공지능회사의챗봇을세계최대구독비즈니스중하나로자리매김하게하며,유료사용자는2030년말까지예상되는26억주간사용자의8.5%를차지할것으로보인다.​이전망은현재구독자수에서상당한증가를나타낸다.2025년7월기준,약3,500만명의사용자가각각월20달러와200달러의가격으로책정된ChatGPT의"Plus"또는"Pro"플랜에비용을지불했으며,이는플랫폼의주간활성사용자기반의약5%를차지한다.10월까지ChatGPT는8억명의주간활성사용자에도달했으며,이는8월의7억명과2월의4억명에서증가한수치이다.​증가하는손실속매출성장OpenAI의연간매출실행률은2025년말까지약200억달러에달할것으로예상되지만,회사는여전히빠른속도로현금을소진하고있습니다.TheInformation은9월에OpenAI가2025년상반기동안약43억달러의매출을창출했으며,이는작년전체매출보다약16%증가한수치이지만,주로연구개발비용으로인해25억달러의손실을입었다고보도했습니다.​회사는고용주들이기업구독을체결하도록설득하는데노력을집중하고있으며,현재100만개이상의비즈니스고객이OpenAI를직접사용하고있습니다.OpenAI는또한올해초인도를포함한개발도상국에서월5달러의가격으로초저가ChatGPTGo티어를도입했으며,인도는OpenAI의최대사용자기반입니다.​새로운수익원OpenAI는쇼핑및광고기반기능과같은신제품에서약20%의수익을창출할것으로예상합니다.11월24일,회사는상업관련작업에특화되어훈련된GPT-5미니변형모델을기반으로하는ChatGPT용쇼핑리서치어시스턴트를도입했습니다.이기능은모든사용자(거의무제한사용이가능한무료계정사용자포함)가연휴기간동안이용할수있으며,사용자가제품을비교하거나선물을찾고,할인정보를추적하며,사진을기반으로유사한아이템을찾는데도움을줄수있습니다.​이쇼핑어시스턴트는OpenAI가커미션기반수익원으로진출하고있음을보여줍니다.이는9월에Etsy,Skims,Glossier와같은Shopify상인을포함한소매업체와함께즉시결제기능을도입한데이은것입니다.OpenAI는이러한전망에대한논평요청에즉각적으로응답하지않았습니다.
2 조회
0 추천
15:59 등록
하버드대학출신인AnhPhuNguyen과CaineArdayfio는대화를지속적으로기록하고회상하는"제2의두뇌"역할을하도록설계된AI기반스마트안경Mira개발을위해660만달러의시드펀딩을유치했습니다.최근Halo에서리브랜딩한샌프란시스코기반스타트업은GeneralCatalyst로부터투자를유치했으며,NavalRavikant,PillarVC,VillageGlobal,MorningsideVentures,SomaCapital이참여했습니다.​2026년1월출시예정인이안경은MetaRay-Ban스마트안경과같은카메라중심경쟁제품과는다른방향을제시합니다.대신Mira는개인정보보호문제를해결하면서700밀리초미만의응답시간을달성하기위해오디오전사에만의존합니다.GeneralCatalyst에따르면,이시스템은대화를지속적으로듣고전사하며,듀얼웨이브가이드디스플레이를통해관련맥락을렌즈에직접표시합니다.​바이럴프라이버시경고에서투자받은스타트업으로창업자들은2024년9월MetaRay-Ban안경과안면인식기술을사용하여낯선사람을즉시식별하고개인정보를검색하는논란의여지가있는프로젝트인I-XRAY로처음주목을받았습니다.1억회이상의조회수를기록한이시연은상용제품이아닌개인정보보호인식캠페인으로기획되었습니다.Nguyen과Ardayfio는이기술을출시하는대신사람들이공개데이터베이스에서자신의정보를삭제할수있도록돕는가이드를게시했습니다.​두사람은하버드대학교를중퇴하고Mira개발에집중했으며,이를경영진,영업팀,엔지니어를포함한전문가를위한"인지코파일럿"으로포지셔닝했습니다.회사자료에따르면이안경의무게는39그램으로경쟁제품의절반이며,배터리수명은하루종일지속될것으로예상됩니다.​성장하는시장에서의프라이버시우선접근법카메라가장착된대안제품들과달리,Mira의오디오전용디자인은음성변환후즉시녹음을삭제하며,변환된텍스트는회사서버가아닌사용자의휴대폰에로컬로저장됩니다.479달러의안경은MetaRay-Ban과동일한가격대를형성하면서도다른사용사례를목표로합니다:즉각적인기억회상,60개이상의언어에대한언어번역,그리고소셜미디어통합이아닌회의맥락파악기능입니다.​이번투자는스마트안경시장이폭발적인성장을경험하는시점에이루어졌으며,2025년상반기글로벌출하량이전년대비110%급증했는데,이는주로AI기반모델에의해주도되었습니다.GeneralCatalyst의파트너AraK.는"1초미만의AI응답시간"이반응적질의가아닌능동적이고대화형지원으로의전환을나타낸다고언급했습니다.
3 조회
0 추천
15:56 등록
OpenAI는화요일에ChatGPT에서별도의음성모드가필요없어졌다고발표했으며,사용자가이제지도및이미지와같은시각적콘텐츠와함께실시간대화내용을볼수있는메인채팅인터페이스에음성대화를직접통합했습니다.​모바일및웹플랫폼의모든사용자에게배포되는이번업데이트는이전에음성상호작용이애니메이션파란색구체가표시되는격리된화면에서이루어지던오랜제한사항을해결합니다.사용자는응답을보지못한채듣기만할수있었으며,ChatGPT가말한내용을텍스트로검토하려면음성모드를종료해야했습니다.​원활한멀티모달경험새로운통합기능으로사용자들은ChatGPT의텍스트입력란옆에있는파형아이콘을탭하여음성대화를시작할수있으며,말하는동안응답이나타나는것을볼수있습니다.OpenAI의시연영상에따르면,시스템은대화내용의텍스트를표시하는동시에관련시각자료를보여줄수있습니다.회사가공유한한예시에서ChatGPT는음성대화중에인기있는제과점들의지도와샌프란시스코타르틴베이커리의페이스트리사진들을표시했습니다.​OpenAI는X에올린공지에서"대화하고,답변이나타나는것을보고,이전메시지를검토하며,이미지나지도같은시각자료를실시간으로볼수있습니다"라고밝혔습니다.사용자들은텍스트입력으로다시전환하기전에음성대화를중지하려면여전히"종료"를탭해야합니다.​사용자선택보존통합음성모드는앱업데이트시기본경험이되지만,OpenAI는오디오전용경험을선호하는사용자를위해기존인터페이스를보존했습니다.이전형식을원하는사용자는설정의음성모드에서"분리모드"를활성화할수있습니다.​이변경사항은사용자가대화맥락을잃지않고음성과텍스트사이를보다유동적으로이동할수있도록하는멀티모달AI상호작용을향한OpenAI의지속적인노력을나타냅니다.Google은음성대화중오버레이로실시간비디오의특정부분을강조표시할수있는GeminiLive를통해유사한영역을탐구했습니다.
3 조회
0 추천
15:53 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입