Loading...

AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 2025.11.26 15:53
482 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,366 / 57 페이지
하버드대학출신인AnhPhuNguyen과CaineArdayfio는대화를지속적으로기록하고회상하는"제2의두뇌"역할을하도록설계된AI기반스마트안경Mira개발을위해660만달러의시드펀딩을유치했습니다.최근Halo에서리브랜딩한샌프란시스코기반스타트업은GeneralCatalyst로부터투자를유치했으며,NavalRavikant,PillarVC,VillageGlobal,MorningsideVentures,SomaCapital이참여했습니다.​2026년1월출시예정인이안경은MetaRay-Ban스마트안경과같은카메라중심경쟁제품과는다른방향을제시합니다.대신Mira는개인정보보호문제를해결하면서700밀리초미만의응답시간을달성하기위해오디오전사에만의존합니다.GeneralCatalyst에따르면,이시스템은대화를지속적으로듣고전사하며,듀얼웨이브가이드디스플레이를통해관련맥락을렌즈에직접표시합니다.​바이럴프라이버시경고에서투자받은스타트업으로창업자들은2024년9월MetaRay-Ban안경과안면인식기술을사용하여낯선사람을즉시식별하고개인정보를검색하는논란의여지가있는프로젝트인I-XRAY로처음주목을받았습니다.1억회이상의조회수를기록한이시연은상용제품이아닌개인정보보호인식캠페인으로기획되었습니다.Nguyen과Ardayfio는이기술을출시하는대신사람들이공개데이터베이스에서자신의정보를삭제할수있도록돕는가이드를게시했습니다.​두사람은하버드대학교를중퇴하고Mira개발에집중했으며,이를경영진,영업팀,엔지니어를포함한전문가를위한"인지코파일럿"으로포지셔닝했습니다.회사자료에따르면이안경의무게는39그램으로경쟁제품의절반이며,배터리수명은하루종일지속될것으로예상됩니다.​성장하는시장에서의프라이버시우선접근법카메라가장착된대안제품들과달리,Mira의오디오전용디자인은음성변환후즉시녹음을삭제하며,변환된텍스트는회사서버가아닌사용자의휴대폰에로컬로저장됩니다.479달러의안경은MetaRay-Ban과동일한가격대를형성하면서도다른사용사례를목표로합니다:즉각적인기억회상,60개이상의언어에대한언어번역,그리고소셜미디어통합이아닌회의맥락파악기능입니다.​이번투자는스마트안경시장이폭발적인성장을경험하는시점에이루어졌으며,2025년상반기글로벌출하량이전년대비110%급증했는데,이는주로AI기반모델에의해주도되었습니다.GeneralCatalyst의파트너AraK.는"1초미만의AI응답시간"이반응적질의가아닌능동적이고대화형지원으로의전환을나타낸다고언급했습니다.
503 조회
0 추천
2025.11.26 등록
OpenAI는화요일에ChatGPT에서별도의음성모드가필요없어졌다고발표했으며,사용자가이제지도및이미지와같은시각적콘텐츠와함께실시간대화내용을볼수있는메인채팅인터페이스에음성대화를직접통합했습니다.​모바일및웹플랫폼의모든사용자에게배포되는이번업데이트는이전에음성상호작용이애니메이션파란색구체가표시되는격리된화면에서이루어지던오랜제한사항을해결합니다.사용자는응답을보지못한채듣기만할수있었으며,ChatGPT가말한내용을텍스트로검토하려면음성모드를종료해야했습니다.​원활한멀티모달경험새로운통합기능으로사용자들은ChatGPT의텍스트입력란옆에있는파형아이콘을탭하여음성대화를시작할수있으며,말하는동안응답이나타나는것을볼수있습니다.OpenAI의시연영상에따르면,시스템은대화내용의텍스트를표시하는동시에관련시각자료를보여줄수있습니다.회사가공유한한예시에서ChatGPT는음성대화중에인기있는제과점들의지도와샌프란시스코타르틴베이커리의페이스트리사진들을표시했습니다.​OpenAI는X에올린공지에서"대화하고,답변이나타나는것을보고,이전메시지를검토하며,이미지나지도같은시각자료를실시간으로볼수있습니다"라고밝혔습니다.사용자들은텍스트입력으로다시전환하기전에음성대화를중지하려면여전히"종료"를탭해야합니다.​사용자선택보존통합음성모드는앱업데이트시기본경험이되지만,OpenAI는오디오전용경험을선호하는사용자를위해기존인터페이스를보존했습니다.이전형식을원하는사용자는설정의음성모드에서"분리모드"를활성화할수있습니다.​이변경사항은사용자가대화맥락을잃지않고음성과텍스트사이를보다유동적으로이동할수있도록하는멀티모달AI상호작용을향한OpenAI의지속적인노력을나타냅니다.Google은음성대화중오버레이로실시간비디오의특정부분을강조표시할수있는GeminiLive를통해유사한영역을탐구했습니다.
483 조회
0 추천
2025.11.26 등록
GoogleDeepMind는생물학에혁명을일으킨인공지능시스템의5주년을기념하여11월25일AlphaFold개발과정을담은장편다큐멘터리"TheThinkingGame"을YouTube에무료로공개했습니다.약90분분량의이영화는창립자DemisHassabis와그의팀이2024년노벨화학상을수상하게한50년된단백질접힘문제를해결한런던연구소의전례없는접근을제공합니다.​2017년DeepMind의세계바둑챔피언승리를기록한다큐멘터리"AlphaGo"의수상경력이있는감독GregKohs가5년에걸쳐촬영한이다큐멘터리는무료공개전2024년트라이베카페스티벌에서초연되었습니다.GoogleDeepMind의블로그에따르면,이영화는"AlphaFold팀이생물학분야의50년된거대한난제를해결했다는것을알게된순간"을포착했습니다.​체스신동에서노벨상수상자까지이다큐멘터리는하사비스가어린시절체스신동에서AI선구자로성장한여정을추적하며,DeepMind가퐁과같은비디오게임을마스터하는시스템을만드는것부터단백질구조를정확하게예측하는AlphaFold를개발하기까지의진화과정을기록합니다.스웨덴왕립과학원은2024년10월하사비스와DeepMind이사존점퍼에게"단백질구조예측"으로노벨화학상을수여했으며,이영예를계산단백질설계자데이비드베이커와공동수상했습니다.​AlphaFold의영향력은혁신적이었습니다.GoogleDeepMind에따르면,190개국의300만명이상의연구자들이2억개이상의단백질구조예측을포함한무료로제공되는AlphaFold데이터베이스를사용했습니다.이시스템은과학자들이이전에는수개월또는수년의실험실작업이필요했던것을몇분안에예측할수있게합니다.​​과학적발견을위한AI의약속Kohs는HarvardCrimson과의인터뷰에서자신의영화가"기술뒤에있는인간"에초점을맞춘다고말하며,의도적으로AI의잠재적위험성을강조하지않기로선택했다고설명했다.이다큐멘터리는대신인간의인지능력을모든영역에서동등하게구현하는AI인범용인공지능을추구하는과정에서겪은돌파구와좌절을통해팀의헌신을부각시킨다.​"AlphaFold가과학적발견을가속화할수있는AI의놀라운잠재력을보여주는첫번째증거로기억되기를바란다"고Hassabis는노벨상수상후말했다.응용분야는항생제내성이해부터플라스틱을분해하는효소설계까지다양하다.​​이영화는암호화폐거래소Coinbase에관한"Coin"과YouTube에서무료로시청할수있는그의호평받은"AlphaGo"다큐멘터리를포함하여기술선구자들을다룬Kohs의포트폴리오에합류한다.
497 조회
0 추천
2025.11.26 등록
RobinhoodCEO블라드테네브가공동창업한인공지능스타트업Harmonic이월요일14억5천만달러기업가치로시리즈C펀딩에서1억2천만달러를유치하며,아직상용제품을출시하지않았음에도불구하고유니콘지위를달성했습니다.이번라운드는RibbitCapital이주도했으며,SequoiaCapital,KleinerPerkins,IndexVentures,그리고로렌파월잡스가설립한투자회사인신규투자자EmersonCollective가참여했습니다.​이번펀딩은팔로알토에본사를둔이회사가불과14개월만에진행한세번째자금조달로,총투자금은2억9천5백만달러에이릅니다.Harmonic은인공지능의지속적인문제인할루시네이션(AI시스템이그럴듯하지만잘못된정보를생성하는현상)에집중함으로써투자자들의열광적인관심을받고있습니다.​수학을통한AI환각제거Harmonic의주력모델인Aristotle은정확성을보장하기위해형식적수학검증을사용함으로써기존AI시스템과차별화됩니다.확률적언어예측에의존하는대신,Aristotle은Lean4프로그래밍언어로추론을생성하여각단계의정확성을수학적으로검증할수있게합니다.CEOTudorAchim은Reuters와의인터뷰에서"환각현상의제거는시스템이자연어가아닌코드로추론을출력하도록요구하는우리의요구사항에서직접비롯됩니다"라고말했습니다.​7월,Aristotle은국제수학올림피아드에서금메달수준의성과를달성하며6개문제중5개를해결했습니다.이는Google및OpenAI의시스템과어깨를나란히하는벤치마크였습니다.RibbitCapital의GeneralPartner인NickShalek에따르면,"Aristotle이수학적초지능이현실세계에서달성할수있는것을계속해서입증함에따라우리의파트너십을심화하게되어자랑스럽습니다".​안전필수산업타겟팅Harmonic은항공우주,금융,자동차산업을포함하여오류가심각한결과를초래할수있는분야에서자사의기술을상용화하는것을목표로하고있습니다.현재이회사는Aristotle에대한무료API액세스를제공하고있으며,연구자와수학자들이이도구를사용하여복잡한증명을검증하고발견을가속화하고있습니다.Achim은새로운자금의상당부분이점점더발전된모델을훈련하는데필요한컴퓨팅인프라를지원하는데사용될것이라고밝혔습니다.​형식검증은이미의료기기및항공시스템과같은고위험애플리케이션에서표준으로자리잡고있으며,Harmonic의접근방식은신뢰성우려로인해주저해온위험회피분야에서AI도입을촉진할수있습니다.
495 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입