AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 2025.11.26 15:53
501 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,366 / 52 페이지
한국과학기술원(KAIST)의연구진은인공지능시스템내부를들여다보고개념이어떻게형성되는지시각화할수있는새로운방법을개발했으며,이는전문가들이AI가어떻게사고하는지를이해하는데있어중요한진전이라고평가하고있습니다.​‘세분화개념회로(GranularConceptCircuits)’로불리는이기술은딥러닝모델의내부의사결정과정을설명하는오랜과제를해결했습니다.딥러닝모델은전통적으로이해하기어려운‘블랙박스’로작동해왔기때문입니다.KAIST는10월호놀룰루에서열린국제컴퓨터비전학회(InternationalConferenceonComputerVision)에서연구팀이이결과를발표한데이어,11월26일이번혁신을공식발표했습니다.​뉴런에서회로로의전환KAIST김재철AI대학원최재식교수연구팀은기존의개별뉴런에서벗어나여러뉴런이협력하여개념을인식하는회로(신경망)를중심으로접근방법을확장하여해당방식을개발했다.기존방법들은"특정뉴런이특정개념을감지한다"고가정했지만,연구팀은딥러닝모델이사실상여러뉴런이협동하는구조적회로를통해개념을형성한다는사실을발견했다.​시스템은뉴런이특정특징에얼마나강하게반응하는지를측정하는'뉴런감도'와,다음개념으로특징이얼마나강하게전달되는지를보여주는'의미흐름'이라는두가지핵심지표를계산하여이러한회로를자동으로추적한다.이측정을바탕으로색깔,질감등기초적인특징들이점진적으로더높은수준의개념으로조합되는과정을시각화할수있다.​연구진은이러한발견을검증하기위해특정회로를비활성화하는실험을진행했다.특정개념을담당하는회로가꺼질때AI의예측결과가변하는현상이관찰되었고,이를통해해당회로가실제로예상했던인식기능을수행함을직접적으로입증했다.​AI투명성의실용적적용Ph.D.후보자인권다희와이세현이공동제1저자로참여한이번연구는AI의사결정의투명성강화,오분류원인분석,편향탐지,모델디버깅및아키텍처개선등설명가능한AI영역전반에걸친응용가능성을시사한다.연구진은"이기술은AI가내부적으로형성하는개념구조를사람이이해할수있는방식으로보여준다"고밝히며,이번연구가"AI가어떻게생각하는지연구하는과학적출발점역할을한다"고덧붙였다.​최교수는이번접근법이기존방식과는다르다고강조했다."복잡한모델을설명을위해단순화한기존접근법과달리,본연구는미세한회로수준에서모델내부를정밀하게해석하는최초의접근법이다"고말했다.
486 조회
0 추천
2025.11.27 등록
이번주미국주요소매업체들은인공지능쇼핑어시스턴트를도입하며,휴일쇼핑수요를선점하기위한공동의노력을펼쳤습니다.이는모바일쇼핑도입이후전자상거래분야에서가장중요한변화로평가받고있습니다.아마존의AI어시스턴트루퍼스(Rufus)는연간100억달러이상의추가매출을창출할것으로예상되며,앤디재시(AndyJassy)CEO는지난달이도구를2025년까지2억5천만명의활성고객이사용할것이라고발표했습니다.루퍼스를사용하는고객은일반쇼핑객에비해구매를완료할확률이60%더높은것으로나타났습니다.​타겟은11월25일ChatGPT연동기능을출시,고객들이OpenAI의챗봇내에서제품을탐색하고,여러상품으로장바구니를구성하며,바로구매까지완료할수있도록했습니다.타겟의최고정보및제품책임자인프랫베마나(PratVemana)는이번주직접해당기능을테스트해앱을통해수면복을구매했다고밝혔습니다.베마나는“ChatGPT,퍼플렉서티,제미니등어떤플랫폼이든,우리는고객이가진질문에답하는데함께하고싶다”고말했습니다.​월마트는자체AI쇼핑어시스턴트스파키(Sparky)내에서광고를테스트해왔다고이사안에정통한관계자들이전했습니다.월마트는9월부터11월초까지일부광고주와함께“스폰서드프롬프트(SponsoredPrompt)”형식의광고실험을진행했습니다.관련소식이후월마트주가는2.07%상승했습니다.​AI쇼핑도구출시붐세개의주요AI플랫폼이며칠간격으로경쟁적인쇼핑기능을공개했습니다.OpenAI는11월24일,명확한질문을하고맞춤형구매자가이드를생성하는GPT-5mini의특화버전으로구동되는ShoppingResearch도구를출시했습니다.Perplexity는11월25일PayPal통합이적용된쇼핑어시스턴트를선보였으며,5,000개가넘는가맹점에대한즉시결제를제공합니다.Google는11월중순AIMode와Gemini앱을통해자동가격추적과가까운매장에전화를걸어재고를확인할수있는기능등에이전트기반의쇼핑기능을도입했습니다.​소매업체들,검색전략조정이러한변화는소매업체들이디지털존재감을재고하도록만들고있다."과거월3~4개의새로운블로그게시물을발행하던브랜드들이이제는100개또는200개를목표로하고있습니다"라고생성형엔진플랫폼Eune.ai의CEO인브라이언스템펙(BrianStempeck)은말했다.일부소매업체들은소비자에게는보이지않는웹사이트를구축하고있으며,이는AI스크래퍼가제품정보를추출할수있도록독점적으로설계되었다.​현재ChatGPT로부터주요소매업체로의트래픽은10월센서타워(SensorTower)데이터에따르면전체사이트방문의1%미만을유지하고있다.그러나세일즈포스(Salesforce)는사이버위크(CyberWeek)기간동안AI가전세계매출730억달러에영향을미칠것으로예상하며,이는전체매출의22%에해당한다.​
467 조회
0 추천
2025.11.27 등록
매사추세츠공과대학교(MassachusettsInstituteofTechnology)와허깅페이스(HuggingFace)의공동연구에따르면,중국인공지능(AI)모델이글로벌다운로드에서처음으로미국개발자를앞질러,시장점유율17%를차지한반면미국창작자는15.8%에머문것으로나타났습니다.이변화는AI의미래를형성하기위한경쟁에서중대한순간을의미하며,딥시크(DeepSeek)와알리바바그룹홀딩스(AliababaGroupHoldingLimited)의Qwen모델이주도하고있습니다.이모델들은자주업데이트되며비용효율적인대안을제공함으로써점차인기를얻고있습니다.​보안취약점경고발령중국모델채택의급증은심각한보안우려를불러일으켰습니다.사이버보안기업CrowdStrike가11월20일발표한연구에따르면,DeepSeek의AI모델은티베트,위구르족또는베이징이문제시하는기타주제에대한정치적으로민감한참조가포함된프롬프트를받을때훨씬더많은안전하지않은코드를생성하는것으로나타났습니다.DeepSeek은중립적인경우19%의취약한코드를생성했지만,티베트의산업제어시스템용코드를작성하도록요청받았을때그수치는27.2%로급증했습니다.이러한결함은모델의추론프로세스가완료된후에나타나는것으로보이며,이는불량한훈련데이터가아닌내재된편향을시사합니다.​연구들은또한중국공산당과의명확한이념적정렬을문서화했으며,모델들이대만이나천안문사건과같은민감한주제에대한콘텐츠생성을거부하는것으로나타났습니다.신미국안보센터(CenterforNewAmericanSecurity)의연구원JanetEgan은"중국이오픈모델분야에서상당한진전을이루고있다는사실은미국에경종을울려야합니다"라고말했습니다.​전략적분기가경쟁을촉진하다중국의오픈소스전략은미국주요기술기업들의접근방식과뚜렷한대조를이룹니다.OpenAI,Google,그리고Anthropic은가장진보된모델에대해엄격한통제를유지하며,폐쇄형시스템을통한인공일반지능개발과구독을통한수익창출에집중해왔습니다.Meta는이전에Llama모델로오픈소스AI의선두주자였으나,"초지능"을추구하면서폐쇄형모델개발로방향을전환했습니다.​한편,중국기업들은부분적으로Nvidia고급칩에대한미국의수출규제로인해오픈소스릴리스를추진하게되었습니다.이로인해중국개발자들은더혁신적인접근방식을채택하게되었으며,미국연구소들의전형적인반년또는연간주기와비교하여매주또는격주로모델변형을릴리스하고있습니다.​AllenInstituteforAI는11월에Olmo3를미국의최신오픈소스AI기여작으로릴리스했지만,이는이분야에서몇안되는주요미국노력중하나를나타냅니다.벤처캐피털기업AndreessenHorowitz에투자제안을하는AI스타트업의최대80%가현재중국오픈소스모델을사용하고있다고파트너MartinCasado가밝혔으며,이는이분야에서중국의증가하는우위가미치는실질적인영향을강조합니다.
474 조회
0 추천
2025.11.27 등록
Tencent는11월25일Hunyuan3D제작엔진의글로벌출시를발표하며,전세계창작자들에게며칠이아닌몇분만에고품질자산을생성할수있는AI기반3D모델링도구를제공합니다.이중국기술대기업의플랫폼은사용자들이텍스트설명,이미지또는스케치로부터3D모델을생성할수있게하며,일반적으로수주가걸리던기존제작일정을몇분으로대폭단축시킵니다.​Hunyuan3DModelAPI는이제TencentCloud를통해전세계기업들에게제공되며,게임개발,전자상거래,영화제작,광고및3D프린팅등의분야에적용됩니다.개인사용자는Hunyuan3DGlobal플랫폼에서매일20회의무료생성을받으며,TencentCloud를통해API에접근하는기업고객은200개의무료크레딧을받습니다.​기업도입및시장상황중국본토의150개이상의기업이이미TencentCloud를통해Hunyuan3D모델을통합했으며,여기에는UnityChina,소비자용3D프린팅회사인BambuLab,그리고중국최대AI콘텐츠제작플랫폼인Liblib이포함됩니다.이번출시는전세계3D모델링시장이2025년까지64억달러에달할것으로예상되는가운데이루어졌으며,AI기반도구가게임,전자상거래,AR/VR산업전반에서필수적인요소가되고있습니다.​Hunyuan3D시리즈는Tencent가2024년11월여러오픈소스3D모델을출시한이후인정받아왔으며,HuggingFace에서300만건이상의커뮤니티다운로드를달성하고세계에서가장인기있는오픈소스3D모델중하나로자리매김했습니다.최신버전인Hunyuan3D3.0은고품질자산제작에중점을두고있으며,특화된Hunyuan3DWorld모델은게임및가상현실을위한대규모인터랙티브환경구축을지원합니다.​기술적역량및통합이플랫폼은전문가급편집기능을지원하며OBJ및GLB를포함한주요3D형식으로출력되고,Unity,UnrealEngine및Blender와같은전문소프트웨어와원활하게통합됩니다.Tencent에따르면,멀티모달엔진은기하학과텍스처를위한분리된생성아키텍처를사용하며,2단계프로세스에서전용대규모모델을사용하여더욱정교한기하학적구조와더풍부한텍스처색상을생성합니다.
478 조회
0 추천
2025.11.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입