AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 2025.11.26 15:53
555 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,366 / 32 페이지
Google과 MIT가 2025년 12월 9일 발표한 연구는 더 많은 AI 에이전트가 성능을 향상시킨다는 가정에 이의를 제기하며, OpenAI의 GPT, Google의 Gemini, Anthropic의 Claude 모델을 사용한 180개의 실험에서 멀티 에이전트 시스템이 81% 향상부터 70% 감소까지 다양한 결과를 생성했음을 발견했습니다.이 연구는 45%의 정확도 임계값을 확인했습니다: 단일 에이전트가 이 수준에 도달하면, 더 많은 에이전트를 추가하는 것은 일반적으로 수익 체감 또는 부정적 결과를 초래하며, 독립적인 멀티 에이전트 시스템은 단일 에이전트보다 17.2배 빠르게 오류를 증폭시키고 단일 에이전트의 1,000 토큰당 67개 작업에 비해 21개 작업만 완료했습니다.병렬화 가능한 금융 분석 작업은 중앙 집중식 멀티 에이전트 조정으로 80.9% 개선을 보였으며, 순차적 Minecraft 계획 작업은 조정 오버헤드와 컨텍스트 단편화가 잠재적 이득을 초과하면서 39%에서 70%의 성능 저하를 겪었습니다.
428 조회
0 추천
2025.12.14 등록
구글 [GOOG -1.00%]의 제미나이3 출시 이후 국내 AI 챗봇 시장이 급변하며, 제미나이의 주간 신규 설치 건수가 첫째주 5만967건에서 둘째주 11만1115건으로 두 배 이상 급증한 반면 챗GPT는 3주 연속 신규 설치 감소세를 보였다.11월 17일 제미나이3 출시를 기점으로 제미나이의 주간 활성 이용자는 1만6196명에서 2만2928명으로 급증했으며, 챗GPT는 여전히 875만명 수준의 압도적 규모를 유지하고 있으나 성장 둔화 조짐을 보이고 있다.전문가들은 현재의 ‘1강 다약’ 구도가 ‘2강 다약’ 체제로 변화할 가능성이 있다고 전망하며, AI 검색 모델 퍼플렉시티는 같은 기간 이용자가 45만5659명에서 43만6480명으로 감소하는 등 뚜렷한 하락세를 나타냈다.
426 조회
0 추천
2025.12.14 등록
노코드 인공지능 플랫폼 시장은 MarketsandMarkets™가 12월 12일 발표한 시장 분석에 따르면 2024년 49억 달러에서 2029년 247억 달러로 급증하며 폭발적인 성장세를 보일 것으로 전망됩니다. 이 예측은 연평균 성장률 38.2%를 나타내며, 혁신의 기술적 장벽을 제거하는 접근 가능한 AI 솔루션에 대한 수요 증가가 성장을 견인하고 있습니다.​이러한 플랫폼은 컴퓨터 비전, 자연어 처리, 딥러닝, 예측 분석을 포함한 첨단 기술을 민주화하고 있으며, 프로그래밍 전문 지식이 없는 사용자도 직관적인 드래그 앤 드롭 인터페이스와 시각적 워크플로를 통해 AI 애플리케이션을 구축할 수 있도록 지원합니다. 이러한 접근성은 의료, 금융, 소매, 제조업 등 다양한 분야의 기업들이 AI 기반 솔루션을 구현하는 방식을 변화시키고 있습니다.시민 개발자 역량 강화노코드 AI 플랫폼은 비기술 전문가인 "시민 개발자"가 이제 독립적으로 정교한 애플리케이션을 만들 수 있도록 지원함으로써 개발 환경을 재편하고 있습니다. Forrester는 2025년까지 시민 개발자가 생성형 AI 기반 자동화 애플리케이션의 30%를 제공할 것으로 예측합니다. 이 기술은 텍스트, 이미지, 비디오, 오디오 및 멀티모달 입력을 포함한 여러 데이터 모달리티를 처리하여 감정 분석 및 이미지 인식과 같은 복잡한 작업을 단순화합니다.​주요 기술 기업들이 이 분야에서 적극적으로 경쟁하고 있습니다. IBM, Microsoft, Google, Amazon Web Services, 그리고 Salesforce가 C3 AI, H2O.ai, DataRobot, Dataiku, Qlik을 포함한 전문 벤더들과 함께 시장을 주도하고 있습니다. 2025년 1월, IBM은 노코드 플랫폼에 통합된 향상된 AI 기능을 발표했으며, Microsoft는 개선된 AI 통합으로 Power Platform을 확장했습니다.애플리케이션이 도입을 이끈다챗봇과 가상 비서는 AI를 활용하여 고객 상호작용을 혁신하면서 2024년에 가장 큰 시장 점유율을 차지할 것으로 예상됩니다. 다른 주요 응용 분야로는 워크플로우 자동화, 예측 리드 스코어링, 시각 인식 등이 있습니다. 은행, 금융 서비스 및 보험 부문은 특히 빠른 성장을 경험하고 있으며, 기관들은 광범위한 IT 개입 없이 대출 처리, 사기 탐지 및 위험 평가를 위해 노코드 AI를 사용하고 있습니다.​신흥 플랫폼들은 시장의 진화를 보여줍니다. KuaFuAI의 CodeFlying은 50만 명 이상의 크리에이터와 자연어 프롬프트로부터 관리 백엔드를 포함한 풀스택 애플리케이션을 자동으로 생성하는 모바일 우선 AI 앱 빌더를 통해 생성된 100만 개의 앱을 보고하고 있습니다. 이 플랫폼은 160억 줄의 AI 코드를 생성했습니다.​​시장 조사 기업 Grand View Research는 노코드 AI 플랫폼 시장이 2024년에 42억 8천만 달러에 달했으며 연평균 성장률(CAGR) 30.2%로 2033년까지 441억 5천만 달러로 성장할 것으로 예측하고 있습니다. 한편 다른 분석가들은 시장의 역동적인 특성을 반영하여 다양한 궤적을 예측하고 있습니다.
405 조회
0 추천
2025.12.13 등록
전설적인 게임 디렉터 히데오 코지마는 게임 개발에서 인공지능에 대한 자신의 입장을 명확히 했으며, 시각적 콘텐츠 생성보다는 적응형 제어 시스템에 AI를 사용하는 것에 관심이 있다고 밝혔다. 목요일 CNN과의 인터뷰에서 메탈 기어 솔리드와 데스 스트랜딩의 크리에이터는 자동화된 콘텐츠 생성보다는 지능형 시스템을 통해 더 역동적인 게임플레이 경험을 만드는 데 중점을 두고 있다고 강조했다.​"AI가 시각 자료를 생성하도록 하는 것보다, 저는 제어 시스템 내에서 AI를 사용하는 것에 더 흥미를 느낍니다"라고 코지마는 CNN에 말했다. 그는 100명의 플레이어가 게임에 참여하면, 각자가 캐릭터를 조작하고 환경을 탐색하는 방식에서 고유한 습관과 성향을 보인다고 설명했다. "AI를 활용하여 이러한 차이를 조정함으로써 게임플레이가 더 깊이 있는 수준에 도달할 수 있습니다"라고 그는 말했다.​더 똑똑한 적, 더 깊이 있는 게임플레이코지마의 비전은 AI를 사용하여 논플레이어 캐릭터의 행동을 더 현실적이고 반응적으로 만드는 것에 중점을 두고 있습니다. "대부분의 게임에서 적들은 실제 인간처럼 행동하지 않습니다"라고 그는 언급했습니다. "하지만 AI를 통해 적의 행동은 플레이어의 경험, 행동, 패턴에 따라 적응할 수 있습니다. 이러한 역동적인 반응성은 훨씬 더 풍부한 게임플레이를 가능하게 할 수 있습니다."​이러한 발언은 AI 도입을 둘러싼 게임 업계의 지속적인 긴장 속에서 나왔습니다. 비디오 게임 배우들은 자신들의 목소리와 초상권에 대한 무단 AI 복제에 대한 보호 조치를 확보한 후 2025년 7월 11개월간의 파업을 마무리했습니다. SAG-AFTRA 회원의 95%가 비준한 이 합의는 AI 디지털 복제본에 대한 동의 및 공개 요구 사항을 확립했습니다.기술에 대한 일관된 입장고지마의 입장은 이전 발언들과 일관된 상태로 남아 있다. 2025년 10월, 그는 AI를 효율성을 높이고 개발 비용과 시간을 줄이기 위해 “지루한 작업”을 처리해 줄 수 있는 “친구”라고 표현하면서도, 자신은 계속해서 제작의 “창의적인 부분을 주도할 것”이라고 강조했다. 그는 AI를 “그냥 사용하는 것이 아니라 함께 만들어 간다”는 점을 강조했다.​게임 개발에서 AI의 역할을 둘러싼 논쟁은 2025년 내내 격화되어 왔다. 에픽게임즈 CEO 팀 스위니는 11월, AI가 “앞으로 거의 모든 제작 과정에 관여하게 될 것”이라면서, 디지털 스토어에서의 AI 사용 공개 라벨이 과연 의미가 있는지에 대해 의문을 제기했다. 한편, 12월에는 커뮤니티의 반발 끝에 《Postal: Bullet Paradise》가 취소되는 등, 미공개 AI 사용 의혹을 둘러싼 굵직한 논란들이 잇따라 터져 나왔다.​​고지마의 접근 방식은 인간의 창의성이 AI에 의해 대체될 것이라는 우려와 대비된다. 2001년에 발매된 그의 작품 《메탈 기어 솔리드 2》는 AI의 통제, 정보 조작, 알고리즘적 영향력이라는 주제를 선견지명 있게 다뤘는데, 이는 현대 사회에서 기술이 미치는 영향에 대한 논의에서 점점 더 중요한 화두가 되고 있다.​​고지마의 최신작인 《데스 스트랜딩 2: 온 더 비치》는 2025년 6월 플레이스테이션 5 독점으로 발매되었다.
403 조회
0 추천
2025.12.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입