Loading...

AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 2025.11.26 15:53
548 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,366 / 34 페이지
Google는 The Guardian, The Washington Post, Der Spiegel을 포함한 주요 출판사들과 상업 파일럿 프로그램을 시작하여 Google News 페이지에서 AI 기반 기사 개요 및 오디오 브리핑을 테스트하고 있으며, 참여 매체들은 잠재적인 트래픽 손실을 상쇄하기 위한 직접 지급금을 받게 됩니다.이번 발표는 유럽 위원회가 Google이 적절한 보상 없이 AI 기능을 위해 출판사 콘텐츠를 사용하는지 여부에 대한 공식 독점금지 조사를 개시한 이후 나온 것으로, AI 요약이 출판사 추천 트래픽을 최대 34.5%까지 감소시킬 수 있다는 연구 결과가 나온 가운데 이루어졌습니다.Google은 영어 사용자를 위해 Preferred Sources 기능을 전 세계적으로 확대하고 유료 뉴스 콘텐츠를 우선순위에 두는 구독 강조 기능을 도입하고 있으며, 선호 소스를 지정한 사용자는 평균적으로 해당 사이트를 두 배 더 자주 클릭하는 것으로 나타났습니다.
413 조회
0 추천
2025.12.11 등록
Adobe는 수요일에 Photoshop, Adobe Express, Acrobat을 ChatGPT에 통합하여 사용자들이 챗봇 인터페이스를 벗어나지 않고도 대화형 명령어를 통해 무료로 이미지를 편집하고, 디자인을 생성하며, PDF를 수정할 수 있도록 했다.이번 통합은 매주 8억 명이 넘는 ChatGPT 사용자들에게 Adobe의 창작 도구에 대한 접근을 제공하지만, 데스크톱 버전에 비해 제한된 기능을 제공하며, 이는 챗봇을 제3자 디지털 서비스의 관문으로 전환하려는 OpenAI의 전략의 일환이다.이 파트너십은 5월에 네이티브 이미지 편집 기능을 출시한 Google의 Gemini AI에 맞서 두 회사를 위치시키는 동시에, Adobe에게는 ChatGPT의 방대한 사용자 기반에 대한 노출을 제공하고 회사가 “에이전틱 대화형 인터페이스”라고 부르는 것을 가능하게 한다.
420 조회
0 추천
2025.12.11 등록
에너지부는 인공지능 기반 연구 자동화를 통해 10년 내에 미국의 과학 생산성을 두 배로 늘리는 것을 목표로 하는 트럼프 대통령의 AI 이니셔티브인 제네시스 미션에 3억 2천만 달러 이상의 투자를 발표했습니다.DOE 차관 다리오 길은 의원들에게 이 자금이 미국 과학 클라우드(American Science Cloud)와 혁신적 모델 컨소시엄(Transformational Model Consortia)을 지원할 것이며, 전담 팀들이 이미 슈퍼컴퓨터 시간을 자동으로 할당하고, 결과를 분석하며, 실험을 시작하는 AI 워크플로우를 개발하고 있다고 말했습니다.하원 청문회에서는 보안 문제가 최우선 과제로 다뤄졌으며, 의원들은 AI 능력의 위험성과 적대국들의 모델 역공학 가능성에 대해 질문했고, 길은 속도가 성공에 매우 중요하다고 강조하며 “우리는 생명이 달린 것처럼 행동해야 합니다”라고 말했습니다.
431 조회
0 추천
2025.12.11 등록
Microsoft는 2025년 1월부터 9월까지 3,750만 건의 익명화된 대화를 분석한 최초의 포괄적인 Copilot 사용 연구를 발표했으며, 사용자들이 단순히 생산성 도움만이 아닌 건강, 관계, 인생 결정에 대한 개인적인 지침을 점점 더 많이 찾고 있다는 사실을 밝혔습니다.연구는 데스크톱과 모바일 사용자 간의 뚜렷한 차이를 발견했는데, 데스크톱 사용자는 Copilot을 생산성 도구로 취급한 반면 모바일 사용자는 “대화형 동반자”로 활용했으며, 건강 관련 주제가 하루 중 모든 시간대의 대화를 지배했습니다.Microsoft의 책임 있는 AI 책임자는 사용자들이 그러한 목적으로 설계되지 않은 도구에서 정서적 지원을 구함에 따라 안전 문제를 인정했으며, OpenAI, Google, Meta, Anthropic과 장기 챗봇 사용자를 두고 경쟁하는 가운데 “필요한 통제와 보호 장치”의 필요성을 강조했습니다.
426 조회
0 추천
2025.12.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입