Loading...

AI 뉴스

ChatGPT가 메인 인터페이스에 음성 모드를 통합

페이지 정보

작성자 xtalfi
작성일 2025.11.26 15:53
512 조회
0 추천
0 비추천

본문

ChatGPT-Voice-mode.jpg

OpenAI는 화요일에 ChatGPT에서 별도의 음성 모드가 필요 없어졌다고 발표했으며, 사용자가 이제 지도 및 이미지와 같은 시각적 콘텐츠와 함께 실시간 대화 내용을 볼 수 있는 메인 채팅 인터페이스에 음성 대화를 직접 통합했습니다.​

모바일 및 웹 플랫폼의 모든 사용자에게 배포되는 이번 업데이트는 이전에 음성 상호작용이 애니메이션 파란색 구체가 표시되는 격리된 화면에서 이루어지던 오랜 제한 사항을 해결합니다. 사용자는 응답을 보지 못한 채 듣기만 할 수 있었으며, ChatGPT가 말한 내용을 텍스트로 검토하려면 음성 모드를 종료해야 했습니다.​


원활한 멀티모달 경험

새로운 통합 기능으로 사용자들은 ChatGPT의 텍스트 입력란 옆에 있는 파형 아이콘을 탭하여 음성 대화를 시작할 수 있으며, 말하는 동안 응답이 나타나는 것을 볼 수 있습니다. OpenAI의 시연 영상에 따르면, 시스템은 대화 내용의 텍스트를 표시하는 동시에 관련 시각 자료를 보여줄 수 있습니다. 회사가 공유한 한 예시에서 ChatGPT는 음성 대화 중에 인기 있는 제과점들의 지도와 샌프란시스코 타르틴 베이커리의 페이스트리 사진들을 표시했습니다.​

OpenAI는 X에 올린 공지에서 "대화하고, 답변이 나타나는 것을 보고, 이전 메시지를 검토하며, 이미지나 지도 같은 시각 자료를 실시간으로 볼 수 있습니다"라고 밝혔습니다. 사용자들은 텍스트 입력으로 다시 전환하기 전에 음성 대화를 중지하려면 여전히 "종료"를 탭해야 합니다.​


사용자 선택 보존

통합 음성 모드는 앱 업데이트 시 기본 경험이 되지만, OpenAI는 오디오 전용 경험을 선호하는 사용자를 위해 기존 인터페이스를 보존했습니다. 이전 형식을 원하는 사용자는 설정의 음성 모드에서 "분리 모드"를 활성화할 수 있습니다.​

이 변경 사항은 사용자가 대화 맥락을 잃지 않고 음성과 텍스트 사이를 보다 유동적으로 이동할 수 있도록 하는 멀티모달 AI 상호작용을 향한 OpenAI의 지속적인 노력을 나타냅니다. Google은 음성 대화 중 오버레이로 실시간 비디오의 특정 부분을 강조 표시할 수 있는 Gemini Live를 통해 유사한 영역을 탐구했습니다.

댓글 0
전체 1,366 / 66 페이지
중국의 선도적인 메모리 칩 제조업체인 ChangXin Memory Technologies(CXMT)는 일요일 베이징에서 열린 중국 국제 반도체 박람회에서 새로운 세대의 DDR5 DRAM 제품을 공개하며, 고성능 AI 메모리 시장에서 삼성전자, SK하이닉스, 마이크론 테크놀로지에 직접적인 도전장을 내밀었다.새로운 DDR5 제품은 초당 최대 8,000메가비트의 속도와 최대 24기가비트의 다이 용량을 달성하여, 글로벌 경쟁업체들의 고급 제품 사양과 동등한 수준을 보인다. CXMT의 제품 라인업은 데스크톱용 UDIMM, 노트북용 SODIMM, 데이터 센터용 MRDIMM 등 7가지 주요 모듈 유형을 포함하며, AI 컴퓨팅 서버 및 고성능 애플리케이션을 목표로 한다.공급 부족 속 시장 타이밍TrendForce에 따르면 9월 초 이후 글로벌 DDR5 가격이 307% 급등한 가운데 이번 발표가 나왔다. 삼성은 32기가바이트 DDR5 모듈의 계약 가격을 9월 149달러에서 11월 239달러로 인상했는데, 이는 주요 생산업체들이 AI 애플리케이션용 고대역폭 메모리로 생산능력을 전환하면서 공급이 부족해진 것을 반영한다. 메모리 부족으로 인해 기존 소비자 전자제품 제조업체들은 AI 데이터센터 운영업체들이 프리미엄 가격을 지불하는 가운데 제한된 재고를 확보하기 위해 경쟁해야 하는 상황이다.CXMT는 또한 8,533Mbps에서 10,667Mbps에 이르는 속도의 LPDDR5X 모바일 메모리 시리즈를 선보였다. 이 회사는 5월에 8,533Mbps 및 9,600Mbps 제품의 양산을 시작했으며, 가장 빠른 10,667Mbps 버전은 여전히 고객 샘플링 단계에 있다. 이러한 제품들은 LPDDR5 대비 66%의 속도 향상을 나타내면서 전력 소비는 30% 감소시켰다.중국의 자급자족 추진이번 제품 출시는 미국의 첨단 칩 기술에 대한 수출 규제가 지속되는 가운데 반도체 자립을 달성하기 위한 중국의 강화된 노력을 보여줍니다. Counterpoint Research에 따르면, CXMT의 글로벌 DRAM 시장 점유율은 2025년 7%에서 2027년까지 10%로 증가할 것으로 예상됩니다. 현재 SK하이닉스가 38.7%의 매출 점유율로 DRAM 시장을 선도하고 있으며, 삼성이 32.7%, 마이크론이 22%로 그 뒤를 따르고 있습니다.업계 분석가들은 2026년 글로벌 DRAM 생산량이 20% 이상 증가할 것으로 예상하며, 중국의 국가 지원 반도체 이니셔티브가 계속됨에 따라 CXMT가 예상을 초과할 가능성이 있습니다. 로이터는 CXMT가 빠르면 2026년 1분기에 상하이에서 기업공개를 준비하고 있으며, 최대 3,000억 위안(420억 달러)의 기업가치를 목표로 하고 있다고 보도했습니다.
568 조회
0 추천
2025.11.24 등록
정부가 중앙·지방정부 내부망에서 민간 AI 기술을 안전하게 활용할 수 있는 ‘범정부 AI 공통기반’ 서비스를 24일 공식 개시했다. 과학기술정보통신부와 행정안전부는 이날 정부서울청사에서 기념행사를 열고 서비스 시연과 향후 운영계획을 발표했다.그동안 국내외 민간 AI 서비스는 내부 행정 데이터 유출 위험 등 보안 우려로 인터넷망에서만 사용 가능했고, 정부 업무 전반에 활용하는 데 제약이 있었다. 민간을 중심으로 빠르게 발전하는 AI를 행정에서 적극 활용하지 못해 업무 효율성이 저하된다는 지적이 제기돼 왔다.삼성·네이버 AI 챗봇 내부망에 도입범정부 AI 공통기반은 민간의 다양한 AI 모델, 학습데이터, 그래픽처리장치(GPU) 등을 중앙·지방정부가 공동 활용할 수 있는 서비스다. 공통기반은 공개된 행정문서와 데이터를 AI 모델과 연계해 내부망에서도 활용 가능한 AI 챗서비스 2종을 제공한다. 삼성SDS와 네이버클라우드가 개발한 AI 챗봇 서비스가 부처 내부망에 제공되며, 이를 통해 중앙·지방정부는 중복 개발이나 투자 없이 내부 행정업무부터 공공서비스까지 다양한 AI 기술을 업무 전반에 적용할 수 있게 됐다.12월에는 복잡한 용어와 절차를 몰라도 필요한 서비스와 혜택을 찾아주는 ‘정부24+ 지능검색’ 서비스가 도입될 예정이다. 2026년에는 정부가 추진 중인 ‘독자 AI 파운데이션 모델 프로젝트’를 통해 선정되는 AI 모델도 범정부 AI 공통기반에서 활용할 수 있도록 추가 도입할 계획이다.지능형 업무관리 플랫폼 시범 운영정부는 범정부 AI 공통기반을 활용한 ‘지능형 업무관리 플랫폼’ 시범서비스도 개시한다. 과기정통부, 행안부, 식품의약품안전처를 대상으로 하는 이 플랫폼은 AI를 중심으로 메일, 메신저, 영상회의 등 소통·협업 도구를 유기적으로 연계해 단순·반복적인 업무를 생략하고 업무에 집중할 수 있는 환경을 제공한다. 범정부 AI 공통기반이 활용하는 공통 데이터뿐 아니라 개인·기관이 보유한 내부 행정 문서와 데이터까지 활용해 보다 정확하고 맥락 있는 AI 답변 생성이 가능하다.정부는 서비스 운영과 확산에 앞서 실제 사용자의 의견 수렴, AI 서비스 기능 검증 및 품질 개선을 위해 이달 말부터 2026년 2월 말까지 시범 운영을 진행한다. 시범 운영 이후 2026년 3월부터는 전체 중앙·지방정부가 서비스를 이용할 수 있도록 단계적으로 서비스 대상을 확대할 계획이다.배경훈 과기정통부 장관은 “공공부문에 AI를 적극 활용해 정책 결정을 고도화하고 과학화함으로써 최고의 성과를 낼 수 있기를 기대한다”며 “이번 서비스 개시를 계기로 AI 3대 강국 실현에도 한 걸음 더 나아갈 수 있도록 박차를 가하겠다”고 밝혔다. 윤호중 행안부 장관은 “민간의 최신 AI 기술을 공공부문에 적극 도입·활용해 국민에게 더 좋은 서비스를 제공하는 ‘AI 민주정부’로 도약하겠다”고 말했다.
610 조회
0 추천
2025.11.24 등록
Tesla는 금요일에 Full Self-Driving (Supervised) V14.2 출시를 시작했으며, CEO 일론 머스크가 차량을 “거의 감각이 있는 것처럼” 느끼게 만드는 단계라고 설명한 업데이트를 도입했습니다.회사의 AI4 하드웨어가 장착된 초기 차량들에 소프트웨어 버전 2025.38.9.5를 통해 배포된 이 업데이트는 더 높은 해상도 기능을 갖춘 업그레이드된 신경망 비전 인코더를 특징으로 합니다. 릴리스 노트에 따르면, 이 시스템은 이제 긴급 차량, 도로 위의 장애물, 그리고 인간의 제스처를 더 잘 처리하기 위해 향상된 기능을 활용합니다.향상된 기능 및 성능V14.2 릴리스에는 여러 가지 새로운 기능이 포함되어 있으며, 가장 주목할 만한 것은 운전자가 FSD가 주차할 위치를 선택할 수 있도록 하는 도착 옵션(Arrival Options)입니다—주차장, 도로변, 진입로, 주차 건물, 또는 길가에 주차할 수 있습니다. 이 업데이트는 또한 경찰차, 소방차, 구급차를 포함한 긴급 차량을 위해 길을 비키거나 양보하는 기능을 추가했습니다.Tesla는 내비게이션과 경로 안내를 비전 기반 신경망에 통합하여 차단된 도로와 우회로를 실시간으로 처리할 수 있게 했으며, 운전 스타일 선호도를 맞춤 설정할 수 있는 추가 속도 프로필을 도입했습니다. 이 시스템은 또한 비보호 회전, 차선 변경, 끼어들기, 스쿨버스 대응에서 개선된 처리 능력을 보여줍니다.초기 테스트 데이터는 상당한 성능 향상을 시사합니다. 11월 초 기준으로 FSD 버전 14는 중대한 개입 간 평균 1,454마일을 기록했으며, 이는 버전 13.2의 평균 443마일보다 3배 이상 높은 수치입니다.로보택시 확장 및 시장 맥락소프트웨어 업데이트는 Tesla가 로보택시 확장을 가속화하는 시점에 출시되었습니다. 이 회사는 11월 17일 애리조나주 교통부로부터 주 전역에서 차량 호출 서비스를 운영할 수 있는 승인을 받았으며, 이는 텍사스와 캘리포니아에 이어 세 번째 주입니다. Tesla는 네바다주 차량관리국(DMV)의 자체 인증 절차도 완료했지만, 네바다 교통 당국으로부터 상업적 승인은 여전히 필요한 상태입니다.월요일, Stifel 애널리스트 Stephen Gengaro는 FSD와 로보택시 서비스의 발전을 언급하며 Tesla의 목표 주가를 $483에서 $508로 상향 조정했습니다. Gengaro는 경영진이 연말까지 약 8개에서 10개의 대도시 지역으로 확장할 계획이라고 언급했습니다.그러나 Tesla는 미국 내 여러 도시에서 안전 운전자 없이 완전 자율주행 레벨 4 차량을 운영하는 Waymo와의 경쟁 심화에 직면해 있습니다. Waymo는 11월 20일 미니애폴리스, 탬파, 뉴올리언스로의 확장을 발표했으며, 현재 1,500대의 차량 보유에 2026년까지 2,000대를 추가할 계획입니다.Musk는 이전에 V14.2가 광범위한 출시의 시작을 알릴 것이며, V14.3에 이르면 차량이 “마치 지각이 있는 것처럼” 느껴질 것이라고 밝혔습니다.
581 조회
0 추천
2025.11.24 등록
Google은 BleepingComputer에 따르면, 첫 해 동안 광고 없이 운영했던 AI Mode 답변 엔진에 스폰서 광고를 표시하기 시작했습니다.광고는 AI가 생성한 답변 하단에 “sponsored” 라벨과 함께 표시되며, 이는 사용자에게 더 매력적인 AI 경험을 제공하기 위해 광고를 피했던 Google의 이전 전략에서 전환된 것입니다.이러한 움직임은 Google이 ChatGPT와 같은 광고 없는 AI 검색 대안과의 경쟁에 직면하면서도, 2023년에 2,378억 6천만 달러의 수익을 창출한 지배적인 광고 사업을 보호하기 위한 것입니다.
609 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입