Loading...

ChatGPT

OpenAI GPT-realtime 모델 정식 출시,비용 및 사용법

페이지 정보

작성자 skyL
작성일 09.02 11:48
9 조회
1 댓글
0 추천
0 비추천

본문

6a5e3138a95de91422b0d33db27a1c2e8dU0.png

 

OpenAI가 8월 28일에 GPT-realtime 모델과 함께 Realtime API를 정식 출시했습니다. 작년 10월부터 베타로 운영하던 실시간 음성 API가 이제 프로덕션 환경에서 사용할 수 있게 되었습니다.

기존 음성 AI는 음성을 텍스트로 변환하고 다시 음성으로 바꾸는 과정을 거쳤는데, GPT-realtime은 음성에서 음성으로 직접 처리합니다. 덕분에 응답 속도가 빨라지고 대화가 더 자연스러워졌습니다. 또한 "빠르고 전문적으로 말해달라"나 "공감하며 대답해달라" 같은 세세한 지시도 잘 따르고, 문장 중간에 언어를 바꾸거나 웃음소리도 인식할 수 있습니다.

새로 추가된 기능들도 실용적입니다. 이미지를 함께 보내서 "이 화면에서 뭐가 보이는지 설명해달라"고 물어볼 수 있고, MCP 서버를 연결해서 외부 도구들을 사용할 수 있습니다. 전화 시스템과 연결하는 SIP 지원도 추가되어서 기존 콜센터나 전화 서비스에 바로 적용 가능합니다.

실제 사용 방법은 기존 OpenAI API와 비슷합니다. OpenAI 플랫폼에서 API 키를 발급받고 Realtime API 엔드포인트에 WebSocket이나 WebRTC로 연결하면 됩니다. 음성 데이터를 실시간으로 주고받을 수 있고, 필요하면 이미지나 텍스트도 함께 보낼 수 있습니다. 가격은 이전 버전보다 20% 저렴해져서 오디오 입력 토큰당 32달러, 출력 토큰당 64달러입니다.

개발자들이 가장 많이 활용하는 분야는 고객 상담, 음성 비서, 교육용 대화 시스템입니다. 특히 전화번호나 차량번호 같은 복잡한 정보도 여러 언어에서 정확히 인식하고, 함수 호출 기능도 개선되어서 실무에서 바로 쓸 수 있는 수준입니다. 지금 당장 OpenAI 문서를 참고해서 테스트해볼 수 있습니다.

댓글 1

침묵묵님의 댓글

작성자 침묵묵
작성일 09.02 15:57
사무실에서 조용히 해야되는뎅
전체 40 / 1 페이지
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입