Loading...

AI 뉴스

오픈AI, 성격 제어 기능이 추가된 GPT-5.1 출시

페이지 정보

작성자 xtalfi
작성일 11.13 14:45
27 조회
0 추천
0 비추천

본문

5-1_Blog_OpenGraph_zslxku.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 GPT-5.1을 출시하며, ChatGPT를 더욱 대화적이고 지능적으로 만들고 사용자에게 성격에 대한 전례 없는 제어권을 제공하는 것을 목표로 하는 두 가지 업그레이드된 모델을 선보였습니다.​

11월 12일부터 유료 구독자들에게 배포되기 시작한 이번 업데이트는 GPT-5.1 Instant와 GPT-5.1 Thinking을 제공하며, 두 모델 모두 8월에 출시된 초기 GPT-5를 괴롭혔던 사용자 불만을 해결하기 위해 설계되었습니다. OpenAI는 GPT-5.1 Instant가 "기본적으로 더 따뜻하고 더 대화적"이라고 밝혔으며, 초기 테스터들은 이 모델이 "명확하고 유용함을 유지하면서도 재미있는 면으로 종종 사람들을 놀라게 한다"고 언급했습니다.​

이번 출시는 OpenAI의 GPT-5 출시가 광범위한 반발을 일으킨 지 3개월 만에 이루어졌습니다. 당시 사용자들은 모델의 "더 차가운" 어조와 GPT-4o와 같은 사랑받던 레거시 모델의 갑작스러운 제거를 비판했습니다. OpenAI CEO 샘 알트먼은 당시 GPT-4o를 중단한 것이 "실수였다"고 인정하며, 회사가 특정 모델에 대한 사용자들의 "감정적 애착"을 과소평가했다고 시인했습니다.​


적응적 추론과 더 나은 성능

GPT-5.1 Instant는 적응형 추론 기능을 도입하여 모델이 어려운 질문에 대해 "답변하기 전에 생각할지" 여부를 스스로 결정할 수 있도록 합니다. OpenAI에 따르면, 이로 인해 AIME 2025 및 Codeforces를 비롯한 수학 및 코딩 벤치마크에서 상당한 향상이 이루어졌습니다. 또한, 모델의 지시 사항 준수 능력도 향상되었습니다. OpenAI에서 제공한 예시에서, 정확히 여섯 단어로 답하라는 요청에 GPT-5.1은 정확히 따르지만 GPT-5는 동일한 테스트에서 실패했습니다.​

GPT-5.1의 사고 과정은 작업의 복잡성에 따라 처리 시간을 조정하며, 어려운 문제에는 더 많은 시간을 투자하고, 더 단순한 질문에는 더 빠르게 응답합니다. 이제 모델은 "전문 용어와 정의되지 않은 용어를 줄여" 더 명확한 설명을 제공하여 기술 업무에 더욱 접근하기 쉬워졌습니다.​


확장된 개인화 옵션

모델 업그레이드와 함께 OpenAI는 6가지 새로운 성격 프리셋을 도입했습니다: Default, Professional, Friendly, Candid, Quirky, Efficient가 기존의 Nerdy 및 Cynical 옵션에 추가되었습니다. OpenAI의 애플리케이션 CEO인 Fidji Simo는 "많은 사용자들이 GPT-5.1이 IQ와 EQ를 통합하는 데 뛰어나다는 것을 발견할 것으로 믿지만, 단일 기본 설정으로는 모든 사람의 선호도를 수용할 수 없습니다"라고 말했습니다.​

사용자는 응답 간결성, 따뜻함, 이모지 빈도를 포함한 세부 제어 기능도 조정할 수 있습니다. OpenAI는 ChatGPT가 대화 중에 톤 조정을 능동적으로 제안할 수 있는 기능을 테스트하고 있습니다.​

출시는 Pro, Plus, Go, Business 플랜의 유료 사용자부터 시작되며, 무료 사용자는 며칠 내에 액세스 권한을 얻게 됩니다. 두 모델 모두 이번 주 후반에 API를 통해 제공되며, GPT-5.1 Instant는 gpt-5.1-chat-latest로 액세스할 수 있습니다. 레거시 GPT-5 모델은 3개월 동안 계속 사용할 수 있으며, 이는 사전 경고 없이 모델을 폐기했던 OpenAI의 이전 접근 방식에서 벗어난 변화를 나타냅니다.

댓글 0
전체 1,021 / 26 페이지
(퍼플렉시티가 정리한 기사)Palantir CEO 알렉스 카프는 목요일 인공지능 투자에 대해 강력한 경고를 전달하며, Yahoo Finance의 Invest 이벤트 참석자들에게 많은 AI 프로젝트가 “막대한 비용을 정당화할 만큼 충분한 가치를 창출하지 못할 수 있다”고 말했다. 이러한 발언은 이벤트에서 인용된 Morgan Stanley 추정치에 따르면 거대 기술 기업들이 2025년 AI 인프라에 4,700억 달러를 지출할 것으로 예상되는 가운데 나왔다.Yahoo Finance 스튜디오에서 발언한 카프는 두 가지 서로 다른 AI 시장을 제시했다: 하나는 매출이나 이익률을 움직이지 못하는 기본 애플리케이션에 초점을 맞춘 시장이고, 다른 하나는 측정 가능한 전장 또는 비즈니스 결과를 제공할 수 있는 부문이다. “정보에 입각한 관찰자라면 AI 시장이 상당하긴 하지만, 대규모 언어 모델이나 그 배포에 대한 투자를 정당화할 만큼 충분한 가치를 창출하지 못할 수 있다고 주장할 수 있습니다”라고 그는 말했다. 방산 기술 CEO는 Palantir가 기업들이 “현재의 운영 구조를 유지하면서 가치를 실현할 수 있는” 결과 중심 부문에서 운영되고 있다고 강조했다.명망 있는 학위가 쓸모없게 되다이번 주에 역시 헤드라인을 장식한 Axios와의 별도 인터뷰에서 Karp는 일반적인 지식을 가진 엘리트 대학 졸업생들이 AI 시대에 “운명이 끝났다”고 선언했다. “만약 당신이 예일대에 갔을 법한 사람, 전통적으로 높은 IQ를 가졌지만 일반화된 지식을 가지고 있고 구체적이지 않다면, 당신은 망했습니다”라고 Karp는 Axios에 말했다. 그는 직업 훈련을 받은 고등학교 졸업생과 같이 특정 분야의 전문 지식을 가진 근로자들이 AI가 일반 지식을 상품화함에 따라 아이비리그 졸업생들보다 “훨씬 더 많은 돈을 벌 것”이라고 주장했다.이러한 발언은 4월에 시작된 Palantir의 Meritocracy Fellowship과 일치하는데, 이 프로그램은 대학 대신 최근 고등학교 졸업생 22명을 4개월 유급 프로그램에 채용했다. 이 프로그램은 아이비리그 수준의 시험 점수를 요구했으며 500명 이상의 지원자를 유치했고, 펠로우들은 현재 이번 달에 프로그램을 마무리하고 있다. 우수한 성과를 낸 사람들은 현재 약 4,390억 달러의 가치를 지닌 회사의 정규직 포지션 면접을 보게 될 것이다.시장 우려 심화이러한 경고는 Palantir의 주가가 2025년에 141% 급등한 가운데 나온 것이지만, 강력한 실적에도 불구하고 최근 실적 발표 이후 주가는 하락했습니다. Meta [ +0.14%], Microsoft, Amazon, Alphabet을 포함한 하이퍼스케일러들은 2026년에 6,200억 달러를 투자할 것으로 예상되며, 이는 AI 지출이 충분한 수익을 창출할 수 있을지에 대한 논쟁을 불러일으키고 있습니다. Michael Burry를 포함한 공매도 투자자들과 저명한 CEO들은 주식 시장이 버블 국면에 있을 수 있다고 경고했습니다.
21 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)Google은 목요일 AI 기반 연구 보조 도구인 NotebookLM의 업데이트를 발표하며 Deep Research 기능과 Microsoft [MSFT -1.54%] Word 문서 및 Google Sheets를 포함한 추가 파일 형식 지원을 도입했습니다.Deep Research 기능은 수백 개의 웹사이트를 탐색하고 몇 분 내에 출처가 명확한 상세한 보고서를 생성함으로써 복잡한 온라인 조사를 자동화합니다. 표준 검색 도구와 달리 Deep Research는 다단계 연구 계획을 수립하고 정보를 수집하면서 검색을 정제한 다음, 사용자가 노트북에 직접 추가할 수 있는 체계적인 보고서로 결과를 종합합니다.사용자는 두 가지 연구 모드 중 선택할 수 있습니다: 정보를 빠르게 스캔하는 빠른 검색을 위한 Fast Research와 사용자가 다른 작업을 계속하는 동안 백그라운드에서 실행되는 포괄적인 브리핑을 위한 Deep Research입니다. Google의 블로그 게시물에 따르면, 보고서는 시작에 불과하며 사용자는 보고서와 출처를 모두 노트북에 추가할 수 있고 Deep Research가 작동하는 동안 다른 출처를 계속 추가할 수 있습니다.확장된 파일 형식 호환성이번 업데이트는 Google Sheets 지원을 추가하여 사용자가 스프레드시트에서 요약을 요청하거나 통계를 분석할 수 있도록 합니다. NotebookLM은 이제 Microsoft Word 문서(.docx)를 허용하여 수동 파일 변환의 필요성을 제거합니다. 사용자는 또한 복사-붙여넣기를 통해 Google Drive 파일을 URL로 추가할 수 있으며, 쉼표로 구분된 여러 링크를 지원합니다. Google Drive에 저장된 PDF는 이제 다운로드 및 재업로드 없이 직접 추가할 수 있습니다.이미지는 향후 몇 주에 걸쳐 제공될 예정이며, 사용자가 손으로 쓴 메모나 문서의 사진을 업로드할 수 있게 됩니다.맥락과 경쟁NotebookLM은 2023년 말에 출시되어 2025년 내내 정기적인 업데이트를 받았습니다. 10월에 Google은 NotebookLM의 채팅 기능을 100만 토큰 컨텍스트 윈도우와 6배 더 긴 대화 메모리로 확장했습니다. 이 플랫폼은 또한 올해 초 비디오 개요를 도입했으며 5월에 Android 및 iOS용 모바일 앱을 출시했습니다.Deep Research 기능은 NotebookLM을 경쟁사의 유사한 도구들과 나란히 위치시키지만, Google은 연구가 백그라운드에서 실행되는 동안 사용자가 계속해서 소스를 추가할 수 있도록 함으로써 자사 제품을 차별화합니다. NotebookLM은 복잡한 다단계 질문에 대한 향상된 추론 기능을 제공하는 Gemini 2.5 Flash로 구동됩니다.Google에 따르면 모든 기능은 일주일 내에 사용자에게 제공될 예정입니다.
22 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)AI 코딩 어시스턴트 Cursor는 목요일 23억 달러 규모의 투자 유치에 성공하며, 이전 투자 라운드로부터 불과 5개월 만에 기업 가치가 3배 증가한 293억 달러를 기록했습니다. 샌프란시스코에 본사를 둔 이 스타트업은 공식 명칭 Anysphere Inc.로, 인공지능 기반 개발자 도구에 대한 투자자들의 엄청난 신뢰를 나타내며 AI 역사상 가장 큰 벤처 캐피탈 투자 라운드 중 하나를 유치했습니다.월스트리트 저널의 보도에 따르면, 이번 투자 라운드는 Accel과 Coatue가 공동 주도했으며, Nvidia와 Google이 전략적으로 참여했습니다. 기존 투자자인 Thrive Capital과 DST Global도 이번 라운드에 합류했습니다. 회사의 기업 가치는 약 25억 달러로 평가받았던 1월 이후 거의 12배 급증했습니다.전략적 투자자들이 시장 변화를 예고하다Nvidia와 Google이 투자자로 참여한 것은 AI 개발 도구의 전략적 중요성을 강조합니다. Nvidia는 Cursor의 기업 고객이자 칩 공급업체로서 역할을 하고 있으며, Google은 플랫폼을 구동하는 AI 모델을 제공합니다. CEO Michael Truell은 월스트리트 저널에 이들 기업을 “파트너십을 심화하기 위해” 초청했다고 밝혔습니다.이번 투자 라운드는 AI 코딩 시장의 경쟁이 심화되는 가운데 이루어졌습니다. Microsoft가 소유한 GitHub Copilot은 2025년 7월 2천만 명의 사용자를 돌파했으며, Fortune 100 기업의 90% 이상이 이 도구를 사용하고 있다고 보고했습니다. 한편, OpenAI와 Anthropic은 자체 AI 코딩 제품을 강화하고 있어, 개발자 도구 부문을 인공지능 분야에서 가장 경쟁이 치열한 전장 중 하나로 만들고 있습니다.독점 AI 모델에 베팅하기Cursor는 지난 10월 출시한 자체 AI 모델인 Composer 개발을 위해 자금을 투입할 계획이다. 현재 이 회사는 코딩 어시스턴트 구동을 위해 Google, OpenAI, Anthropic의 외부 모델에 의존하고 있지만, Composer는 이러한 공급업체로부터의 독립을 위한 시도를 의미한다.Cursor는 2025년 6월 기준 연간 반복 수익 5억 달러를 돌파했으며, 이는 4월의 3억 달러에서 증가한 수치이고, Fortune 500 기업 중 절반 이상이 사용하고 있다. 2022년 MIT 졸업생 4명—Michael Truell, Sualeh Asif, Arvid Lunnemark, Aman Sanger—이 설립한 이 회사는 개발자 도구 분야에서 가장 빠르게 성장하는 스타트업으로 부상했다. AI 코딩 도구 시장은 연평균 25.62%의 성장률로 2032년까지 373억 4천만 달러 규모에 달할 것으로 예상된다.
21 조회
0 추천
11.14 등록
(퍼플렉시티가 정리한 기사)Google DeepMind는 목요일에 SIMA 2를 발표했습니다. 이는 회사의 Gemini 언어 모델을 통합하여 3D 가상 환경을 탐색하고 상호작용하는 차세대 AI 에이전트로, 연구원들이 인공 일반 지능과 실제 로보틱스 응용 분야를 향한 진전이라고 설명하는 것을 나타냅니다.DeepMind에 따르면, 이 새로운 에이전트는 전작 대비 성능이 크게 향상되어 복잡한 작업의 성공률을 두 배로 높였습니다. 원래 SIMA가 어려운 과제에서 인간 플레이어의 71%에 비해 31%의 완료율만 달성한 반면, SIMA 2는 Gemini 2.5 Flash-lite 통합을 통해 향상된 기능을 보여줍니다.향상된 추론 및 자기 개선SIMA 2는 단순한 지시 따르기를 넘어 맥락을 이해하고, 목표에 대해 추론하며, 사용자와 대화할 수 있다고 DeepMind의 선임 연구 과학자 Joe Marino가 기자 브리핑에서 설명했다. 이 에이전트는 이모지를 포함한 멀티모달 프롬프트를 해석할 수 있으며—“????????”와 같은 명령에 나무를 베어 넘어뜨리는 것으로 반응한다—작업을 해결할 때 내부 추론 과정을 보여준다.이 에이전트는 No Man’s Sky, Valheim, Goat Simulator 3 등 다양한 상용 비디오 게임에서 훈련되었으며, 화면 픽셀과 가상 키보드 및 마우스 컨트롤만을 사용하여 600개 이상의 동작을 실행하는 방법을 학습했다. DeepMind는 또한 자사의 월드 모델인 Genie 3가 생성한 사실적인 세계에서 SIMA 2를 테스트했으며, 에이전트는 완전히 새로운 환경에서 성공적으로 탐색하고 작업을 완료했다.아마도 가장 주목할 만한 점은 SIMA 2의 자기 개선 능력이다. 전적으로 인간 게임플레이 데이터에 의존했던 SIMA 1과 달리, 새로운 시스템은 Gemini 모델을 사용하여 작업을 생성하고 자체 성능을 평가하며, 인간의 개입보다는 AI 기반 피드백을 통한 시행착오로 학습한다.물리적 로봇공학으로 가는 길DeepMind는 SIMA 2를 범용 로봇을 위한 기초적인 기술로 제시하고 있습니다. “로봇과 같이 실제 세계에서 작업을 수행하기 위해 시스템이 해야 할 일을 생각해보면 두 가지 구성 요소가 있습니다”라고 DeepMind의 수석 연구 엔지니어인 Frederic Besse는 말했습니다. “첫째, 실제 세계에 대한 높은 수준의 이해와 수행해야 할 작업, 그리고 약간의 추론이 필요합니다”.그러나 전문가들은 신중한 입장을 표명하고 있습니다. 뉴욕 대학교의 AI 연구원인 Julian Togelius는 결과가 흥미롭다고 평가하면서도, 시각적 관찰만으로 여러 게임에 걸쳐 모델을 훈련시키는 것은 여전히 어려운 과제라고 지적합니다. 앨버타 대학교의 Matthew Guzdial은 로봇공학에 얼마나 많은 지식이 전이될 수 있을지 의문을 제기하며, 실제 세계의 카메라 영상을 이해하는 것이 인간 플레이어를 위해 설계된 게임 그래픽을 해석하는 것보다 훨씬 더 복잡하다고 언급했습니다.DeepMind는 SIMA 2를 소수의 학계 및 게임 개발자 그룹에게 제한된 연구 프리뷰로 공개하고 있습니다.
21 조회
0 추천
11.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입