Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
2,234 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 1,366 / 122 페이지
(퍼플렉시티가 정리한 기사)Google CEO 순다르 피차이는 X에서 온라인 예측 시장에 생각하는 이모지로 답변하며 Gemini 3.0의 임박한 출시에 대한 강렬한 추측을 촉발시켰으며, 업계 관찰자들은 이를 출시가 불과 며칠 남았다는 확인으로 해석했다. 이 미묘한 소셜 미디어 제스처는 AI 업계 전반에 걸쳐 기대감을 극도로 고조시켰으며, 내부자들은 새로운 모델이 Google이 OpenAI로부터 리더십을 되찾으려는 노력의 전환점이 될 수 있다고 시사하고 있다.Google의 차세대 AI 모델인 Gemini 3.0은 프로젝트에 정통한 여러 소식통에 따르면 코딩과 멀티미디어 생성에서 상당한 개선을 제공할 것으로 예상된다. 이번 출시에는 Gemini 앱이 월간 활성 사용자 6억 5천만 명을 확보하는 데 기여한 Google의 바이럴 이미지 생성 도구인 Nano Banana의 향상된 버전이 포함될 예정이다. 업계 내부자들은 곧 출시될 모델을 “극도로 인상적”이라고 묘사하며, Google이 경쟁사를 추월할 현실적인 기회를 얻을 수 있을 것이라고 시사했다.AI 경쟁의 중대한 순간타이밍은 전략적으로 보입니다. 2025년 8월에 출시된 OpenAI의 크게 기대를 모았던 ChatGPT 5는 사용자 불만과 긴급 수정으로 점철된 엇갈린 반응을 받았으며, 일부에서는 회사가 여전히 기술적 우위를 유지하고 있는지 의문을 제기했습니다. CEO 샘 알트먼은 레거시 모델의 갑작스러운 제거와 유료 구독자들을 좌절시킨 놀라운 사용률 제한을 포함한 출시 과정의 실수를 인정했습니다.구글은 2022년 말 OpenAI의 ChatGPT 출시가 피차이 본인이 최근 회사에 “코드 레드” 순간이라고 부른 것을 촉발한 이후 긴 여정을 거쳐왔습니다. 10월 세일즈포스의 드림포스 컨퍼런스에서 피차이는 OpenAI가 먼저 움직인 것에 대해 솔직하게 공을 돌렸고, 그 충격이 구글로 하여금 수년간의 AI 개발 작업을 가속화하도록 강제했다고 인정했습니다.그 이후로, 회사는 분석가들이 “풀스택 이점”이라고 부르는 것을 활용해왔습니다—제품을 통해 배포를 통제하고 클라우드 비즈니스를 통해 인프라를 통제하면서 모델을 구축하는 것입니다. ChatGPT가 대략 주간 활성 사용자 8억 명을 유지하고 있는 반면, 구글의 빠른 성장 궤적은 모멘텀을 보여주고 있습니다.무엇이 걸려 있는가예상되는 기능으로는 고급 다단계 추론을 위한 Deep Think 아키텍처, 몇 초 내에 2,000줄 이상의 기능적 코드를 생성하는 향상된 코드 생성 기능, 그리고 확장된 멀티모달 기능이 있습니다. 이 모델은 연말 이전에 Pro와 Flash 변형 모두로 출시될 것으로 예상되며, 피차이는 구글의 3분기 실적 발표에서 이 일정을 확인했습니다.최근 분기 매출 1,000억 달러를 처음으로 달성한 구글에게 있어, 이해관계는 기술적 자랑거리를 넘어서는 것입니다. 성공적인 Gemini 3.0 출시는 클라우드 인프라, 맞춤형 칩, 연구 인재에 대한 회사의 수년간의 투자를 입증하는 동시에, ChatGPT가 여전히 가장 잘 알려진 이름으로 남아있는 AI 환경에서 지속되는 브랜드 인식 문제를 해결할 수 있습니다.
1432 조회
0 추천
2025.11.16 등록
(퍼플렉시티가 정리한 기사)Google가 Android 기기 전반에 걸쳐 Gemini 앱의 시각적 개편을 출시했으며, AI 어시스턴트 경험을 간소화하도록 설계된 새로워진 홈 화면, 향상된 다크 테마 및 새로운 구성 기능을 도입했습니다.Google 앱 버전 16.45와 함께 롤아웃되는 이번 업데이트는 최근 몇 달 동안 Gemini 앱에 적용된 여러 인터페이스 개선 사항 중 하나를 나타냅니다. 이 재디자인은 11월 13일부터 Android 사용자에게 제공되기 시작하며, 업데이트는 곧이어 Samsung Galaxy 휴대폰과 태블릿에도 도달합니다.새로운 디자인 요소 및 다크 테마가장 눈에 띄는 변화는 앱의 홈페이지에 나타나는데, 이제 인사말 아래에 “어디서부터 시작할까요?“라는 프롬프트가 표시되며, 이전의 파란색 텍스트를 검은색 또는 흰색 글꼴로 대체했습니다. Google은 “이미지 생성”, “무엇이든 작성”, “아이디어 구축”, “심층 조사”, “비디오 생성”을 포함한 기능 칩을 이전의 그룹화된 레이아웃이 아닌 세로 목록 형식으로 재구성했습니다.다크 모드를 활성화한 사용자의 경우, Google은 회색에서 순수한 검은색 배경으로 전환했으며, 이는 10월 말에 처음 보고되었고 현재 널리 제공되고 있습니다. 순수한 검은색(#000000)으로의 전환은 OLED 디스플레이에서 향상된 대비를 제공하는 동시에 배터리 소비를 잠재적으로 줄일 수 있습니다. 그러나 프롬프트 박스와 대화 페이지는 더 밝은 색 구성표를 유지하여, 일부 관찰자들이 “흥미로운 이중 톤 외관”이라고 묘사한 것을 만들어냅니다.내 항목 섹션 출시탐색 드로어에 새로 추가된 “내 콘텐츠” 섹션은 Gemini에서 생성된 모든 이미지, 비디오 및 Canvas 작업에 대한 중앙 집중식 액세스를 제공합니다. 이 기능은 둥근 사각형으로 마지막 세 개의 창작물 미리보기를 표시하며, 셰브론 아이콘을 통해 생성된 모든 콘텐츠의 전체 화면 피드로 이동할 수 있습니다.대화 화면도 업데이트되어 오른쪽 상단의 계정 전환기가 새로운 채팅 버튼으로 교체되었습니다. 대화 이름은 이제 드롭다운 메뉴로 작동하며, 대화를 공유, 고정, 이름 변경 또는 삭제하는 옵션을 제공합니다. 이러한 작업은 이전에는 탐색 드로어를 통해서만 액세스할 수 있었습니다.9to5Google에 따르면, 이 재디자인은 Android에서 광범위하게 출시되고 있지만 iOS 및 웹 플랫폼에서의 완전한 가용성은 아직 확인되지 않았습니다. 이러한 변경 사항은 9월 Gemini의 이전 홈페이지 재디자인에 이어 진행되었으며, AI 어시스턴트 인터페이스를 개선하려는 Google의 노력이 계속되고 있습니다.
1415 조회
0 추천
2025.11.16 등록
(퍼플렉시티가 정리한 가사)Waymo, 알파벳이 소유한 자율주행 자동차 사업부는 이번 주 로보택시 차량이 미국 5개 주요 도시에서 운영되는 2,500대로 증가했다고 밝혔으며, 이는 무인 운송의 상용화 경쟁에서 중요한 이정표가 되었습니다.차량 배치 현황은 샌프란시스코 베이 에리어 1,000대, 로스앤젤레스 700대, 피닉스 500대, 오스틴 200대, 애틀랜타 100대입니다. 업계 관찰자 소여 메릿(Sawyer Merritt)이 11월 13일 소셜 미디어 플랫폼 X에 이 수치를 공유했을 때, 테슬라 CEO 일론 머스크는 “초보자 수준(Rookie numbers)“이라는 신랄한 두 단어로 응수했습니다.고속도로 확장 및 디트로이트 테스트Waymo는 수요일에 샌프란시스코, 로스앤젤레스, 피닉스의 고속도로에서 로보택시 운행을 시작할 것이라고 발표했으며, 이는 승차 시간을 최대 50%까지 단축할 수 있다고 회사가 밝혔다. 확대된 서비스는 샌프란시스코 반도 전역의 통합된 260평방마일 구역을 포함하며, 남쪽으로 산호세까지 확장되고 산호세 미네타 국제공항에서의 길가 서비스를 포함한다.11월 14일 금요일, Waymo 테스트 차량이 디트로이트 시내 우드워드 애비뉴에서 포착되었으며, 이는 2026년 도시 출시를 위한 회사의 준비 과정의 일부이다. 디트로이트 확장은 Waymo의 첫 북부 시장 진출을 나타내며, 눈과 얼음 조건을 처리하는 기술의 능력을 시험할 것이다.테슬라의 야심찬 일정머스크가 Waymo의 차량 규모를 일축하는 반응을 보인 것은 Tesla가 자체 로보택시 서비스의 공격적인 확장을 추진하고 있는 가운데 나온 것입니다. All-In 팟캐스트에 출연한 자리에서 머스크는 Tesla가 연말까지 베이 에리어에 1,000대, 오스틴에 500대의 차량을 배치하는 것을 목표로 한다고 밝혔습니다. 회사는 또한 12월까지 오스틴의 대부분 지역에서 안전 운전자를 제거할 계획입니다.Tesla의 현재 차량 규모는 명확하지 않으며, 운영 중인 차량이 50대 미만인 것으로 추정됩니다. Waymo의 완전 자율주행 차량과 달리, Tesla의 로보택시는 여전히 앞좌석에 인간 안전 모니터가 필요합니다.Electrek이 분석한 연방 충돌 데이터에 따르면, Tesla 로보택시는 100만 마일당 약 16건의 사고를 경험하는 반면 Waymo는 100만 마일당 10건의 사고를 기록합니다. Waymo는 서비스 출시 이후 약 1억 2,500만 마일의 자율주행을 기록했으며, Tesla는 6월 이후 약 25만 마일을 주행했습니다.Waymo 공동 CEO인 Tekedra Mawakana는 10월 TechCrunch Disrupt에서 회사가 2026년 말까지 주당 100만 건의 이동 서비스를 제공할 것으로 예상한다고 밝혔으며, 이는 4월 기준 주당 25만 건 이상의 승차 서비스에서 증가한 수치입니다.
1459 조회
0 추천
2025.11.16 등록
(퍼플렉시티가 정리한 기사)IBM과 UFC는 실시간 경기 중 방송사에 실시간 통계를 제공하는 AI 기반 플랫폼을 도입했으며, 이는 두 회사의 1년간의 파트너십에서 중요한 이정표가 되었습니다.In-Fight Insights라고 불리는 이 도구는 11월 15일 매디슨 스퀘어 가든에서 열리는 UFC 322에서 데뷔할 예정이며, Jon Anik과 같은 해설자들에게 옥타곤 내에서 발생하는 기록 경신, 연속 기록 및 이정표에 대한 즉각적인 접근을 제공합니다. Sports Business Journal에 따르면, 이전에는 이러한 유형의 상세한 분석이 경기 전후에만 가능했습니다.파트너십 출범 이후 첫 실시간 통합In-Fight Insights는 IBM과 UFC가 2024년 11월 협력을 발표한 이후 첫 번째 라이브 경기 중 통합을 나타냅니다. 4년간 8자릿수 초반 가치로 평가되는 최초의 파트너십은 IBM을 UFC의 최초 공식 AI 파트너로 지정했습니다.IBM의 watsonx AI 플랫폼으로 구축된 이 시스템은 20년 이상의 UFC 경기에 걸친 1,320만 개 이상의 데이터 포인트로 구성된 데이터베이스를 활용하며, 현역 및 전직 선수 2,400명 이상을 포괄합니다. 이 플랫폼은 이러한 과거 데이터를 분석하여 실시간으로 중요한 순간을 식별하고, 방송사와 제작팀에 직접 인사이트를 제공합니다.UFC의 모회사인의 혁신 담당 수석 부사장 Alon Cohen은 “IBM watsonx로 구축된 UFC Insights Engine은 팬들을 위해 몇 초 만에 새로운 실시간 인사이트를 발굴하는 복잡한 AI 패키지입니다”라고 말했습니다. “AI 도구를 사용하는 사람이라면 일반적으로 깊이 있게 또는 빠르게 작동할 수 있지만 둘 다는 아니라는 것을 알고 있습니다. 그러나 이러한 새로운 경기 중 통계를 위해 IBM과 협력하면서 우리는 Insights Engine을 최적화하여 둘 다 달성했으며, 이는 진정한 게임 체인저입니다.”스포츠 방송에서 AI 확대이번 출시는 IBM과 UFC가 파트너십 발표 이후 개발한 보다 광범위한 UFC Insights Engine을 기반으로 합니다. 초기 플랫폼은 UFC의 디지털 플랫폼, 소셜 미디어 채널 및 경기장 내 디스플레이 전반에 걸친 경기 전 분석 및 경기 후 콘텐츠에 중점을 두었습니다.IBM의 마케팅 및 커뮤니케이션 수석 부사장인 Jonathan Adashek는 이 기술이 “AI가 전 세계 팬들의 라이브 스포츠 시청 경험을 어떻게 진정으로 변화시키고 있는지”를 보여준다고 말했습니다. 경기 중 생성된 데이터는 보관 및 분석 목적으로 UFC Insights Engine에 저장됩니다.UFC 322는 웰터급 챔피언 Jack Della Maddalena가 메인 이벤트에서 Islam Makhachev를 상대로 타이틀을 방어하는 경기를 선보입니다.
1478 조회
0 추천
2025.11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입