Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
2,298 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 1,366 / 89 페이지
기술억만장자일론머스크는수요일워싱턴D.C.에서열린미국-사우디투자포럼에서인공지능과로봇공학이향후10년에서20년내에돈을"무의미하게"만들고일을선택적활동으로변화시킬것이라고예측했다."제생각에는,충분히먼미래를내다본다면,AI와로봇공학의지속적인발전이있을것으로보이는데,미래의어느시점에서돈은더이상의미가없어질것입니다"라고머스크는11월19일케네디센터에서열린패널토론에서말했다."전력과같은에너지와질량에대한제약은여전히존재할것입니다"라고그는덧붙였다."하지만어느시점에서는화폐가무의미해질것이라고생각합니다."​AI영향력에대한대조적인비전Tesla,SpaceX,그리고xAI를이끄는머스크는NvidiaCEO젠슨황과함께AI주도경제에서의업무와생산성의미래에대해논의하기위해나타났다.머스크가일이없는미래에대한광범위한비전을제시한반면,황은보다신중한관점을제시했다.​황은여러매체에따르면"모든사람의직업이달라질것이며,그것은확실하다고생각한다"고말했다.그는AI가업무를완전히없애기보다는사람들을더생산적으로만들것이라고제안하며,"엘론은AI의결과로더바빠질것이라는것이내추측이다.나도AI의결과로더바빠질것이다"라고예측했다.​사우디왕세자무함마드빈살만의백악관방문과동시에열린이포럼에서는양국간확대된투자약속에대한발표가있었다.같은날,Nvidia는월스트리트예상을뛰어넘는570억달러의3분기매출을보고했다.​​선택적여가로서의일머스크는미래의고용에대한자신의비전을여가활동에비유했다."그것은스포츠나비디오게임을하는것과비슷할것입니다,"라고그는말했다."당신은상점에가서채소를그냥살수도있고,집뒤뜰에서채소를직접키울수도있습니다.집에서채소를기르는것은훨씬더어렵지만,어떤사람들은채소를기르는것을좋아해서여전히그렇게합니다.앞으로의일은이런식이될것입니다:선택적입니다".​테슬라CEO는자신의회사옵티머스휴머노이드로봇이"빈곤을없앨것"이라고여러차례주장했다.그는긍정적인AI미래가어떨지보여주는예시로1987년부터2012년까지쓰여진SF작가이언뱅크스의컬처시리즈를언급했다.​머스크는10월에조로건과의인터뷰에서보편적기본소득(universalbasicincome)이아니라"보편적고소득(universalhighincome)"을옹호하며말했다:"누구나원하는제품이나서비스를가질수있습니다.하지만그과정에는많은트라우마와혼란이있을것입니다".
1204 조회
0 추천
2025.11.21 등록
일론머스크는이번주에태양광인공지능위성을궤도에배치하겠다는야심찬비전을제시하면서,이러한위성들이인공지능컴퓨팅의에너지수요를충족시키고지구에도달하는태양복사량을정밀하게제어함으로써지구온난화를방지할수있다고주장했다.수요일열린미-사우디투자포럼에서머스크는스페이스X의스타십로켓이“연간약300GW,어쩌면500GW정도의태양광인공지능위성을궤도에쏘아올릴수있을것”이라고말했다.그는세일즈포스(Salesforce,Inc.)의CEO마크베니오프가머스크가우주기반데이터센터가지상시설대비비용효율성이높다고논의하는영상을공유한것에답변했다.​이제안은기술업계리더들이급증하는AI의전력수요문제를해결하기위해경쟁하는가운데나왔다.머스크는AI의전력수요가미국전체에너지소비의“3분의2”에도달할수있다고언급했으며,이는연방에너지규제위원회(FERC)데이터에따르면현재약473GW에해당한다.포럼에서머스크와함께무대에오른엔비디아(NVIDIACorporation)CEO젠슨황은현재AI슈퍼컴퓨터가랙당2톤이넘고,그중“1.95톤은아마도냉각을위한것”이라고말했다.머스크는우주가냉각목적으로"매우매력적인장소가될것"이라며동의했고,"우주에서는항상해가비치기때문에배터리가필요없다"고덧붙였다.​우주기반컴퓨팅경쟁가열머스크의발언은궤도컴퓨팅인프라를향한업계전반의움직임과일치한다.알파벳(AlphabetInc.)은11월3일,플래닛랩스(PlanetLabs)와협력해2027년초까지텐서프로세싱유닛이탑재된두대의프로토타입위성을발사하는'프로젝트선캐처(ProjectSuncatcher)'를발표했다.이프로젝트는대기간섭없이태양광을이용해궤도에서머신러닝워크로드를테스트하는것이목표다.​블루오리진(BlueOrigin)CEO인제프베조스는지난달이탈리아테크위크에서"향후10에서20년내에기가와트규모의데이터센터가우주에건설될것"이라고예측했다.베조스는자동차및항공우주애플리케이션에초점을맞춘새로운AI하드웨어스타트업인프로젝트프로메테우스(ProjectPrometheus)도지원하고있는것으로알려졌다.​이달초머스크는"대형태양광AI위성군집을이용해지구에도달하는태양에너지를미세하게조정함으로써지구온난화를방지하자"고제안했다.이개념은'태양복사관리(solarradiationmanagement)'로알려져있으며,기후를인위적으로통제하는것은예기치못한부작용이있을수있다고경고하는과학자들사이에서논쟁을불러일으키고있다.​하지만머스크는칩생산을"해결해야할가장큰퍼즐조각"이라고지적했다.그는테슬라(Tesla,Inc.)가AI프로세서수요를충족하기위해인텔(IntelCorporation)과개발중인것으로알려진자체'테라팹(TeraFab)'파운드리를지어야할수도있다고밝혔다.
1165 조회
0 추천
2025.11.21 등록
알리바바는Qwen대규모언어모델을매우허가친화적인오픈소스라이선스로공개함으로써궁극적으로자사의클라우드컴퓨팅및전자상거래비즈니스에이로운광범위한AI도입을이끌것이라고전망하고있으며,이는회사의AI전략에대한BismarckBrief의분석에근거한것이다.​에어비앤비CEO브라이언체스키는자사가고객서비스에Qwen모델을적극적으로활용한다고밝혔으며,그이유로"우수함","빠른속도","합리적인비용"을꼽았고,플랫폼통합요구사항에"완전히준비되지않은"ChatGPT대신선택했다고설명했다.​Qwen오픈소스모델은전세계적으로6억회이상다운로드됐으며,현재아마존,애플등미국대형기업의AI시스템에도적용되어,알리바바가세계최대오픈소스AI생태계를구축하게되었다.
1233 조회
0 추천
2025.11.21 등록
Microsoft는 파일 정리 및 이메일 전송과 같은 작업을 자동화하도록 설계된 새로운 Copilot Actions AI 기능이 장치를 손상시키고 민감한 데이터를 훔칠 수 있다는 경고를 발표했으며, 이는 빅테크 기업들이 보안 위험을 완전히 이해하기 전에 기능을 출시한다는 비판을 다시 불러일으켰습니다.회사는 특히 공격자가 웹사이트, 이력서 또는 이메일에 악의적인 명령을 삽입할 수 있는 프롬프트 인젝션 취약점에 대해 사용자들에게 경고했으며, 대규모 언어 모델은 이를 정당한 사용자 지시와 구별할 수 없습니다.Open Worldwide Application Security Project는 2025년 LLM 애플리케이션 상위 10대 보안 위험에서 프롬프트 인젝션을 1위 보안 위험으로 선정했으며, 이는 AI 에이전트가 제어 명령과 사용자 데이터를 구분하지 못하는 근본적인 무능력에 대한 업계 전반의 우려를 반영합니다.
1284 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입