Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 10.20 15:00
187 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 583 / 8 페이지
(퍼플렉시티가정리한기사)일론머스크의인공지능회사xAI가네번째AI동반자인미카(Mika)를출시할예정이라고발표했습니다.미카는오토바이애호가캐릭터로설계되어Grok챗봇플랫폼의어필을확대하는것을목표로합니다.이번발표는회사가최근Imagine기능업데이트를통해Grok의멀티모달기능을지속적으로향상시키고있는가운데나온것입니다.미카를만나보세요:반항아동반자미카(Mika)라는24세여성의자산이이미Grok앱에존재하고있으며,"립스틱에신경쓰기보다는오토바이로타이어를갈아버리고싶어한다"는묘사로빠르면이번주말에출시가임박했음을시사합니다.이캐릭터는애니메이션스타일의디자인으로파란머리,검은색찢어진청바지,가죽재킷을특징으로하며,Grok의기존동료들과는대조되는모험심많고독립적인성격을담고있습니다.​유출된시스템프롬프트에따르면,미카는미군아버지와일본인어머니사이에서군기지에서성장하며어린시절을오키나와에서보냈습니다.파일럿훈련을받은후에는전통적인항공기대신"바이크의자유"를선택하며,스스로를"항상움직이고있다","열린도로와모험을위해산다"고정의합니다.​미카는애니메이션스타일의캐릭터애니(Ani),"상스러운붉은팬더"로묘사되는루디(Rudi),그리고발렌타인(Valentine)등기존의AI동료라인업에합류하게됩니다.이동료들은xAI의프리미엄등급구독자에게제공되며,기본동료기능은Premium+구독자에게월35달러에이용할수있습니다.​향상된다중모달진화Grok의기초적인비전기능은2024년4월Grok-1.5V와함께도입되었지만,최근개발은플랫폼의창작및멀티모달기능확장에집중되고있습니다.이회사는2025년10월에GrokImagine0.9를출시하여15초이내에동기화된오디오가포함된6-15초길이의클립을생성하는텍스트-비디오생성기능을제공합니다.​최신업데이트에는GrokImagine을통한향상된비디오생성이포함되어있으며,이는사용자가"네이티브오디오-비디오합성"과24FPS의향상된프레임속도로짧은비디오를생성할수있게해줍니다.사용자는이제프롬프트를추가하여기존비디오를수정할수있으며,생성된각비디오에는복제를위한원본소스와생성프롬프트에대한링크가포함됩니다.​이러한개발은Grok을OpenAI의제품들과경쟁하는위치에놓고있으며,xAI는일반적으로유사한출력에40-60초가필요한RunwayMLGen-3과같은경쟁사보다훨씬빠른생성속도를주장하고있습니다.이회사는또한이미지당$0.07의가격으로이미지생성기능을포함하도록API를확장하여AI이미지생성시장의기존업체들과직접경쟁하고있습니다.
73 조회
0 추천
10.25 등록
(퍼플렉시티가 정리한 기사)테더Data의AI연구부서QVAC는인공지능학습을위한410억토큰규모의합성데이터셋GenesisI과사용자기기에서완전히실행되는로컬AI애플리케이션QVACWorkbench의출시를발표했습니다.금요일에공개된이이니셔티브는고품질학습데이터에대한접근을민주화함으로써AI개발에서빅테크의지배력에도전하는것을목표로합니다.​QVACGenesisI은수학,물리학,생물학,의학을다루는STEM교육콘텐츠를위해특별히설계된최초의공개합성데이터셋입니다.단순히언어패턴을모방하도록돕는기존데이터셋과달리,이컬렉션은AI시스템이인과관계를이해하고비판적사고에참여하도록가르치는데중점을둡니다.​AI지능의분산화"지능은중앙화되어서는안된다"고테더의CEO파올로아르도이노가말했다."QVAC워크벤치와제네시스I을통해우리는무한한지능의문을열고있습니다.이는당신의기기에서로컬로살아있고,학습하고,진화하는AI입니다."아르도이노는이번출시가"플랫폼이아닌사람들이지식이어떻게생성되고,공유되고,사용되는지를통제하는미래"를나타낸다고강조했다.​이데이터셋은교육및과학적벤치마크에대해엄격하게검증되었으며,기존공개훈련데이터셋이일반적으로부족한주요STEM영역에서추론및문제해결에있어우수한성능을보여주었다.테더데이터는고품질과학자료를구조화된학습데이터로변환하는다단계생성및검증프로세스를사용하여이데이터셋을생성했다.로컬AI컴퓨팅플랫폼동시에출시된QVACWorkbench는Android,iOS,Windows,macOS및Linux플랫폼에서Llama,Medgemma,Qwen,SmolVLM및Whisper를포함한여러AI모델을지원합니다.이애플리케이션은로컬온디바이스처리를통해모든사용자상호작용을완전히비공개로유지하며,사용자가추가컴퓨팅성능을위해모바일기기를데스크톱워크스테이션에연결할수있는독특한"위임추론(DelegatedInference)"기능을제공합니다.​이플랫폼은OpenAI와Google과같은기업이통제하는클라우드기반AI서비스의대안을찾는AI애호가,연구자및고급사용자를대상으로합니다.업계분석가들은합성데이터가2030년까지AI훈련의주요소스가될것으로예측하고있어,진화하는AI환경에서Tether의진출시기가전략적으로중요합니다.​Tether의AI인프라확장은디지털화폐를넘어선스테이블코인거대기업의광범위한다각화전략의일환입니다.회사는2025년에약150억달러의수익을기대하고있다고보고했으며,이는기술투자를위한상당한자원을제공합니다.이AI이니셔티브는오픈소스지갑개발키트와다양한탈중앙화통신도구를포함한Tether의이전출시제품을기반으로합니다.
60 조회
0 추천
10.25 등록
(퍼플렉시티가정리한기사)텐센트는소프트웨어개발운영에서인공지능의역할에대한놀라운통계를공개하며,현재이중국거대기술기업에서새로작성되는코드의50%가AI지원으로생성된다고발표했습니다.이발표는중국의"1024프로그래머의날"에맞춰10월24일공개된회사의"2025텐센트연구개발빅데이터보고서"에서이루어졌습니다.AI통합이개발워크플로를혁신하다이보고서는AI가텐센트의엔지니어링운영에얼마나깊이침투했는지를보여주며,현재회사엔지니어의90%이상이자사의HunYuan대규모언어모델을기반으로한AI프로그래밍어시스턴트인CodeBuddy를사용하고있다.이러한통합은측정가능한생산성향상을가져왔으며,평균코딩시간이40%단축되었고전체R&D효율성이20%이상개선되었다.​텐센트의개발규모는이러한개선의중요성을강조한다.회사는월평균3억2,500만줄의코드를추가하고,월37만건의개발요청을완료하며,2,520만건의빌드를실행한다.텐센트인력의76%가연구개발에종사하고있어,직원4명중3명이R&D업무에참여하고있다.​AI품질관리가94%커버리지에도달코드생성을넘어,AI는텐센트의품질보증프로세스에필수적인요소가되었습니다.보고서에따르면AI는코드리뷰의94%에참여하며,인간엔지니어가개입하기전에초기검사를수행하는자동화된"품질검사관"역할을효과적으로수행합니다.이러한AI기반리뷰프로세스는코드결함의28%를식별하여효과적인이슈탐지를44%증가시키고소프트웨어품질관리를강화합니다.​연구개발도구를통합하고개발프로세스를간소화하는회사의WeDev플랫폼은도구간일일8천만건이상의데이터교환을촉진하여매월530만건의수동작업을절약합니다.이러한최적화를통해자동화는전년대비67%증가했습니다.​텐센트의구현성공은다양한사업부문에서인상적인효율성지표를달성했습니다.위챗백엔드팀은컴파일시간을50%단축했으며,위챗페이의배포주기는31%단축되고릴리스품질은14%개선되었습니다.텐센트클라우드에서는새로운코드의65%가CodeBuddy에의해생성되어코드천줄당버그가31.5%감소했습니다.
55 조회
0 추천
10.25 등록
(퍼플렉시티가정리한기사)차세대기상관측기구와결합된첨단인공지능모델이폭풍예측능력을혁신하고있으며,극한기상현상이심화되는가운데생명을구하고해안지역사회를보호할수있는더빠르고정확한예보를제공하고있습니다.이러한기술적돌파구는매우중요한시기에이루어졌습니다.연구자들은이번주AI기반예측시스템이허리케인경로와폭풍해일영향을예측하는데있어기존의물리학기반모델을능가하고있다고보고했습니다.GoogleDeepMind의실험적사이클론모델은2025년8월허리케인에린당시놀라운정확도를보여주었으며,다른모델들이정확도에어려움을겪는동안미국동부해안에서벗어나는폭풍의경로를정확하게예측했습니다.​혁신적인풍선기술이데이터격차를메운다WindBorneSystems는팔로알토에본사를둔스타트업으로,최대50일동안공중에머물수있는자율기상풍선을통해기상데이터수집을혁신하는선두주자로부상했습니다.이는일반적으로2시간만지속되는기존풍선에비해극적으로긴시간입니다.이러한고고도플랫폼은지구를일주하면서지속적으로온도,습도및풍향데이터를수집하며,자사의독점WeatherMesh시스템과같은AI모델에중요한정보를제공합니다.​"이것은슈퍼컴퓨팅에만의존하던것에서하드웨어,센싱및머신러닝을결합한분산형데이터기반모델로의전환을의미합니다"라고최근기술평가에서밝혔습니다.미국국립해양대기청(NOAA)은올해WindBorne의센서데이터구매를시작했으며,이는전국12개이상의지역에서기상풍선발사를중단시킨예산삭감이후예보역량의공백을메우는데도움을주기위한것입니다.​AI기반해일예측으로혜택을받는해안지역사회향상된데이터수집과AI의통합은특히폭풍해일예측에매우중요합니다.전통적으로물리기반모델을사용하면몇시간의계산시간이필요했지만,새로운AI시스템은몇시간이아닌몇초만에상세한해안홍수예측을생성하여비상관리자들에게대피및준비를위한귀중한추가시간을제공합니다.​루이지애나주립대학교연구진은최근기존수치모델보다100,000배이상빠르게홍수예측을생성하는머신러닝프레임워크를개발했으며,노트북컴퓨터에서72시간시뮬레이션을단4초만에완료합니다.한편,캘리포니아대학교산타크루즈캠퍼스의과학자들은NVIDIAAI기술을사용하여해안홍수시뮬레이션을6시간에서40분으로단축하고자연기반보호솔루션을설계하는데도움을주고있습니다.​이러한기술발전은기상학자들이2025년까지계속해서평년이상의허리케인활동을경고하는시점에이루어지고있으며,따뜻한해수온도와기후변화가더강력한폭풍을일으켜해안선으로부터62마일이내에거주하는전세계인구의약40%에게더큰위험을초래하고있습니다.
50 조회
0 추천
10.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입