AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
2,312 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 1,366 / 100 페이지
(퍼플렉시티가정리한기사)패션이커머스플랫폼무신사가전사적으로인공지능(AI)기술도입을본격화하며개발자채용을확대한다고19일밝혔다.급변하는이커머스시장에서기술경쟁력을확보하기위해개발,기획,디자인등직무전반에AI도구를도입하고,이를뒷받침할기술인재확보에나서는것이다.​무신사는올해하반기부터'AI리터러시(AILiteracy)'강화를핵심과제로삼고업무전반에AI기술을활용하고있다.무신사,29CM,솔드아웃등팀무신사가운영하는플랫폼의안정적인구축과서비스품질고도화가목표다.​개발부터콘텐츠제작까지AI전면도입테크부문개발인력들은코드생성과분석과정에서AI기반클로드(Claude),커서(Cursor),주니(Junie)등의서비스를활용중이다.플랫폼기획,디자인,운영영역에서도AI를적극활용하고있다.방대한패션빅데이터를통한트렌드분석과마케팅콘텐츠제작에AI기반이미지·영상제작툴을운용하며,일본과중국등해외시장진출과정에서필요한상품후기번역및다국어지원에도AI를활용하고있다.​무신사는지난8월사내AI해커톤'무슨사이(MUSNSAI)'를개최해새로운개발문화를제안했으며,11월13일OpenAI가주최한'데브데이익스체인지서울(DevDayExchangeSeoul)'행사에참가해ChatGPT기반상품추천및후기요약앱,에이전트기반상품추천시스템등을선보였다.​기술인재확보에속도무신사는AI역량강화를위해전용채용플랫폼'무신사커리어스'를통해백엔드,프론트엔드,머신러닝(ML),SRE,데이터분야엔지니어를상시채용하고있다.프로덕트매니저와테크니컬프로덕트매니저등주니어·시니어개발자도모집중이다.​전준희무신사테크부문부사장은"AI리터러시강화는이제선택이아닌필수가됐다"며"기술혁신이무신사의성장을이끄는새로운동력이될것이며,지속적인기술투자를통해국내는물론글로벌시장에서도더나은쇼핑경험을제공하는패션이커머스대표기업이될것"이라고밝혔다.
1267 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Google는2025년11월18일에Antigravity를공개했습니다.이는에이전트-퍼스트무료통합개발환경으로,AI를단순한보조자에서능동적인개발파트너로격상시킴으로써개발자가소프트웨어를만드는방식을근본적으로변화시킵니다.Gemini3Pro위에구축되었으며,Windsurf에서온기술로구동됩니다.Windsurf의CEO바룬모한과핵심팀은7월에24억달러에Google에인수되었습니다.Antigravity는자율에이전트에게에디터,터미널,브라우저에직접접근할수있도록하며,이들이복잡한소프트웨어작업을독립적으로계획,실행,검증할수있게합니다.​에이전트우선아키텍처가개발자워크플로우를재정의하다기존의AI코드어시스턴트가사이드바를차지하는것과달리,Antigravity는에이전트매니저를주요인터페이스로위치시킵니다.이플랫폼은세가지독특한"서피스"를도입합니다:여러자율에이전트를오케스트레이션할수있는에이전트매니저대시보드,익숙한VisualStudioCode스타일의에디터,그리고에이전트가웹애플리케이션을실시간으로테스트할수있도록스크린샷과녹화를통해깊은크롬브라우저통합을제공합니다.​"Antigravity는개발자가작업공간전반에걸쳐에이전트를관리하면서,기본적으로친숙한AIIDE경험을유지하면서더높은작업지향적수준에서작업할수있도록합니다."라고Google은출시발표에서밝혔습니다.이플랫폼의에이전트는개발자가아키텍처와전략적결정에집중하는동안,새로운기능구현부터코드디버깅,문서생성에이르기까지여러단계의개발작업을자율적으로처리할수있습니다.​이IDE는작업목록,구현계획,브라우저스크린샷,실행녹화등검증가능한결과물인"Artifacts"를도입합니다.이러한투명성메커니즘은에이전트가무엇을만들었고어떻게테스트했는지에대한구체적인증거를개발자에게제공함으로써,단순히완성된코드를보여주는대신AI가생성한코드에대한중요한신뢰의격차를해소합니다.​기업도입가속화초기기업고객들은생산성향상을보고하고있습니다.JetBrains는Gemini3Pro를통합했을때벤치마크작업해결수에서"Gemini2.5Pro대비50%이상개선"을관찰했다고밝혔습니다.GitHub은초기VSCode테스트에서"소프트웨어엔지니어링과제해결정확도가Gemini2.5Pro보다35%높았다"고보고했습니다.​Cursor,Figma,Replit,Shopify,ThomsonReuters등다양한개발플랫폼이이미Gemini3Pro를통합하고있습니다.Box의CTO벤쿠스(BenKus)는Gemini3Pro가"BoxAI가조직지식을해석하고적용하는방식을혁신할새로운수준의멀티모달이해력,계획수립,도구호출을제공한다"고말했습니다.​현재MacOS,Windows,Linux에서무료로공개프리뷰중인Antigravity는Gemini3Pro뿐아니라Anthropic의ClaudeSonnet4.5및OpenAI의GPT-OSS모델도지원합니다.이플랫폼은5시간마다새로고침되는넉넉한속도제한을제공하며,Google은"매우소수의파워유저들"만이제한을경험할것이라고밝혔습니다.
1332 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)TikTok은11월18일사용자들이피드에표시되는AI생성콘텐츠의양을조절할수있도록허용할것이라고발표했으며,이는인공적으로생성된콘텐츠의유입에대한사용자불만에대응하는소셜플랫폼의증가추세에동참하는것이다.이동영상공유앱은또한기존탐지방법을우회하는AI콘텐츠를더잘식별하기위해고급"비가시워터마킹"기술을테스트하고있다.​새로운제어및탐지기술앞으로몇주안에출시될이기능은TikTok의기존"주제관리"도구내의콘텐츠환경설정(ContentPreferences)에서확인할수있습니다.사용자는슬라이더를이동하여스포츠나음식등카테고리피드를사용자정의하듯AI생성콘텐츠를더많이또는더적게볼수있습니다.플랫폼측은이컨트롤이"피드내의콘텐츠를완전히제거하거나교체하는것이아니라,피드내의다양한콘텐츠범위를사용자가조정할수있도록설계된것"이라고밝혔습니다.​TikTok은이제AI생성으로라벨링된동영상이13억개이상에달한다고공개했습니다.이미회사는AI콘텐츠를태그하기위해C2PAContentCredentials(산업전반의메타데이터시스템)을사용하고있지만,이러한라벨은다른플랫폼에서동영상이다시편집되거나업로드될때제거될수있습니다.이번에도입되는새로운보이지않는워터마크는TikTok만읽을수있으며,플랫폼의AIEditorPro도구로생성된콘텐츠와ContentCredentials를포함하는업로드에추가됩니다.​이런조치는핀터레스트(Pinterest)가'AI슬롭'이피드를도배한다는비판을받은뒤,10월에특정카테고리에서AI생성이미지를제한할수있는컨트롤을도입한것과유사합니다.두이니셔티브모두MetaPlatforms,Inc.(메타)와OpenAI가AI로만생성된영상콘텐츠만제공하는전용플랫폼(Vibes와Sora)을론칭하며반대방향으로나아가는시점에등장했습니다.​AI확산에대한산업계의대응TikTok은"AI가개인이창의성을표현하는방식을혁신할수있다고믿는다"고강조하면서도투명성의중요성을강조했다.이회사는책임있는AI관행에초점을맞춘비영리단체인PartnershiponAI,그리고GirlsWhoCode와같은단체들과파트너십을맺어교육콘텐츠를제작하기위한200만달러규모의AI리터러시기금을발표했다.​11월18일더블린에서열린TikTok신뢰및안전포럼에서전문가들은폭력적극단주의자들이플랫폼가이드라인위반을피하는메시지를생성하여콘텐츠조정을회피하기위해생성형AI를사용하고있다고경고했다.이회사는AI라벨링발표와함께독일에서극단주의관련용어를검색하는사용자를위한새로운교육프롬프트를도입했다.
1216 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)FoxNewsMedia는지난1년간PalantirTechnologies와협력하여인간기자를대체하지않으면서뉴스룸운영을간소화하도록설계된세가지맞춤형AI기반도구를개발했다고FoxNewsDigital의사장겸편집장인PorterBerry가월요일Axios와의인터뷰에서밝혔습니다.​이번협력은순수한상업적계약으로,FoxNews가지적재산을보호하면서고급AI기능에접근할수있게함으로써경쟁사들과차별화됩니다.AI기업에콘텐츠라이선스를제공하는많은언론기관들과달리,FoxNews는편집자료에대한엄격한통제를유지하여AI파트너가자사의콘텐츠를학습하거나사용할수없도록보장합니다.​세가지도구가디지털워크플로우를혁신하다이파트너십은Fox저널리스트들과함께개발한세가지효율성도구를생산했습니다."토픽레이더"는기자들이진행중인스토리를빠르게파악할수있도록맞춤형브리핑을제공합니다."텍스트에디터"는작성된콘텐츠의스타일준수,효율성,깨진링크를확인하면서FoxNews편집지침준수를보장하는AI강화워드프로세서로기능합니다.세번째도구인"기사인사이트"는디지털기사성과를분석하고최적화전략을제안합니다.​Palantir엔지니어들은약1년전부터뉴스룸의일상운영에참여하여,처음에는FoxNews의워크플로우,데이터시스템및콘텐츠배포프로세스의"디지털트윈"을생성했습니다.그런다음두회사는이러한운영을개선하여,처음에는SEO키워드및태깅과같은반복적인작업을대상으로한후저널리스트가플랫폼전반에걸쳐스토리를발견하고,제작하고,공유하는데도움이되는도구로발전했습니다.​Berry는AI가편집콘텐츠를생성하지않을것이라고강조하며다음과같이말했습니다:"이것은처음부터끝까지인간이하는것이며,AI는중간에통합됩니다".FoxNews는또한ChatGPT와Gemini를포함한추가AI도구를사용합니다.​재무건전성이AI투자를가능하게한다FoxCorp.의가장수익성높은부문인FoxNews는많은언론사들에게는비용이과도하게부담스러울기업AI파트너십을추진할수있는재정적자원을보유하고있습니다.FoxCorp.는2026회계연도1분기매출이전년대비5%증가한37억4천만달러를기록했으며,이는전반적인운영에걸친강력한광고수요에힘입은것입니다.​이번파트너십은방송중심뉴스룸들이텍스트중심매체들에비해AI도입에대체로더신중한태도를보이는가운데이루어졌으며,이는주로저작권및뉴스영상과관련된법적복잡성때문입니다.Berry는이계약을간단히설명했습니다:"비즈니스계약입니다.우리가그들을고용했습니다".
1264 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입