AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
2,449 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 1,366 / 241 페이지
(퍼플렉시티가 정리한 기사)전설적인 "페이팔 마피아"의 영향력 있는 두 멤버가 인공지능 규제를 놓고 공개 갈등을 빚고 있으며, 링크드인 공동 창립자 리드 호프만은 백악관 AI 책임자 데이비드 색스가 해당 회사를 규제 공포 조장으로 비난한 후 AI 스타트업 앤트로픽을 "선한 쪽"이라고 옹호했다.​월요일 벤처 캐피탈 회사 그레이록의 파트너인 호프만이 도널드 트럼프 대통령의 AI 및 암호화폐 고문을 맡고 있는 색스의 비판에 이어 X에서 앤트로픽을 공개적으로 지지하면서 갈등이 심화되었다. "앤트로픽은 다른 일부 기업들(마이크로소프트, 구글, 오픈AI 포함)과 함께 AI를 올바른 방식으로, 신중하게, 안전하게, 그리고 사회에 엄청난 이익이 되도록 배포하려고 노력하고 있습니다"라고 호프만은 썼다. "그래서 저는 그들의 성공을 열렬히 응원합니다."Anthropic CEO, "정치적 올바름" 논란에 답하다분쟁은 화요일에 에드로픽(Anthropic) CEO 다리오 아무데이(Dario Amodei)가 회사의 정책 입장에 대한 "부정확한 주장"을 다루는 장문의 성명을 발표하면서 격화되었습니다. 아무데이는 에드로픽이 "AI 정책의 핵심 측면"에서 트럼프 행정부와 입장을 같이한다고 주장했으며, "올바른 결과를 달성하는 데 헌신한 누구와도 협력할 의향이 있음을" 밝혔습니다.​앞서 삭스(Sacks)는 에드로픽이 "공포를 조장하는 정교한 규제 선점 전략을 실행하고 있다"고 비난하며, 이 회사가 "스타트업 생태계에 해로운 주(州) 규제 열풍에 주된 책임이 있다"고 주장한 바 있습니다. 이러한 비판은 에드로픽 공동 창립자 잭 클라크(Jack Clark)가 신중한 AI 개발을 옹호하는 "기술적 낙관론과 적절한 두려움"이라는 에세이를 발표한 후 시작됐습니다.페이팔 마피아 정치적 균열 심화이 불화는 실리콘 밸리의 가장 영향력 있는 동문 네트워크 내 더 광범위한 정치적 분열을 반영합니다. 호프만과 색스는 모두 1999년 피터 틸, 일론 머스크, 그리고 페이팔 마피아로 알려지게 된 다른 기술업계 거물들과 함께 페이팔에 합류했습니다. 그러나 정치적 견해 차이로 인해 그들의 관계는 악화되었으며, 호프만은 카말라 해리스의 실패한 대선 캠페인에 수백만 달러를 기부한 주요 민주당 후원자로 부상한 반면, 색스는 트럼프 모금 행사를 주최하고 백악관 직책을 확보했습니다.​경쟁 AI 벤처 xAI를 이끄는 머스크는 이 논쟁에 대한 응답으로 간단히 "Indeed(그렇다)"라고 답하며 색스의 비판을 신속히 지지했습니다. AI 정책 논쟁은 점점 더 정치화되고 있으며, 앤트로픽은 주 차원의 AI 규제를 지지하는 반면 트럼프 행정부는 10년 동안 그러한 규칙을 막는 연방 우선권을 추진하고 있습니다.​
2416 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)메타는 화요일에 WhatsApp과 Messenger 전반에 걸쳐 새로운 사기 방지 기능들을 발표하며, AI 기반 감지 시스템과 화면 공유 경고 기능을 도입했습니다. 이 기능들은 특히 더욱 정교해지는 온라인 사기 행위로부터 고령층을 보호하도록 설계되었습니다.​이 소셜 미디어 대기업은 2025년 상반기에 미얀마, 라오스, 캄보디아, 아랍에미리트, 필리핀에 기반을 둔 운영을 포함하여 약 800만 개의 사기 센터와 연계된 계정을 차단했다고 밝혔습니다. 또한, 메타는 개인정보를 탈취하기 위해 고객 지원 서비스로 가장한 2만 1천 개 이상의 페이스북 페이지에 대해 조치를 취했습니다.새로운 안전 기능이 일반적인 사기 수법을 겨냥합니다WhatsApp은 이제 사용자가 영상 통화 중에 알 수 없는 연락처와 화면을 공유하려고 할 때, 은행 정보나 인증 코드와 같은 민감한 정보를 추출하려는 사기꾼들이 자주 사용하는 방식임을 명확하게 경고하는 알림을 표시합니다. 이 경고는 사용자에게 자신의 화면이 상대방에게 보일 수 있으며, 그 화면에는 은행 정보나 인증 코드가 포함되어 있을 수 있음을 알립니다.​Messenger에서는, 회사가 AI 기반의 고급 사기 감지 기능을 테스트 중이며, 이는 수신 메시지를 분석하여 사기 패턴을 탐지합니다. 새 연락처로부터 수상한 내용이 감지되면, 사용자는 "주의하세요, 돈을 잃을 위험이 있습니다"라는 경고와 함께 재택근무 사기, 빠른 부자되기 제안 등 일반적인 사기 수법에 대한 교육 콘텐츠도 받게 됩니다. 사용자는 이후 최근 메시지를 AI 검토에 제출할 수 있으며, 이 경우 종단간 암호화 보호가 해제됩니다.더 광범위한 이니셔티브, 노인 대상 사기 확산에 대응이 발표는 소셜 미디어 사기가 유행 수준에 이른 가운데 나왔으며, 미국에서 지난해 손실액이 166억 달러를 넘었고, 60세 이상 개인이 가장 큰 피해를 입은 인구 집단이라고 FBI는 보고했습니다. 2024년 한 해 동안 60세 이상 사람들이 사기로 잃은 금액만 48억 달러에 달합니다.​Meta는 "Scams Se Bacho" (사기 주의) 캠페인을 통해 인도 통신부와의 협력을 확대했고, 시니어 시민을 위한 다국어 비디오 콘텐츠를 제작했습니다. 또한, 회사는 Saksham Senior 이니셔티브를 지원하여 인도 주요 도시에서 디지털 리터러시 세션을 열어 고령층이 온라인 안전을 익힐 수 있도록 돕고 있습니다.​추가 보안 기능에는 Facebook, Messenger, WhatsApp 전반에 걸친 Passkey 지원이 포함되어, 지문, 얼굴, 또는 PIN 인증을 통해 사용자가 로그인할 수 있습니다. 회사는 또한 National Elder Fraud Coordination Center(국립 고령 사기 대응 센터)에 합류했으며, 이 센터는 AARP, 아마존, 구글 등과 경찰을 모아 고령자 대상 사기에 대응하는 비영리단체입니다.
2062 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)바이두는 11월 13일 바이두 월드 2025 컨퍼런스에서 샤오두 AI 안경을 공개할 것이며, 판매는 올해 말 시작될 예정이라고 발표했다. 이 기기는 중국 검색 대기업의 급성장하는 AI 웨어러블 시장 진출을 의미하며, 메타 및 알리바바, 바이트댄스를 포함한 다른 중국 기술 대기업들과 직접 경쟁하게 된다.기능은 일상적인 사용을 목표로 합니다샤오두 AI 안경은 바이두의 ERNIE 대형 언어 모델을 기반으로 하며, 1인칭 시점의 영상 촬영, 실시간 질의응답, 칼로리 및 객체 인식, 백과사전 정보 검색, 시청각 번역, 그리고 스마트 알림 기능을 제공합니다. 45그램의 가벼운 무게를 자랑하는 이 기기는 16MP 초광각 카메라와 4마이크로폰 어레이를 탑재하고 있으며, 최대 56시간의 대기 시간을 약속합니다.​업계 보고서에 따르면, 바이두는 2024 월드 컨퍼런스에서 처음으로 이 안경을 공개했으나 상업적 출시를 연기했습니다. 바이두는 이 기기를 "중국 대형 언어 모델로 구동되는 세계 최초의 네이티브 AI 안경"으로 위치 지우고 있습니다.AI 안경 시장에서 증가하는 경쟁바이두의 진출로 폭발적 성장을 보인 시장에서 경쟁이 치열해지고 있다. 2025년 상반기 글로벌 스마트 안경 출하량은 두 배 이상 증가했으며, AI 기반 모델이 전체 출하량의 78%를 차지했다. 메타는 현재 Ray-Ban과의 협업을 통해 73% 이상의 시장 점유율로 시장을 지배하고 있지만, 중국 제조업체들이 빠르게 추격하고 있다.​알리바바는 연말까지 Quark AI 안경을 출시한다고 발표했으며, 알리페이 결제 및 타오바오 가격 비교를 포함한 회사 생태계와의 통합 기능을 제공할 예정이다. 한편, 바이트댄스도 자체 AI 안경을 개발 중인 것으로 알려졌지만, 출시 일정은 확정되지 않았다. 경쟁업체들의 유입으로 업계 관찰자들은 2025년을 "수백 가지 스마트 안경의 전쟁"이 될 것으로 예측하고 있다.​이러한 시기는 중국 기술 기업들이 스마트폰과 기존 컴퓨팅 기기를 넘어 신흥 시장에서 입지를 구축하기 위해 경쟁하는 가운데, 바이두의 AI 하드웨어 진출 확대와 맞물려 있다.
2071 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)PNAS Nexus에 발표된 새로운 연구에 따르면, 소셜 네트워크에서 영향력 있는 사람들을 식별하도록 설계된 알고리즘이 특정 집단을 뒤처지게 만드는 정보 격차를 의도치 않게 만들 수 있다고 합니다. 이 연구는 이러한 알고리즘이 메시지 도달 범위를 극대화하는 데는 뛰어나지만, 취약한 인구 집단을 중요한 정보 수신에서 체계적으로 배제함으로써 기존의 사회적 불평등을 악화시킬 수 있다고 밝혔습니다.표준 알고리즘은 정보 격차를 만든다Vedran Sekara가 이끄는 연구팀은 마을의 가구 연결망, 정치 블로거 네트워크, 페이스북 친구 관계, 과학 협력 관계를 포함한 다양한 실제 소셜 네트워크에서 영향력 극대화 알고리즘을 테스트했습니다. 독립 캐스케이드 모델을 사용한 결과, 확산만을 극대화하는 데 집중하는 알고리즘은 특정 외부 집단이 중요한 메시지를 지속적으로 놓치게 되는 정보 격차를 만든다는 것을 발견했습니다.​이 연구는 이렇게 간과된 개인들을 "취약 노드"로 식별합니다. 이들은 알고리즘이 영향력 있는 네트워크 구성원을 통해 최대한 많은 사람들에게 도달하는 것을 우선시할 때 체계적으로 배제되는 사람들입니다. 이 발견은 공평한 정보 배포가 필수적인 공중 보건 캠페인, 사회 서비스 지원 활동, 긴급 통신에 중요한 시사점을 제공합니다.더 공정한 알고리즘이 가능성을 보여주다이러한 불평등을 해결하기 위해 연구자들은 정보 확산과 공정성을 모두 극대화하도록 설계된 다목적 알고리즘을 개발했습니다. 이 접근법은 표준 방법이 일반적으로 간과하는 네트워크 노드에 정보가 도달하도록 보장하려고 시도합니다. 보다 공정한 타겟팅 방법은 거의 동일한 전체 도달 범위를 유지하면서 취약한 노드를 6%에서 10% 줄이는 결과를 가져왔습니다.​이 연구는 디지털 플랫폼 전반에 걸친 알고리즘 편향에 대한 인식이 높아지는 가운데 이루어졌습니다. 이동성 데이터에 대한 Sekara의 광범위한 연구는 유사한 패턴을 드러냈으며, 알고리즘이 종종 부유하고 교육받은 인구를 선호하는 반면 여성, 노인, 어린이를 과소 대표하는 것으로 나타났습니다. Sekara의 이전 연구에 따르면, 일부 데이터셋에서 이동성 데이터의 절반은 가장 부유한 20%의 인구에서 나오는 반면, 가장 가난한 20%에서는 단 5%만 발생합니다.​알고리즘이 사회를 통해 정보가 확산되는 방식을 점점 더 형성함에 따라, 이 연구는 효율성과 함께 공정성을 우선시하는 것이 도달 범위를 크게 손상시키지 않으면서 디지털 불평등을 줄이는 데 도움이 될 수 있음을 시사합니다.
2425 조회
0 추천
2025.10.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입