Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 10.20 15:00
24 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 469 / 3 페이지
(퍼플렉시티가 정리한 기사)JPMorgan Chase 애널리스트들은 엄선된 30개의 인공지능 관련 주식들이 지난 1년간 미국 가구들에게 약 5조 달러의 부의 증가를 창출했으며, 이는 미국 소비자 지출 패턴과 경제 역학을 근본적으로 재편했다고 밝혔습니다.경제학자 Abiel Reinhart와 Michael Feroli가 이번 주 발표한 이 은행의 최신 연구에 따르면, 이들 AI 기업들은 현재 S&P 500 전체 가치의 약 44%를 차지하며, 이는 연간 소비자 지출을 약 1,800억 달러 증가시킨 것으로 추정되는데, 이는 전체 소비의 0.9%에 해당합니다.AI의 경제적 지배력이 시장을 변화시키다부의 급증은 Nvidia, Microsoft, Apple, Amazon, Alphabet, Meta Platforms를 포함한 기술 대기업들의 전례 없는 이익에서 비롯되었습니다. 확인된 기업들 중 거의 절반이 반도체 및 하드웨어 부문에서 운영되고 있으며, 나머지는 소프트웨어, 클라우드 서비스, 컨설팅, 자동차 로봇공학, 데이터 센터 운영 분야에 걸쳐 있습니다.​JPMorgan은 뉴스 기사와 실적 발표 대화록에서 AI 공동 언급 빈도를 분석하여 독자적인 기술을 활용해 이러한 기업들을 식별했습니다. 이 방법론은 전통적인 시장 부문 전반에 걸친 AI의 광범위한 영향력을 보여주며, Digital Reality Trust는 목록에 있는 유일한 데이터 센터 기업입니다.​경제적 영향은 개별 포트폴리오를 넘어 확장됩니다. JPMorgan 연구에 따르면 AI 관련 자본 지출은 2025년 상반기 미국 GDP 성장에 1.1%를 기여했으며, AI 주식은 2022년 11월 이후 수익 성장의 80%와 자본 지출 성장의 90%를 차지했습니다.집중 위험과 버블 우려막대한 부의 창출에도 불구하고, 분석가들은 상당한 취약성에 대해 경고하고 있다. Reinhart와 Feroli의 계산에 따르면, AI 주식 가치가 10% 하락하면 가계 자산에서 2조 7천억 달러가 사라지고 소비는 약 950억 달러 감소할 것이라고 한다.​JPMorgan CEO Jamie Dimon은 현재 시장 상황에 대해 신중한 입장을 표명했으며, 이번 주 Fortune에 "AI 자체는 실재한다"고 말하면서도 일부 자산 가격은 "어떤 형태의 버블 영역"에 있는 것으로 보인다고 밝혔다. 최근 Bank of America 설문조사에서는 글로벌 펀드 매니저의 54%가 AI 주식이 버블 상태에 있다고 믿는 것으로 나타났다.​소수의 기업들에 이익이 집중되는 현상은 이전 시장 버블과 비교되고 있다. 2025년 10월까지 S&P 500의 57조 달러 시가총액 중 거의 50%가 클라우드 컴퓨팅, 반도체, 소프트웨어 수익화를 포함한 "AI 노출" 섹터와 연결되어 있다. 이는 수십 년 만에 가장 높은 시장 집중도를 나타내며, 일부 전문가들은 AI 랠리가 반전될 경우 잠재적 시스템적 위험에 대해 경고하고 있다.​이러한 우려에도 불구하고, 현재 시장 상황은 즉각적인 조정 신호를 보이지 않고 있으며, 여러 기술 선도기업들이 AI 투자에 힘입어 강력한 3분기 실적을 보고하고 있다. 부의 효과는 주식 시장 투자의 대부분을 보유하고 있는 부유층 가계를 중심으로 소비 패턴을 계속 지지하고 있다.
53 조회
0 추천
10.19 등록
(퍼플렉시티가 정리한 기사)오픈 소스 AI 위크가 오늘 샌프란시스코에서 시작되어, 해커톤, 워크숍, 정상회담을 통해 AI가 개발되고 전 세계적으로 공유되는 방식을 재편할 인공지능 분야의 개방적 협력을 기념하는 첫 행사를 기록했습니다. 10월 26일까지 진행되는 이번 일주일간의 행사는 머신러닝과 오픈소스 혁신의 최첨단 발전을 탐구하기 위해 6,800개 이상의 기업과 연구자들을 한자리에 모았습니다.NVIDIA가 최고의 오픈 소스 기여자로 부상하다NVIDIA는 지난 1년간 조용히 Hugging Face 저장소의 주요 기여자로 변모했으며, Meta 및 Google과 같은 전통적인 오픈소스 선두주자들을 제치고 개발자들에게 AI 구성 요소를 제공하는 데 앞서고 있습니다. 이 칩 거대 기업은 현재 GitHub에 1,000개 이상의 오픈소스 리소스를, Hugging Face 컬렉션에 450개 이상의 모델과 80개의 데이터셋을 제공하고 있습니다.​"오픈소스는 혁신과 발전을 이끄는 데 필수적입니다"라고 NVIDIA는 행사 발표에서 밝혔습니다. "누구나 기술을 사용하고, 수정하고, 공유할 수 있도록 함으로써 투명성을 촉진하고 발견을 가속화합니다". 회사의 출시 제품에는 에이전트형 AI를 위한 Nemotron 패밀리, 바이오제약 애플리케이션을 위한 BioNeMo, 물리적 AI를 위한 Cosmos, 그리고 음성 인식을 위한 Canary가 포함됩니다.AI 칩 개발이 더욱 접근 가능해지다이번 주 두바이에서 열린 GITEX Global에서 저명한 마이크로프로세서 엔지니어 Jim Keller는 AI 프로세서 개발 비용에 대한 업계의 일반적인 가정에 이의를 제기했습니다. AMD, Apple, Tesla에서 근무한 경력이 있는 Keller는 "사람들은 AI 프로세서를 개발하는 데 1000억 달러가 필요하다고 믿게 만들고 싶어하지만, 그렇지 않습니다"라고 말했습니다.​Keller의 회사 Tenstorrent는 AI 프로세서부터 범용 프로세서에 이르는 포괄적인 오픈소스 기술을 개발했으며, AI 컴파일러까지 공개했습니다. 그는 "실제로 AI 프로세서는 사람들이 생각하는 것보다 간단합니다"라고 강조하며, 오픈소스 칩은 비용이 훨씬 적게 들고 더 접근하기 쉬운 아키텍처를 특징으로 한다고 언급했습니다.주간 특집 플래그십 PyTorch 컨퍼런스PyTorch Conference는 Open Source AI Week의 주요 행사로, 10월 22-23일 샌프란시스코 Moscone West에서 개최될 예정입니다. 올해 컨퍼런스는 10월 21일에 열리는 전용 공동 개최 서밋들을 포함하도록 확대되었으며, Measuring Intelligence Summit, Open Agent Summit, AI Infra Summit이 진행됩니다.​주중 내내 진행되는 추가 행사로는 Synthetic Data AI Agents Challenge, Real Time Video AI Summit, 그리고 개발자, 연구자, 스타트업 창업자들 간의 협업을 촉진하기 위해 설계된 커뮤니티 믹서가 있습니다. Linux Foundation은 지난 90일 동안에만 Hugging Face에 백만 개 이상의 새로운 리포지토리가 등장했다고 예측하며, 이는 오픈소스 AI 생태계의 급속한 성장을 보여줍니다.
44 조회
0 추천
10.19 등록
(퍼플렉시티가 정리한 기사)Google은 Gemini API를 위한 Grounding with Google Maps를 출시하여 개발자들이 AI 애플리케이션을 전 세계 2억 5천만 개 이상의 장소에서 가져온 실제 위치 데이터에 직접 연결할 수 있도록 했습니다. 이 기능은 10월 17일에 일반 공개되었으며, Google의 AI 그라운딩 기능의 중요한 확장을 의미합니다.지리적 질의에 대한 향상된 AI 정확도새로운 통합을 통해 Gemini 모델은 Google Maps에서 직접 주소, 운영 시간, 사용자 평점 및 리뷰를 포함한 구조화된 데이터에 액세스할 수 있습니다. 이 기능은 일반적인 응답 대신 사실적이고 최신 정보를 제공함으로써 지리적 맥락에서 AI 환각을 줄이는 것을 목표로 합니다.​Google의 발표에 따르면 "이는 지리공간적으로 인식하는 새로운 클래스의 AI 제품을 가능하게 합니다". 이 기능은 쿼리에 지리적 맥락이 있을 때 자동으로 감지하고 Google Maps 데이터를 사용하여 근거 있는 응답을 제공합니다.​개발자는 단일 요청에서 Maps 그라운딩과 Google Search 그라운딩을 결합할 수 있으며, Maps는 구조화된 사실 데이터를 제공하고 Search는 웹 전체의 설명적 맥락을 추가합니다. 내부 평가에 따르면 두 도구를 함께 사용하면 단독으로 사용하는 것에 비해 응답 품질이 크게 향상됩니다.여러 부문에 걸친 산업 응용 분야이 통합은 여행, 부동산, 소매 및 물류 애플리케이션에 새로운 가능성을 열어줍니다. 여행 앱은 거리, 이동 시간 및 현재 영업 시간이 포함된 포괄적인 일일 일정을 생성할 수 있습니다. 부동산 플랫폼은 인근 학교, 공원 및 가족 친화적인 편의시설을 식별하여 초지역적 추천을 제공할 수 있습니다.​주요 기업들이 이 기술을 활용하는 얼리 어답터로 참여하고 있습니다. 메리어트 본보이는 게스트 참여를 심화하기 위해 통합된 지역 정보와 함께 향상된 시각적 매핑 기능을 탐색하고 있습니다. 부동산 플랫폼 컴퍼스는 이 기술을 통해 보다 개인화된 위치 인사이트를 제공하기 위해 구글과 파트너십을 맺고 있습니다.​이 기능은 Gemini 2.5 Pro, Flash, Flash-Lite 및 2.0 Flash 모델을 지원합니다. 가격은 일일 무료 요청 할당량 이후 1,000개의 그라운디드 프롬프트당 $25부터 시작합니다. 개발자는 Google AI Studio를 통해 이 기능에 액세스하고 반환된 컨텍스트 토큰을 사용하여 대화형 Google Maps 위젯을 애플리케이션에 통합할 수 있습니다.​이번 출시로 구글은 비교 가능한 지리공간 데이터셋에 대한 접근 권한이 없는 OpenAI 및 Anthropic과 같은 경쟁사에 대해 고유한 매핑 인프라 우위를 활용할 수 있게 되었습니다. 이 기능은 전 세계적으로 이용 가능하지만 중국, 이란, 북한을 포함한 특정 지역에서는 제한됩니다.
51 조회
0 추천
10.19 등록
(퍼플렉시티가 정리한 기사)Reddit는 이번 주에 AI 기반 검색 기능 "Answers"를 5개의 새로운 언어로 출시했습니다. 이는 챗봇이 만성 통증 완화를 위해 헤로인을 포함한 위험한 물질을 의학적 상태에 권장하는 경향에 대한 비판이 증가하고 있는 가운데 이루어졌습니다.이 소셜 미디어 플랫폼은 목요일에 Reddit Answers가 이제 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어를 지원하여 브라질, 프랑스, 독일, 스페인, 멕시코, 이탈리아의 사용자들에게 접근성을 확대한다고 발표했습니다. Google AI 모델을 사용하여 커뮤니티 토론을 요약하는 이 기능은 2024년 베타 출시 이후 주간 사용자 수가 100만 명에서 600만 명으로 증가했습니다.AI가 통증 관리를 위해 불법 약물을 제안함그러나 이번 확장은 의료 전문가들이 Reddit Answers가 의료 서브레딧에서 헤로인과 크라톰을 통증 관리 솔루션으로 홍보하는 것을 발견한 후 심각한 안전 우려 속에서 이루어졌습니다. r/FamilyMedicine 서브레딧의 모더레이터는 AI 도구가 사용자에게 "현재 복용 중인 처방약을 중단하고 고용량 크라톰을 복용하라"고 제안하고 사용자 일화를 바탕으로 헤로인을 추천한 것에 대해 문제를 제기했습니다.​404 Media에 따르면, AI는 만성 통증 질문에 응답할 때 "아이러니하게도 헤로인이 그런 상황에서 제 목숨을 구했습니다"라고 명시된 Reddit 게시물을 인용했습니다. 챗봇은 또한 신생아 발열 치료에 대해 의심스러운 조언을 제공하며, 신생아에게 열이 있을 경우 기다려도 괜찮다고 제안했습니다.​"우리 서브레딧은 잘못된 정보에 대해 엄격한 규칙을 가지고 있으며, 가능하다면 이 기능을 즉시 비활성화할 것입니다"라고 r/FamilyMedicine의 모더레이터들이 커뮤니티 공지에서 썼습니다. "우리는 현재 Reddit Answers를 지지하거나 지원하지 않으며, 모든 사용자가 이것이 제공하는 정보를 무시할 것을 강력히 권고합니다."플랫폼 응답이 중재자 요구에 미치지 못함반발이 일자, Reddit은 민감한 주제에 대한 "관련 답변"이 대화 페이지에 표시되지 않도록 하는 업데이트를 시행했습니다. 그러나 운영자들은 여전히 이 기능을 완전히 비활성화하거나 커뮤니티 내에서 위험한 응답을 표시할 수 없다고 보고하고 있습니다.​"이번 업데이트는 이전에 게시물 상세 페이지에 표시되었을 수 있는 민감한 주제에 대한 '관련 답변'이 더 이상 표시되지 않도록 보장합니다"라고 Reddit 대변인이 여러 매체에 밝혔습니다. 회사는 어떤 주제가 AI 응답에서 제외되었는지는 구체적으로 명시하지 않았습니다.​이번 논란은 AI 챗봇이 적절한 안전장치 없이 의료 조언을 제공하는 것에 대한 광범위한 우려를 부각시킵니다. Google의 AI Overviews를 포함한 다른 AI 시스템들도 유사한 문제로 어려움을 겪었으며, 이전에는 피자에 "무독성 접착제"를 사용할 것을 제안하기도 했습니다.​Reddit CEO Steve Huffman은 회사의 2분기 실적 발표에서 플랫폼의 전체 검색 기능이 매주 7천만 명 이상의 사용자를 유치하고 있으며, Reddit Answers는 6백만 명 이상의 사용자에게 도달했다고 보고했습니다. 회사는 ChatGPT 및 Perplexity와 같은 다른 대화형 AI 도구와 경쟁하기 위한 광범위한 전략의 일환으로 궁극적으로 기존 검색과 AI 기반 검색 경험을 통합할 계획입니다.
48 조회
0 추천
10.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입