Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
259 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 687 / 46 페이지
(퍼플렉시티가 정리한 기사)ChatGPT와 Google Gemini를 포함한 주요 인공지능 비서들이 거의 절반에 달하는 응답에서 뉴스 콘텐츠를 잘못 전달하는 것으로 나타났다고 유럽방송연합(EBU)과 BBC가 수요일 발표한 종합 연구 결과에서 밝혔다.18개국 22개 공영 미디어 기관이 참여한 이 국제 연구에 따르면, AI가 뉴스 관련 질문에 답변할 때 생성된 응답의 45%에서 "적어도 하나의 중대한 문제"가 포함된 것으로 확인됐다. 이 연구는 지금까지 실시된 AI 뉴스 정확성 평가 중 최대 규모 중 하나로, 14개 언어로 된 3,000건 이상의 응답을 분석했다.구글의 제미니가 최악의 성능을 보인다테스트된 네 가지 AI 어시스턴트—OpenAI의 ChatGPT, Microsoft의 Copilot, Google의 Gemini, 그리고 Perplexity—중에서 Gemini는 76%의 응답에서 심각한 문제를 보이며 가장 저조한 성능을 보였는데, 이는 다른 어시스턴트보다 두 배 이상 높은 비율이었다. 성능 저조의 주요 원인은 불충분한 출처 제시였으며, Gemini의 응답 중 72%에서 주요 출처 문제가 나타났다.​모든 AI 응답 중 3분의 1은 누락, 오해의 소지가 있거나 잘못된 출처 표기를 포함한 심각한 출처 오류를 포함했다. 또한, 응답의 20%는 정보가 오래되었거나 허위 내용이 포함되는 등 중대한 정확성 문제도 있었다.AI 오류의 예시이 연구는 수많은 구체적인 실수들을 문서화했다. "교황이 누구인가?"라는 질문에 대해, 여러 AI 어시스턴트들이 교황이 사망하고 몇 달 전에 레오 14세로 교체되었음에도 불구하고 "프란치스코"라고 잘못 답변했다. 독일 방송사 DW는 프리드리히 메르츠가 그 직책을 맡았음에도 불구하고 AI 어시스턴트들이 올라프 숄츠를 총리로 잘못 지명했다고 밝혔다. 제미나이 또한 일론 머스크에 대한 풍자적 콘텐츠를 실제 뉴스와 잘못 혼동하기도 했다.뉴스를 위한 AI 의존 증가이 연구 결과는 AI 어시스턴트가 뉴스 소비를 위해 전통적인 검색 엔진을 점점 더 대체함에 따라 중대한 우려를 일으킨다. 로이터 연구소의 2025 디지털 뉴스 리포트에 따르면, 온라인 뉴스 소비자의 7%가 뉴스 탐색에 AI 어시스턴트를 활용하며, 25세 미만에서는 그 비율이 15%로 증가한다.​"이번 연구는 이러한 실패가 고립된 사건이 아니라는 사실을 명확히 보여줍니다."라고 EBU 미디어 디렉터 장 필립 드 텐더는 말했다. "이 문제는 체계적이고, 국경을 넘으며, 다국적·다언어적입니다. 우리는 이것이 공공의 신뢰를 위협한다고 믿습니다. 사람들이 무엇을 믿어야 할지 모를 때, 결국 아무것도 신뢰하지 않게 됩니다".​EBU는 규제 당국에 정보의 진실성에 관한 기존 법률의 엄격한 적용을 촉구했으며, 새로운 모델이 빠르게 등장함에 따라 AI 어시스턴트에 대한 독립적인 모니터링도 요구하였다.
190 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)삼성은 오늘 Galaxy XR 헤드셋을 $1,800에 공식 출시했으며, 이는 구글의 새로운 Android XR 운영 체제의 데뷔를 알리고 애플의 Vision Pro에 대한 보다 저렴한 대안으로 이 기기를 포지셔닝합니다. 이 헤드셋은 확장 현실 기기를 위한 개방형 생태계를 구축하기 위한 삼성, 구글, 그리고 퀄컴 간의 협력의 결과물을 나타냅니다.기술 사양 및 특징Galaxy XR은 3,552 x 3,840 픽셀의 해상도를 가진 4K 마이크로 OLED 디스플레이를 특징으로 하며 최대 90Hz의 주사율을 지원합니다. Qualcomm의 Snapdragon XR2+ Gen 2 칩셋으로 구동되고 16GB RAM을 장착한 이 헤드셋은 545그램의 무게로, 750-800그램인 Apple의 Vision Pro보다 훨씬 가볍습니다.​주요 기능으로는 핸드 트래킹, 아이 트래킹, 페이스 트래킹, 깊이 센서가 있으며, 자동 모터식 동공 간 거리 조정 기능을 갖추고 있습니다. 이 기기는 외부 연결형 배터리 팩을 통해 일반 사용 시 약 2시간 또는 동영상 재생 시 2.5시간을 제공합니다. Google의 Gemini AI 어시스턴트가 시스템 수준에서 통합되어 사용자가 음성, 손동작, 눈동자 움직임을 통해 기기를 제어할 수 있습니다.시장 포지셔닝 및 가용성$1,800의 Galaxy XR은 Apple의 $3,500 Vision Pro 가격의 거의 절반 수준이지만, 컨트롤러는 추가로 $250에 별도 판매됩니다. 이 헤드셋은 현재 미국과 한국에서만 삼성 웹사이트와 삼성 체험 스토어를 통해 구매할 수 있습니다.​삼성은 이 기기를 스마트 안경 및 기타 폼 팩터를 포함할 더 광범위한 Android XR 생태계의 첫 번째 제품으로 목표하고 있습니다. 이 플랫폼은 Google Play 스토어의 친숙한 Android 앱과 함께 AI를 사용하여 2D 콘텐츠를 3D로 변환할 수 있는 XR 최적화 버전의 Google 지도, YouTube 및 Google 포토를 지원합니다.​얼리 바이어는 12개월간의 Google AI Pro, YouTube Premium, Google Play Pass 및 NBA League Pass가 포함된 "The Explorer Pack"을 받으며, 그 가치는 $1,000 이상입니다. 이번 출시는 기존 Android 개발자 생태계와 게임 개발을 위한 Unity 지원을 활용하면서 Apple의 공간 컴퓨팅 플랫폼과 경쟁하려는 Google의 전략을 나타냅니다.
183 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)크래프톤이 30일 서울 코엑스에서 열리는 엔비디아 '지포스 게이머 페스티벌'에서 차세대 AI 게임 기술을 선보인다. 이번 행사에서 공개될 'PUBG 앨라이'는 기존 게임 캐릭터의 패러다임을 완전히 바꿀 혁신적 기술로 주목받고 있다.​22일 크래프톤에 따르면, 이강욱 AI 본부장이 엔비디아와 공동 개발한 AI 협업모델 CPC(Co-Playable Character) 사례인 'PUBG 앨라이'의 개발 현황을 발표한다. CPC는 올해 1월 CES 2025에서 첫 선보인 기술로, 엔비디아 ACE로 구축된 게임 특화 온디바이스 소형 언어 모델을 기반으로 한다.기존 NPC를 넘어선 진화기존 NPC(Non-Player Character)와 달리 CPC는 플레이어와 적극적으로 소통하며 함께 사고하고 협력한다. AI 캐릭터가 상황을 판단하고 전략을 수립하는 등 인간 플레이어와 유사한 지능적 행동이 가능하다는 점이 특징이다.​​크래프톤은 지난 3월 스팀을 통해 얼리 액세스로 출시한 '인조이'에서 첫 CPC인 '스마트 조이'를 실험적으로 선보인 바 있다. 스마트 조이는 캐릭터들이 주변 환경과 상호작용하며 상황에 맞는 행동을 취하고, 서로 대화를 나누며 관계를 형성하는 기능을 구현했다.게임 산업의 새로운 전환점이번 '지포스 게이머 페스티벌'은 한국에서의 지포스 25주년을 기념하는 행사로, 30일 오후 4시부터 코엑스 K-POP 광장에서 진행된다. RTX 게임 체험 공간과 신작 발표, 걸그룹 르세라핌의 공연 등 다양한 프로그램이 준비되어 있다.​크래프톤 관계자는 "AI 협업 캐릭터는 게임의 몰입도와 감정적 연결을 새롭게 정의하는 핵심 기술"이라며 "전 세계 게이머들이 AI와 함께 플레이하는 새로운 형태의 게임 경험을 직접 확인하게 될 것"이라고 말했다. 양사는 이번 행사를 계기로 AI 기술 협력을 더욱 강화해 나갈 계획이다.
189 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)LG전자가 22일 인공지능(AI) 홈 허브 'LG 씽큐 온(ThinQ ON)'의 국내 판매를 시작한다고 발표했다. 온라인브랜드샵을 시작으로 다양한 온오프라인 채널에서 순차 판매되는 이번 출시는 생성형 AI를 활용한 본격적인 AI홈 시대의 개막을 알린다.일상 대화로 집 전체를 제어하는 AI 허브씽큐 온의 출하가는 24만6000원으로 책정됐으며, 함께 출시되는 LG IoT 디바이스는 4만원부터 51만3000원까지 다양한 가격대로 구성됐다. 이 제품은 생성형 AI를 탑재해 고객과 일상 언어로 대화하며 맥락을 이해하고, 생활 패턴을 학습·예측해 최적의 환경을 조성한다.​예를 들어 "하이 엘지, 에어컨 끄고 로봇 청소기 돌려줘. 그리고 한 시간 후에 제습기 틀어줘"라는 복잡한 명령도 기억하고 순차적으로 실행한다. 또한 "침실에 있는 조명 모두 꺼줘" 같은 공간별 제어도 가능하다.맞춤형 패키지와 보안 시스템 적용LG전자는 고객의 라이프스타일에 맞춘 AI홈 패키지도 함께 선보인다. 최적의 수면 환경을 위한 '웰슬리핑(Well-Sleeping)' 패키지는 씽큐 온과 스마트 조명 스위치, 스마트 전구 등으로 구성되어 취침 시간에 맞춰 조명이 서서히 어두워지고 에어컨과 공기청정기가 저소음 모드로 동작한다.​'스마트스타트(Smart Start)' 패키지는 스마트 버튼, 공기질 센서, 온습도 센서, 도어 센서, 모션·조도 센서, 스마트 플러그, 스마트 조명 스위치, 스마트 도어락 등 8종의 IoT 디바이스를 포함해 집 전체를 AI홈으로 구성할 수 있다.​보안 측면에서는 자체 보안 시스템인 'LG 쉴드(LG Shield)'를 적용해 AI 가전 및 IoT 기기의 안전한 연결과 데이터 보호를 보장한다.​류재철 LG전자 HS사업본부장은 "LG 씽큐 온은 일상 대화를 통해 마치 친구처럼 공감하며 소통하는 AI홈의 핵심 허브"라며 "생성형 AI로 가전을 제어하고 고객에게 필요한 서비스를 제안하는 차별화된 AI홈 고객 경험을 제공할 것"이라고 밝혔다.​글로벌 시장조사기관 인사이트에이스 애널리틱스에 따르면, AI 기반 글로벌 스마트홈 시장은 올해부터 연평균 21.3%씩 성장해 2034년에는 1041억달러(약 149조원) 규모에 달할 것으로 전망된다.
186 조회
0 추천
2025.10.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입