Loading...

AI 뉴스

OpenAI, 허위 수학 돌파구 주장 철회

페이지 정보

작성자 xtalfi
작성일 2025.10.20 15:00
443 조회
0 추천
0 비추천

본문

4371dc37d22a243c03a55d9f1212fc34uFwO.jpeg

(퍼플렉시티가 정리한 기사)

OpenAI 연구원들은 자사의 GPT-5 모델이 이전에 풀리지 않은 수학 문제를 해결했다고 거짓 주장한 후 이번 주 경쟁사와 수학자들로부터 거센 비판을 받았으며, AI가 단지 정교한 문헌 검색을 수행했을 뿐이라는 사실이 드러나자 서둘러 주장을 철회했습니다.

 

부풀려진 주장은 빠르게 무너진다

 

논란은 OpenAI 부사장 Kevin Weil이 소셜 미디어에 GPT-5가 "이전에 풀리지 않았던 에르되시 문제 10개(!)의 해법을 찾았고 다른 11개 문제에서도 진전을 이뤘다"고 게시하면서 시작되었다. Weil이 나중에 삭제한 이 게시물은 OpenAI 연구원 Sebastien Bubeck에 의해 증폭되었고, 그는 "AI를 통한 과학 가속화가 공식적으로 시작되었다"고 선언했다.​

권위 있는 ErdősProblems.com 웹사이트를 운영하는 수학자 Thomas Bloom이 이 문제들이 실제로는 미해결 문제가 아니었다고 해명하면서 주장은 빠르게 무너졌다. "GPT-5는 이 문제들을 해결한 참고문헌들을 찾았는데, 제가 개인적으로 알지 못했던 것들이었습니다"라고 Bloom은 설명했다. 그의 웹사이트에 있는 "미해결(open)" 표시는 단순히 그가 개인적으로 기존 해법을 알지 못한다는 의미였지, 수학계가 이를 활발한 연구 과제로 간주한다는 의미가 아니었다.

 

업계 리더들의 반격

 

이 실수는 OpenAI의 주요 경쟁사들로부터 날카로운 비난을 받았다. 노벨상 수상자인 Google DeepMind CEO Demis Hassabis는 이 사건을 간결하게 "당혹스럽다(embarrassing)"고 말했다. Meta의 수석 AI 과학자 Yann LeCun은 더욱 신랄한 비판을 내놓았는데, 이 상황을 OpenAI가 "자신들의 GPTards에 의해 당했다(hoisted by their own GPTards)"고 묘사했다 – 이는 "자신이 판 함정에 빠지다(hoisted by your own petard)"라는 문구를 활용한 영리한 프랑스식 언어유희이다.​

Bubeck은 결국 오류를 인정하며 "문헌에 있는 해결책만 발견되었다"고 시인했다. 그러나 문헌 검색이 어렵다고 주장하며 자신의 주장을 만회하려는 그의 시도는 비평가들에게 먹히지 않았는데, 이들은 이것이 OpenAI가 GPT-5로 약속해온 획기적인 능력을 거의 대표하지 못한다고 지적했다.

 

경쟁 환경에서의 신뢰성 질문

 

이 사건은 AI 업계의 광범위한 긴장을 부각시키는데, 기업들이 추론 능력을 입증하기 위해 경쟁하고 있는 상황이다. OpenAI와 Google DeepMind는 올해 모두 합법적인 수학적 돌파구를 달성했으며, 두 회사의 시스템 모두 국제수학올림피아드에서 금메달 점수를 획득했다. 그러나 거짓 에르되시 주장은 진정한 과학적 진보를 훼손할 위험이 있다.​

이 논란은 비평가들이 OpenAI의 과장된 발표 패턴으로 보는 것을 반영한다. 한 업계 관찰자가 지적했듯이, "문헌 검색이 새로운 지식의 발견과 혼동된다면, 신뢰성이 손상될 것이다". 이 사건은 AI 기업들이 수학적 발견을 발표할 때의 검증 기준에 대한 의문을 제기하며, 특히 경쟁적인 AI 환경에서 수십억 달러가 걸려 있다는 점을 고려할 때 더욱 그러하다.

댓글 0
전체 834 / 83 페이지
(퍼플렉시티가 정리한 기사)삼성은 오늘 Galaxy XR 헤드셋을 $1,800에 공식 출시했으며, 이는 구글의 새로운 Android XR 운영 체제의 데뷔를 알리고 애플의 Vision Pro에 대한 보다 저렴한 대안으로 이 기기를 포지셔닝합니다. 이 헤드셋은 확장 현실 기기를 위한 개방형 생태계를 구축하기 위한 삼성, 구글, 그리고 퀄컴 간의 협력의 결과물을 나타냅니다.기술 사양 및 특징Galaxy XR은 3,552 x 3,840 픽셀의 해상도를 가진 4K 마이크로 OLED 디스플레이를 특징으로 하며 최대 90Hz의 주사율을 지원합니다. Qualcomm의 Snapdragon XR2+ Gen 2 칩셋으로 구동되고 16GB RAM을 장착한 이 헤드셋은 545그램의 무게로, 750-800그램인 Apple의 Vision Pro보다 훨씬 가볍습니다.​주요 기능으로는 핸드 트래킹, 아이 트래킹, 페이스 트래킹, 깊이 센서가 있으며, 자동 모터식 동공 간 거리 조정 기능을 갖추고 있습니다. 이 기기는 외부 연결형 배터리 팩을 통해 일반 사용 시 약 2시간 또는 동영상 재생 시 2.5시간을 제공합니다. Google의 Gemini AI 어시스턴트가 시스템 수준에서 통합되어 사용자가 음성, 손동작, 눈동자 움직임을 통해 기기를 제어할 수 있습니다.시장 포지셔닝 및 가용성$1,800의 Galaxy XR은 Apple의 $3,500 Vision Pro 가격의 거의 절반 수준이지만, 컨트롤러는 추가로 $250에 별도 판매됩니다. 이 헤드셋은 현재 미국과 한국에서만 삼성 웹사이트와 삼성 체험 스토어를 통해 구매할 수 있습니다.​삼성은 이 기기를 스마트 안경 및 기타 폼 팩터를 포함할 더 광범위한 Android XR 생태계의 첫 번째 제품으로 목표하고 있습니다. 이 플랫폼은 Google Play 스토어의 친숙한 Android 앱과 함께 AI를 사용하여 2D 콘텐츠를 3D로 변환할 수 있는 XR 최적화 버전의 Google 지도, YouTube 및 Google 포토를 지원합니다.​얼리 바이어는 12개월간의 Google AI Pro, YouTube Premium, Google Play Pass 및 NBA League Pass가 포함된 "The Explorer Pack"을 받으며, 그 가치는 $1,000 이상입니다. 이번 출시는 기존 Android 개발자 생태계와 게임 개발을 위한 Unity 지원을 활용하면서 Apple의 공간 컴퓨팅 플랫폼과 경쟁하려는 Google의 전략을 나타냅니다.
356 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)크래프톤이 30일 서울 코엑스에서 열리는 엔비디아 '지포스 게이머 페스티벌'에서 차세대 AI 게임 기술을 선보인다. 이번 행사에서 공개될 'PUBG 앨라이'는 기존 게임 캐릭터의 패러다임을 완전히 바꿀 혁신적 기술로 주목받고 있다.​22일 크래프톤에 따르면, 이강욱 AI 본부장이 엔비디아와 공동 개발한 AI 협업모델 CPC(Co-Playable Character) 사례인 'PUBG 앨라이'의 개발 현황을 발표한다. CPC는 올해 1월 CES 2025에서 첫 선보인 기술로, 엔비디아 ACE로 구축된 게임 특화 온디바이스 소형 언어 모델을 기반으로 한다.기존 NPC를 넘어선 진화기존 NPC(Non-Player Character)와 달리 CPC는 플레이어와 적극적으로 소통하며 함께 사고하고 협력한다. AI 캐릭터가 상황을 판단하고 전략을 수립하는 등 인간 플레이어와 유사한 지능적 행동이 가능하다는 점이 특징이다.​​크래프톤은 지난 3월 스팀을 통해 얼리 액세스로 출시한 '인조이'에서 첫 CPC인 '스마트 조이'를 실험적으로 선보인 바 있다. 스마트 조이는 캐릭터들이 주변 환경과 상호작용하며 상황에 맞는 행동을 취하고, 서로 대화를 나누며 관계를 형성하는 기능을 구현했다.게임 산업의 새로운 전환점이번 '지포스 게이머 페스티벌'은 한국에서의 지포스 25주년을 기념하는 행사로, 30일 오후 4시부터 코엑스 K-POP 광장에서 진행된다. RTX 게임 체험 공간과 신작 발표, 걸그룹 르세라핌의 공연 등 다양한 프로그램이 준비되어 있다.​크래프톤 관계자는 "AI 협업 캐릭터는 게임의 몰입도와 감정적 연결을 새롭게 정의하는 핵심 기술"이라며 "전 세계 게이머들이 AI와 함께 플레이하는 새로운 형태의 게임 경험을 직접 확인하게 될 것"이라고 말했다. 양사는 이번 행사를 계기로 AI 기술 협력을 더욱 강화해 나갈 계획이다.
368 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)LG전자가 22일 인공지능(AI) 홈 허브 'LG 씽큐 온(ThinQ ON)'의 국내 판매를 시작한다고 발표했다. 온라인브랜드샵을 시작으로 다양한 온오프라인 채널에서 순차 판매되는 이번 출시는 생성형 AI를 활용한 본격적인 AI홈 시대의 개막을 알린다.일상 대화로 집 전체를 제어하는 AI 허브씽큐 온의 출하가는 24만6000원으로 책정됐으며, 함께 출시되는 LG IoT 디바이스는 4만원부터 51만3000원까지 다양한 가격대로 구성됐다. 이 제품은 생성형 AI를 탑재해 고객과 일상 언어로 대화하며 맥락을 이해하고, 생활 패턴을 학습·예측해 최적의 환경을 조성한다.​예를 들어 "하이 엘지, 에어컨 끄고 로봇 청소기 돌려줘. 그리고 한 시간 후에 제습기 틀어줘"라는 복잡한 명령도 기억하고 순차적으로 실행한다. 또한 "침실에 있는 조명 모두 꺼줘" 같은 공간별 제어도 가능하다.맞춤형 패키지와 보안 시스템 적용LG전자는 고객의 라이프스타일에 맞춘 AI홈 패키지도 함께 선보인다. 최적의 수면 환경을 위한 '웰슬리핑(Well-Sleeping)' 패키지는 씽큐 온과 스마트 조명 스위치, 스마트 전구 등으로 구성되어 취침 시간에 맞춰 조명이 서서히 어두워지고 에어컨과 공기청정기가 저소음 모드로 동작한다.​'스마트스타트(Smart Start)' 패키지는 스마트 버튼, 공기질 센서, 온습도 센서, 도어 센서, 모션·조도 센서, 스마트 플러그, 스마트 조명 스위치, 스마트 도어락 등 8종의 IoT 디바이스를 포함해 집 전체를 AI홈으로 구성할 수 있다.​보안 측면에서는 자체 보안 시스템인 'LG 쉴드(LG Shield)'를 적용해 AI 가전 및 IoT 기기의 안전한 연결과 데이터 보호를 보장한다.​류재철 LG전자 HS사업본부장은 "LG 씽큐 온은 일상 대화를 통해 마치 친구처럼 공감하며 소통하는 AI홈의 핵심 허브"라며 "생성형 AI로 가전을 제어하고 고객에게 필요한 서비스를 제안하는 차별화된 AI홈 고객 경험을 제공할 것"이라고 밝혔다.​글로벌 시장조사기관 인사이트에이스 애널리틱스에 따르면, AI 기반 글로벌 스마트홈 시장은 올해부터 연평균 21.3%씩 성장해 2034년에는 1041억달러(약 149조원) 규모에 달할 것으로 전망된다.
360 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.특화된 AI 애플리케이션의 주요 비용 절감UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.혁신적인 이중 레벨 최적화 접근법BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.
379 조회
0 추천
2025.10.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입