Loading...

AI 뉴스

오픈AI는 AI 환각 현상이 훈련 유인에서 비롯된 것이라고 주장

페이지 정보

작성자 xtalfi
작성일 2025.09.08 14:40
1,830 조회
0 추천
0 비추천

본문

cb0530903b1cb0b4c9640ff1648be527dIpH.jpg

(퍼플렉시티가 정리한 기사)

OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.

조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.

 

과도한 확신 오류의 통계적 근원

이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다.

"환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.

구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.

 

이진 점수 체계는 추측 동기를 유발합니다

현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.

연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.

연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.

 

제안된 해결책: 명시적 신뢰도 목표

연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.

예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.

해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.

오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.

댓글 0
전체 1,248 / 296 페이지
중국 최대 검색엔진 운영사인 바이두가 인공지능을 활용해 동물의 울음소리를 인간 언어로 번역하는 혁신적인 기술을 개발 중이라고 로이터가 보도했습니다.바이두는 최근 중국국가지식산권국에 관련 기술에 대한 특허를 출원했으며, 공개된 특허 문서에 따르면 이 시스템은 동물의 울음소리뿐만 아니라 행동 패턴, 생리학적 신호 등 다양한 데이터를 수집한 후 이를 사전 처리하고 통합해 AI가 분석하는 방식으로 작동합니다.분석된 결과는 동물의 감정 상태를 파악하는 데 활용되며, 이 감정은 다시 의미 단위로 해석되어 인간의 언어로 번역됩니다.바이두는 특허 문서에서 이 시스템이 인간과 동물 간 감정적 소통과 이해를 한층 더 깊게 해주며 종을 뛰어넘는 커뮤니케이션의 정확성과 효율성을 개선할 것이라고 설명했습니다.바이두 대변인은 현재 여전히 연구 단계에 있다고 밝혔으며, 중국 SNS에서는 우리 집 강아지가 나한테 뭐라고 하는지 드디어 알게 될까라는 기대 섞인 반응과 함께 실제 현장에서 얼마나 정확하게 작동할지는 두고 봐야 한다는 회의적인 시선도 나타나고 있습니다.
2242 조회
0 추천
2025.08.04 등록
인공지능 휴머노이드 로봇이 그린 초상화가 경매 역사상 최고가에 낙찰되어 화제가 되고 있습니다.AFP통신 등 외신에 따르면 영국 런던 소더비 디지털 아트 세일 경매에서 세계 최초 초현실주의 로봇 아티스트 '아이다'가 그린 작품이 132만 달러(약 18억4700만원)에 팔렸다고 보도했습니다.'인공지능 신'이라는 제목의 이 작품은 컴퓨터 과학의 아버지로 불리는 영국 수학자 앨런 튜링의 얼굴을 그린 2.2m 크기의 대형 초상화입니다. 당초 경매 예상가는 18만 달러 정도였으나 실제 낙찰가는 예상의 7배를 넘어서는 기록적인 수준을 보였습니다.아이다는 2019년 근현대 미술 전문가 에이단 멜러가 옥스퍼드대학교와 버밍엄대학교 소속 AI 전문가들과 협업하여 개발한 로봇으로, 단발머리의 젊은 여성 외형을 하고 있으며 눈에 장착된 카메라와 로봇 팔을 이용해 직접 그림을 그립니다.소더비 측은 휴머노이드 로봇 아티스트가 경매에 출품한 최초의 작품이 기록적인 낙찰가를 기록한 것은 근현대 미술사의 한 획을 그은 것이라며 AI 기술과 국제 미술 시장의 교차점이 커지고 있음을 보여준 사례라고 평가했습니다.
2242 조회
0 추천
2025.08.04 등록
엘론 머스크의 xAI가 개발한 AI 챗봇 'Grok'이 6초 분량의 동영상을 생성하는 새로운 기능 'Imagine'을 공개했다.이 기능은 사용자 프롬프트에 따라 소리를 포함한 짧은 영상을 만들 수 있으며,성인용 및 나체 영상(‘spicy mode’)까지 제작이 가능하다는 점에서 논란이 되고 있다.현재 일부 직원들과 구독자들이 베타 테스트 중이며, 공식 출시일은 10월로 예정되어 있습니다.이 업데이트는 기존 Grok챗봇이 선정적인 AI '컴패니언'을 도입하면서 이미 논란에 휩싸인 상태에서발표되었고, 이 기능이 유명인 등 타인의 얼굴·이미지를 사실적으로 합성해 만든 '딥페이크' 영상 생산에 악용될 수 있다는 우려를 낳고 있다.
2437 조회
0 추천
2025.08.03 등록
애플 CEO 팀 쿡은 사내 전체 회의에서 AI가 스마트폰과 인터넷보다 더 큰 영향을 미칠 기술이라며 애플의 AI 우선순위를 강조했다.그는 애플이 PC, 스마트폰, 태블릿, MP3 플레이어 등에서 첫 번째가 아니었음에도 시장을 주도해왔다며, AI에서도 비슷한 혁신을 이룰 것이라고 밝혔다.애플은 소프트웨어 책임자 크레이그 페더리기는 Siri 아키텍처 개편이 기대 이상의 결과를 보이고 있다고 전했다. 이는 메타의 AI 전문가 스카우팅과 애플 내 사기 저하에 대응하기 위한 발언으로 보인다.
2300 조회
0 추천
2025.08.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입