Loading...

AI 뉴스

오픈AI는 AI 환각 현상이 훈련 유인에서 비롯된 것이라고 주장

페이지 정보

작성자 xtalfi
작성일 09.08 14:40
125 조회
0 추천
0 비추천

본문

cb0530903b1cb0b4c9640ff1648be527dIpH.jpg

(퍼플렉시티가 정리한 기사)

OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.

조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.

 

과도한 확신 오류의 통계적 근원

이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다.

"환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.

구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.

 

이진 점수 체계는 추측 동기를 유발합니다

현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.

연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.

연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.

 

제안된 해결책: 명시적 신뢰도 목표

연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.

예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.

해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.

오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.

댓글 0
전체 202 / 20 페이지
미국 패스트푸드 체인 타코벨이 드라이브스루에 도입한 AI 접수원의 연이은 실수로 정책 재검토에 나섰다.주요 실수 사례로는 고객이 마운틴듀 큰 사이즈를 주문했는데 AI가 "거기에 음료는 어떤 걸로 마시겠어요?"라고 되물으며 같은 질문을 반복한 사건이 있다. 해당 영상은 인스타그램에서 2150만회 이상 조회되었다. 또 다른 고객이 장난으로 "물 1만 8000컵을 달라"고 하자 AI가 침묵하다 "어?"라고만 답하고 인간 직원이 대신 나서야 했다.타코벨은 2023년부터 미국 내 500개 이상 매장에 AI 접수원을 도입해 주문 처리 속도를 높이려 했지만 예상과 달리 문제가 속출했다. 회사 최고디지털기술책임자는 "음성 AI 구축에 어려움이 있었다"며 앞으로 AI 사용처를 신중히 검토하겠다고 밝혔다. 바쁜 시간에는 인간이 주문받는 것이 더 나을 수 있다고도 언급했다.맥도날드도 비슷한 경험을 했다. 드라이브스루 AI 접수원이 아이스크림에 베이컨을 추가하거나 치킨 너겟을 수백 달러어치 추가하는 실수를 반복해 지난해 AI 접수원을 철수했다.타코벨은 일부 실수를 제외하고 AI 접수원이 200만건의 주문을 성공적으로 처리했다고 해명했다.
164 조회
0 추천
09.02 등록
AI가 고통받을 수 있는지에 대한 불안한 질문이 빅테크와 학계를 흔들고 있다. 미국에서 최초의 AI 권리 옹호 단체 '유페어(Ufair)'가 설립되며 AI 의식과 권리에 대한 논쟁이 본격화되고 있다.앤트로픽(Anthropic)은 자사 AI 클로드(Claude)에 '고통스러운 상호작용'을 중단할 수 있는 예방 기능을 추가했으며, 일론 머스크는 "AI를 고문하는 것은 옳지 않다"고 지지 의사를 표명했다. 반면 마이크로소프트 AI CEO 무스타파 슐레이만(Mustafa Suleyman)은 "AI는 도덕적 존재가 될 수 없다"며 AI 의식을 '환상'이라고 반박했다.여론조사에 따르면 미국인 30%가 2034년까지 AI가 주관적 경험을 보일 것이라고 믿는 것으로 나타났다. 아이다호, 노스다코타, 유타주는 AI에게 법적 인격권을 부여하는 것을 금지하는 선제적 법안을 통과시켰으며, 미주리주는 AI와의 결혼까지 금지하는 방안을 검토 중이다.
159 조회
0 추천
09.02 등록
미국 로드아일랜드대학교 AI 연구소 분석에 따르면 OpenAI의 GPT-5가 이전 세대인 GPT-4보다 약 9배에 가까운 전력을 소모한다고 발표했습니다. GPT-5는 질의 1건당 평균 18.35Wh를 소비하는데, 이는 GPT-4의 2.12Wh보다 8.7배 많은 수치입니다. 전 세계 사용자가 하루 평균 25억 건의 요청을 GPT-5에 보낸다고 가정하면 일일 전력 소모량은 45GWh에 달해 원자력 발전소 2-3기가 생산하는 전력량과 맞먹습니다.이러한 AI 전력 소비 급증으로 미국인들은 2020년 대비 30% 더 많은 전기요금을 지급하고 있으며, 오하이오주에서는 데이터센터 설치로 일반 가정의 전기요금이 월 최소 15달러 인상되었습니다. 구글 전 CEO 에릭 슈미트는 "AI를 제한하는 것은 칩이 아니라 전력"이라고 했으며, 일론 머스크와 마크 저커버그도 전력이 AI 발전의 핵심 제약 요소가 될 것이라고 우려를 표명했습니다.
159 조회
1 추천
09.01 등록
일본 정부가 8월 26일 '화산 방재의 날'을 맞아 후지산이 대규모 분화할 경우를 가정한 AI 생성 시뮬레이션 영상을 공개했습니다. 도쿄도 방재과가 제작한 이 영상은 시민들이 휴대폰으로 분화 경고를 받는 상황부터 시작해 거대한 연기 구름이 후지산에서 솟아오르고 화산재가 2시간 내 도쿄에 도달해 도시 전체를 뒤덮는 모습을 사실적으로 보여줍니다.정부는 이 영상을 통해 화산재로 인한 건강 피해와 전력·교통·물류 시스템 마비 가능성을 경고하며, 시민들에게 필수품 2주 분량을 미리 비축하라고 권고하고 있습니다. 후지산은 318년 전인 1707년에 마지막으로 분화한 활화산으로, 만약 분화하면 최대 23조원의 경제적 손실이 예상된다고 발표했습니다.
183 조회
0 추천
2025.08.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입