Loading...

AI 뉴스

오픈AI는 AI 환각 현상이 훈련 유인에서 비롯된 것이라고 주장

페이지 정보

작성자 xtalfi
작성일 2025.09.08 14:40
3,475 조회
0 추천
0 비추천

본문

cb0530903b1cb0b4c9640ff1648be527dIpH.jpg

(퍼플렉시티가 정리한 기사)

OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.

조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.

 

과도한 확신 오류의 통계적 근원

이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다.

"환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.

구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.

 

이진 점수 체계는 추측 동기를 유발합니다

현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.

연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.

연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.

 

제안된 해결책: 명시적 신뢰도 목표

연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.

예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.

해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.

오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.

댓글 0
전체 1,366 / 340 페이지
LG전자가 "Radio Optimism" 이라는 이름으로 AI 음악생성 이벤트를 진행하고 있네요.https://radiooptimism.lg.com/ko누구나 쉽게 음악을 만들고 이를 공유하는 이벤트로 간단히 분위기와 장르 등을 선택하면 곡을 만들어줍니다..https://live.lge.co.kr/2508-lg-radio-optimism/
3219 조회
3 추천
2025.08.18 등록
앤트로픽의 클로드는 두 가지 주요 기능 업데이트로 주목받고 있습니다.첫 번째는 메모리 기능입니다. 이 기능은 사용자가 요청할 때만 과거 대화를 검색하여 요약하고 프로젝트를 연결할 수 있게 해줍니다. 설정 메뉴의 프로필에서 채팅 검색 및 참조를 활성화하면 휴가 전 진행했던 대화 내용을 불러와 "계속 같은 프로젝트를 진행하겠는가"라고 제안하는 방식으로 작동합니다. 이는 오픈AI의 지속적 메모리와 달리 개인 프로필을 만들지 않고 업무 효율성에만 집중한 점이 특징입니다.두 번째는 아티팩트(Artifacts) 기능의 대폭 업그레이드입니다. 이 기능을 통해 사용자는 코딩 지식 없이도 실제 작동하는 앱을 만들 수 있습니다. 예를 들어 "주제를 고르면 자동으로 암기장을 생성해 주는 플래시카드 앱을 만들어줘"라고 요청하면 클로드가 사용자 맞춤형 AI 기반 교육 앱을 바로 구현합니다. 지금까지 5억 건 이상의 아티팩트가 생성되었으며, 생산성 도구부터 교육용 게임, 음악 창작 앱까지 다양한 콘텐츠가 포함됩니다. 무료 계정을 포함한 모든 사용자가 이용할 수 있으며, 생성된 앱을 웹에 공유하고 다른 사용자가 수정하고 재사용할 수 있습니다.
3565 조회
0 추천
2025.08.18 등록
오픈AI는 사용자 의견을 수용하여 챗GPT의 모델 선택 메뉴를 되살렸습니다. 이제 사용자는 자동, 빠름, 싱킹(Thinking) 세 가지 모드 중에서 선택할 수 있습니다. 자동 모드는 쿼리에 따라 추론과 비추론 모델이 알아서 선택되며, 빠름 모드는 비추론 모델을 활용합니다. 싱킹 모드는 답변에 더 많은 컴퓨팅을 소모하고 출력 시간이 더 걸리는 추론 모델을 의미합니다.유료 사용자들은 지원이 중단된 GPT-4o와 GPT-4.1, o3 등 기존 모델과 새로 추가된 GPT-5 싱킹 미니 등을 이용할 수 있습니다. GPT-4o는 모델 선택기에 기본으로 포함되며, 다른 모델은 설정에서 추가할 수 있습니다. 샘 알트먼 CEO는 GPT-5에 적용된 4가지 개성을 더 따뜻한 느낌을 주면서도 불편하지 않도록 업그레이드하겠다고 밝혔습니다.이러한 업데이트들은 AI 도구들이 단순한 질문 답변을 넘어 실제 업무 환경에서 활용할 수 있는 실용적인 기능들로 진화하고 있음을 보여줍니다. 특히 사용자의 작업 흐름을 이해하고 지원하는 방향으로 발전하고 있어, 앞으로 AI 도구들이 개인 비서나 업무 파트너 역할을 더욱 효과적으로 수행할 것으로 예상됩니다.이 기능은 좌측 상단의 ChatGPT 5 버튼을 클릭하여 선택 가능합니다.
3473 조회
0 추천
2025.08.18 등록
YouTube, AI로 이용자 나이 추정해 미성년자 보호 강화유튜브가 나이 판단을 생년월일 입력방식에서 게시물을 통한 AI 의 추측으로 판단하는 것으로 변경하는 것을 테스트 중이라고CNN이 보도했다.이렇게 되면 AI가 만 18세 미만으로 판단한 이용자에게는 기존 청소년 보호 조치가 자동으로 적용된다. 여기에는 폭력적이거나 선정적인 민감 콘텐츠 제한, 반복 시청 제한, 휴식 알림, 맞춤형 광고 비활성화 등이 포함된다.만약 성인이 올린 것인데도 미성년자로 분류될 경우, 신분증, 신용카드, 또는 셀카(본인 확인용)를 제출해 나이 인증을 할 수 있다.이번 시스템은 로그인한 이용자에게만 적용될 것으로 알려졌으며, 로그아웃 상태에서는 일부 연령 제한 콘텐츠를 볼 수 없지만, 청소년이 부모 동의 없이 시스템을 우회할 가능성도 일부 남아 있다.
3580 조회
0 추천
2025.08.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입