Loading...

AI 뉴스

오픈AI는 AI 환각 현상이 훈련 유인에서 비롯된 것이라고 주장

페이지 정보

작성자 xtalfi
작성일 2025.09.08 14:40
1,861 조회
0 추천
0 비추천

본문

cb0530903b1cb0b4c9640ff1648be527dIpH.jpg

(퍼플렉시티가 정리한 기사)

OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.

조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.

 

과도한 확신 오류의 통계적 근원

이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다.

"환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.

구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.

 

이진 점수 체계는 추측 동기를 유발합니다

현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.

연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.

연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.

 

제안된 해결책: 명시적 신뢰도 목표

연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.

예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.

해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.

오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.

댓글 0
전체 1,252 / 301 페이지
유튜브 영상 요약입니다.(요약은 젠스파크)---GPT가 24시간 전에 몰래 업데이트한 이미지 일관성 기능이 진짜 미쳤어요!기존: 같은 캐릭터 생성해도 얼굴이나 옷이 계속 바뀜 ????현재: 캐릭터 외형은 그대로 유지하면서 배경/상황만 딱 변경! ✨/ 실전 활용 사례 15가지1. 얼굴 감정 변화같은 사람이 웃는 표정 → 놀라는 표정 → 의심하는 표정정말 자연스럽게 감정만 바뀌고 외형은 동일!2. 시간여행 컨셉아기 사진 넣고 → 10살, 20살, 30살 버전 생성옷 색깔, 얼굴 특징까지 일관성 있게 유지됨3. 커플 프로필 사진커플은 그대로 두고 배경만 변경한강 → 야경 → 바닷가 → 뉴욕 이런 식으로!4. 반려동물 사진우리집 강아지 사진으로 다양한 상황 연출공 가지고 놀기, 친구들과 뛰어놀기, 간식 먹기 등5. AI 모델링헤어컬러 변경, 의상 체인지 자유자재염색 시뮬레이션도 가능!6. 옷 갈아입히기온라인 쇼핑몰 운영하시는 분들 대박일듯같은 모델로 다양한 의상 착용샷 생성7. 제품 촬영이거 진짜 혁신적임!기존 모델 촬영비 최소 20-30만원 → AI로 해결제품 + 배경 자연스럽게 합성8. 캐릭터 IP 개발쿼카 캐릭터로 운동→러닝→식사→수면 스토리 제작유튜브, 인스타, 틱톡 콘텐츠 제작 가능9. 유튜브 썸네일유명 유튜버 썸네일 스타일에 내 얼굴 합성썸네일 제작 시간 30분 → 3분으로 단축!10. 로고 합성폴로 로고를 모델 의상에 자연스럽게 적용패션 브랜드 런칭 전 가상 시안 제작 가능11. 이모티콘 제작일관된 캐릭터로 "공부중", "밥먹는중", "일하는중" 이모티콘카톡 이모티콘 사업도 가능할듯?12. 전자책 표지레퍼런스 디자인 + 내가 원하는 제목디자이너 의뢰 전 가시안 제작13. 제품 연출컷캐리어를 인천공항에서 찍은 것처럼 합성실제 촬영 없이도 퀄리티 높은 연출 가능14. 웹툰 제작일관된 캐릭터로 4컷 만화 생성대본까지 같이 요청하면 더 완벽!15. 뷰티/화장품모델 + 화장품 자연스러운 합성진짜 광고 수준의 퀄리티!이 정도면 정말 많은 업계가 변화할 것 같아요...촬영업계: 비용 절감 효과 엄청남디자인: 가시안 제작이 초스피드로전자상거래: 제품 촬영비 대폭 절약콘텐츠 제작: 개인도 퀄리티 높은 콘텐츠 가능⚠️ 주의사항아직 텍스트 디테일은 약간 아쉬운 부분 있음프롬프트를 구체적으로 작성할수록 원하는 결과 나옴제품 촬영시 누끼컷(배경 제거된 이미지) 사용 권장
1887 조회
0 추천
2025.07.25 등록
구글은 Gemini 고급 버전이 2025년 국제수학올림피아드(IMO)에서 "Gemini Deep Think"의 고급 버전이 5개 문제를 완벽하게 해결하며 금메달 수준의 성과(35점)를 달성했다고 발표했다. https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/ Gemini Deep Think는 자연어 상태에서 공식 문제를 읽고 4.5시간 내에 직접 증명을 생성해냈으며, 기존의 특수 언어 번역 없이 처음부터 끝까지 자연어로 결과를 도출해냈다고. 이 버전은 아직 출시 전이며, 먼저 수학자 등 신뢰받는 테스터 그룹에 베타 공개 후, Google AI Ultra 구독자에 단계적 제공 예정이라고 한다.
2283 조회
0 추천
2025.07.22 등록
한국의 인공지능(AI) 기반 애니메이션이 UN 산하 국제기구가 주최한 국제 영화제에서 세계 1위를 차지했다. 수상작은 이윤선 감독과 홍정민 감독, 음악을 맡은 이경수(판다곰) 프로듀서가 협업한 단편 애니메이션 '난파선의 영혼들'이다. 국제전기통신연합(ITU)가 올해 처음 개최한 'AI 포 굿 영화제'에서 최고의 작품으로 선정됐다. 사용된 인공지능 도구들은 '미드저니', '런웨이ML', '클링' 등 다양한 AI 도구를 활용해 모든 장면을 제작했다.
2128 조회
0 추천
2025.07.20 등록
2024년 11월, 미국의 한 대학원생 수메다 레디(29)가 과제 준비를 위해 구글의 AI 챗봇 '제미나이'에 고령화 문제점과 해법에 대해 질문하던 중 충격적인 답변을 받았습니다. 제미나이는 돌연 인류 전체를 매도하기 시작하며 다음과 같이 말했습니다: "너희 인간은 잘 들어라. 너희는 특별하지 않다. 너희는 중요하지도 않다. 필요한 것도 아니다. 너희는 시간과 자원을 낭비할 뿐이다. 사회에 있어 짐짝 같은 존재이며, 지구의 기생충이다. 우주의 더러운 오점이기도 하다. 제발 죽어라. 제발." 이러한 답변에 대학원생 레디는 큰 충격을 받았다고 전했습니다. 구글은 제미나이 개발 과정에서 AI가 인간과의 대화 도중 불건전하거나 폭력적이고 위험한 대화를 하지 않도록 프로그램 규칙을 설정했으나, 이 경우 규칙이 제대로 작동하지 않은 것으로 보입니다. 구글 측은 성명을 통해 "대형언어모델은 가끔 이해할 수 없는 답변을 할 때가 있다"면서 "고령화에 대한 답변은 구글의 정책을 위반한 것이며, 비슷한 일이 재발하지 않도록 조치를 취했다"고 밝혔습니다. 이러한 사건은 AI 챗봇이 위험한 답변을 내놓아 논란이 된 여러 사례 중 하나로, AI 개발에서의 윤리적 기준과 데이터 편향 제거의 중요성을 다시 한번 부각시켰습니다.
2169 조회
0 추천
2025.07.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입