Loading...

AI 뉴스

오픈AI는 AI 환각 현상이 훈련 유인에서 비롯된 것이라고 주장

페이지 정보

작성자 xtalfi
작성일 2025.09.08 14:40
1,307 조회
0 추천
0 비추천

본문

cb0530903b1cb0b4c9640ff1648be527dIpH.jpg

(퍼플렉시티가 정리한 기사)

OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.

조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.

 

과도한 확신 오류의 통계적 근원

이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다.

"환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.

구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.

 

이진 점수 체계는 추측 동기를 유발합니다

현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.

연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.

연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.

 

제안된 해결책: 명시적 신뢰도 목표

연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.

예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.

해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.

오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.

댓글 0
전체 858 / 178 페이지
(퍼플렉시티가 정리한 기사)Anthropic CEO인 다리오 아모데이는 인공지능이 향후 5년 내에 최대 50%의 초급 화이트칼라 일자리를 사라지게 할 것이라는 경고를 다시 강조하며, 최근 BBC 인터뷰에서 많은 기업 경영진들이 AI를 단순히 근로자를 보조하는 도구가 아닌 인력을 감축하는 비용 절감 수단으로 비공개적으로 인식하고 있음을 밝혔다.2025년 9월 5일자 BBC Radical의 아몰 라잔과의 인터뷰에서 아모데이는 법률 사무소, 컨설팅, 행정, 재무 분야의 반복적이지만 변수성이 있는 업무들이 1~5년 내에 사라질 수 있다고 구체적으로 지적했다. "구체적으로, 초급 화이트칼라 업무를 보면, 예를 들어 법률 사무소에서 근무하는 신입 변호사들처럼 문서 검토 작업이 많죠. 매우 반복적이지만 매번 예시가 다릅니다. 이런 점에서 AI는 매우 뛰어납니다,"라고 그는 설명했다.CEO들은 비용 절감을 위해 인공지능(AI)에 주목하고 있다초급 근로자들에게 가장 우려되는 점은 AI 도입에 대한 경영진의 의도에 대한 아모데이의 폭로였다. "솔직히 말해서, 많은 경영진들이 AI를 사용해서 비용을 절감하고 직원 수를 줄이고 싶어 하는 것 같아요,"라고 그는 말했다. 이는 AI가 인간의 역량을 단순히 보완할 뿐, 완전히 대체하지는 않을 것이라는 더 낙관적인 이야기와는 상반된다.아모데이는 자신의 예상 시점이 추측이 아닌 현재의 현실을 반영한다고 강조했다. 그는 "기술은 이미 초급 업무에 매우 뛰어나며, 지금 빠르게 더 좋아지고 있다"고 언급했다. 그의 확신은 이미 AI 도구를 도입하고 있는 CEO들과의 직접적인 대화에서 나온 것으로, 그들은 인원 감축 의사를 명확히 밝혔다고 전했다.일자리 대체에 대한 증가하는 증거최근 데이터는 아모데이(Amodei)의 경고를 뒷받침하고 있습니다. 2025년 8월 발표된 세인트루이스 연방준비은행 연구에 따르면, 미국은 AI가 주도하는 일자리 대체의 초기 단계를 목격하고 있을 수 있으며, AI 도입과 실업률 상승 간의 상관관계가 가장 높은 부문들이 확인되었습니다. 연구 결과, 생성형 AI를 가장 적극적으로 도입한 직종에서는 실업률이 가장 크게 증가했으며, 특히 컴퓨터 및 수학 분야에서 AI 도입률이 거의 80%에 달하는 동안 실업률은 1.2% 상승했습니다.별도의 하버드 연구에서는 2023년 초 이후 여섯 분기 동안 AI를 도입한 기업의 초기 경력자 인원수가 7.7% 감소한 반면, 시니어 스태프 고용은 계속해서 증가했다고 밝혔습니다. 한편, Resume Now가 실시한 설문 조사에서는 근로자의 89%가 AI가 고용 안정성에 미칠 영향을 우려하고 있으며, 43%는 AI로 인해 일자리를 잃은 사람을 알고 있다고 답했습니다.업계 리더들, 인공지능 영향에 대해 의견 분분아모데이의 냉철한 예측은 실리콘밸리 전역에서 치열한 논쟁을 불러일으켰다. 엔비디아 CEO 젠슨 황은 파리의 비바테크(VivaTech) 행사에서 이러한 경고를 일축하며, 아모데이가 한 말의 "거의 모든 것"에 동의하지 않는다며 AI는 일자리를 없애기보다는 변화시킬 것이라고 예측했다. 황은 "당신은 AI에게 일자리를 빼앗기지 않겠지만, AI를 활용하는 누군가에게 일자리를 빼앗길 것이다"라고 주장했다.오픈AI의 샘 알트먼 또한 이에 반박하며, 사회가 일자리의 절반이 사라지는 것을 허용하지 않을 것이며 새로운, 더 나은 역할이 등장할 것이라고 주장했다. 그러나 다른 경영진들은 아모데이의 우려에 동의하고 있다. 포드 CEO 짐 팔리는 AI가 미국 사무직 근로자의 "정말 절반"을 대체할 것이라고 전망했으며, 세일즈포스 CEO 마크 베니오프는 자신의 회사가 고객 서비스 직군 9,000명 중 4,000명을 줄여 5,000명으로 축소했다고 밝히며 "머릿수가 더 적게 필요하다"고 말했다.특히, 오픈AI 역시 2026년 중순 출시 목표로 AI 기반 채용 플랫폼을 개발 중이라고 발표했으며, 애플리케이션 부문 CEO 피지 시모는 "오픈AI에서도 그 혼란을 완전히 막을 수는 없다"고 인정하면서도, 근로자들이 AI 역량을 개발할 수 있도록 돕겠다고 약속했다.아모데이의 경고는 신입 직급을 넘어선다. 그는 올해 3월, AI가 3~6개월 내에 소프트웨어 코드의 90%를 작성할 수 있고, 1년 이내에는 "사실상 전부"를 쓸 수 있을 것이라고 예측했다. 이는 5월 악시오스(Axios) 인터뷰에서 AI가 신입 사무직 일자리의 절반을 없애며 실업률이 10~20%까지 치솟을 수 있다고 전망한 발언을 잇는다. 그는 업계와 정부가 다가오는 혼란을 "미화한다"고 비판했다.
1206 조회
0 추천
2025.09.06 등록
(퍼플렉시티가 정리한 기사)구글의 혁신적인 AI 이미지 편집 도구인 'Nano Banana'는 출시 첫 주에만 1천만 명이 넘는 신규 사용자를 Gemini 앱으로 끌어들이고 2억 장 이상의 이미지를 처리하면서 전 세계적인 주목을 받고 있습니다. 이처럼 빠른 성공은 최근 AI 역사상 가장 빠른 사용자 도입 속도 중 하나로 평가받고 있습니다.구글의 랩스와 Gemini 담당 부사장인 Josh Woodward는 9월 4일 X(구 Twitter)를 통해 “2억 개 이상의 이미지가 편집되었고, 1천만 명 이상이 @GeminiApp에 새롭게 접속했다”고 이정표가 되는 수치를 발표했습니다. 그는 “TPUs가 뜨겁고 SRE 호출기가 울린다”는 문구를 포함해, 이 기능이 엄청난 서버 수요를 불러왔음을 강조하기도 했습니다.세계적인 현상이 앱 다운로드를 이끈다공식 명칭은 Gemini 2.5 플래시 이미지(Gemini 2.5 Flash Image)이지만, 이 도구는 내부 테스트 중에 "Nano Banana(나노 바나나)"라는 별명을 얻었으며, 대중 출시 때에도 이 재치 있는 별명을 유지하고 있습니다. 현재 이 기능은 LMArena의 이미지 편집 리더보드에서 경쟁자들보다 171점 앞서며 1위를 차지하고 있습니다.이러한 급증으로 Gemini 앱은 앱스토어 생산성 카테고리 2위, 플레이스토어 전체 무료 차트 13위에 올랐습니다. Android Police의 보도에 따르면, 이 도구는 이전에 Gemini를 사용해본 적 없는 신규 사용자들을 끌어들였으며, 이는 기존 사용자 참여가 아닌 진정한 신규 사용자 유입을 의미합니다.피규어 트렌드, 입소문을 타고 화제"피규어 프롬프트"가 가장 인기 있는 사용 사례로 떠오르면서, 사용자들은 개인 사진을 사실적인 콜렉터블 스타일의 액션 피규어로 변환하고 있습니다. 필리핀은 이 트렌드의 선도적인 수용 국가가 되어, 2,500만 개 이상의 이미지를 생성하며 전 세계 최고 사용 국가로 자리매김했습니다.구글은 특정 프롬프트를 적극적으로 홍보하고 있습니다: "나노-바나나 모델을 사용하여, 일러스트 캐릭터의 1/7 스케일 상업용 피규어를 사실적인 스타일과 설정으로 디자인하세요. 피규어를 컴퓨터 책상에 배치하고, 텍스트 없이 투명한 원형 아크릴 베이스에 장착하세요".기술적 이점이 도입을 촉진한다모델의 성공은 여러 번의 편집을 거쳐도 캐릭터의 일관성을 유지하는 능력에서 비롯되었으며, 이는 AI 이미지 생성에서 흔히 발생하는 ‘언캐니 밸리(uncanny valley)’ 문제를 해결합니다. Android Police에 따르면, 사용자는 얼굴 특징과 객체 특성을 인지할 수 있도록 반복적으로 수정할 수 있습니다.엑세스(Access)는 단계별 시스템으로 운영되며, 무료 Gemini 사용자는 하루에 100번의 편집이 가능하고, 유료 구독자는 하루 최대 1,000번의 편집을 이용할 수 있습니다. 모든 결과물에는 AI 생성 콘텐츠임을 식별할 수 있도록 구글의 SynthID 워터마크가 포함됩니다.Nano Banana의 빠른 채택은 사용하기 쉬운 AI 도구가 실제 창의적인 과제를 해결하면서 일반 대중에게 접근 가능할 때, 대중적으로 인기를 얻을 수 있음을 보여줍니다.
1302 조회
0 추천
2025.09.06 등록
사이버 범죄자들이 X의 Grok AI를 악용하여 악성 링크를 유포하는 새로운 기법이 발견되었다고 합니다. Guardio Labs의 나티 탈이 이 기법을 Grokking이라고 명명했다고 합니다.이 방법은 X의 광고 보호 시스템을 우회하는 방식으로 작동한다고 합니다. 범죄자들은 성인 콘텐츠를 미끼로 사용한 비디오 카드 광고 게시물을 올리고, 악성 링크를 비디오 플레이어 아래 From 메타데이터 필드에 숨겨둔다고 합니다. 이 부분은 X 플랫폼에서 스캔하지 않는 영역이라고 합니다.다음 단계에서 사기꾼들은 해당 게시물에 댓글로 Grok을 태그하고 이 비디오가 어디서 나온 것인지 묻는다고 합니다. 그러면 Grok AI 챗봇이 응답으로 해당 링크를 눈에 보이게 표시한다고 합니다.탈은 수백만 조회수를 기록한 게시물에서 Grok이 링크를 언급함으로써 SEO와 도메인 신뢰도가 증폭된다고 설명했습니다. X에서 명시적으로 금지하는 악성 링크가 시스템이 신뢰하는 Grok 계정의 게시물에 나타나 수백만 피드와 검색 결과로 확산된다고 합니다.이 링크들은 사용자를 의심스러운 광고 네트워크로 보내서 가짜 CAPTCHA 사기, 정보 탈취 악성코드 및 기타 의심스러운 콘텐츠로 연결된다고 합니다. 해당 도메인들은 동일한 Traffic Distribution System의 일부로 평가되며, 이는 악성 광고 기술 업체들이 유해하거나 기만적인 콘텐츠로 트래픽을 라우팅하는데 자주 사용된다고 합니다.Guardio는 지난 며칠 동안 이런 행동을 하는 수백 개의 계정을 발견했다고 했으며, 각각이 수백 또는 수천 개의 유사한 게시물을 올렸다고 합니다. 이들은 플랫폼 정책 위반으로 계정이 정지될 때까지 며칠 동안 논스톱으로 게시하는 것 같다고 합니다.
1267 조회
0 추천
2025.09.06 등록
(퍼플렉시티가 정리한 기사)Tencent은 단일 이미지를 탐색 가능한 3D 세계로 변환하는 오픈소스 AI 모델인 HunyuanWorld-Voyager를 출시했습니다. 이 모델은 스탠퍼드 대학교의 WorldScore 벤치마크에서 77.62라는 최고 종합 점수를 달성해 WonderWorld(72.69)와 CogVideoX-I2V(62.15) 등 경쟁 모델을 능가했습니다.HunyuanWorld-Voyager는 7월에 공개된 Tencent의 이전 HunyuanWorld 1.0 모델을 기반으로 합니다. 새로운 시스템은 RGB 비디오와 깊이 정보를 동시에 생성해 사용자가 키보드나 조이스틱 컨트롤을 통해 가상 환경을 탐색할 수 있게 합니다. 9월 2일 Tencent의 발표에 따르면, 이 모델은 업계 최초로 네이티브 3D 재구성 기능을 갖춘 초장거리 세계 모델입니다.기술 혁신과 성과이 모델은 이전에 생성된 3D 포인트를 저장하는 "월드 캐시" 메커니즘을 사용하여 확장된 가상 공간에서 일관성 있는 탐색이 가능합니다. 기존의 비디오 생성 방식과 달리, Voyager는 49개의 프레임이 포함된 2.5초 길이의 클립을 생성하며, 이를 이어 붙이면 더 긴 시퀀스도 만들 수 있습니다. 시스템은 캐시에 저장된 3D 포인트를 새로운 카메라 뷰에 투영하여, 다른 월드 생성 모델에서 흔히 발생하는 시각적 결함을 피하면서 공간적 일관성을 유지합니다.Tencent는 10만 개 이상의 비디오 클립을 분석한 자동화된 데이터 파이프라인을 통해 Voyager를 학습시켰으며, 실제 영상과 Unreal Engine의 합성 렌더 파일을 조합했습니다. 이 접근 방식 덕분에 카메라 움직임과 깊이 정보에 대한 수작업 주석이 필요하지 않았습니다. 이 모델은 객체 제어(66.92), 스타일 일관성(84.89), 주관적 품질(71.09) 등 여러 WorldScore 분야에서 우수한 성과를 냈으나, 카메라 제어 부문에서는 WonderWorld의 92.98점에 이어 2위를 차지했습니다.하드웨어 요구 사항 및 제한 사항Voyager를 운영하려면 상당한 컴퓨팅 리소스가 필요하며, 540p 해상도 출력을 위해 최소 60GB의 GPU 메모리가 필요하고, 최적의 결과를 위해 텐센트는 80GB를 권장합니다. 이 회사는 단일 및 다중 GPU 구성을 모두 지원하는 코드와 함께 모델 가중치를 Hugging Face에서 제공하고 있습니다.그러나 이 모델은 유럽 연합, 영국, 대한민국에서의 사용을 제한하는 라이선스 제한이 있습니다. 월간 활성 사용자가 1억 명을 초과하는 상업적 활용의 경우 텐센트와 별도의 라이선스 계약이 필요합니다. 이러한 제한은 텐센트의 훈위안(Hunyuan) 생태계 내 기타 모델에도 적용되며, 이는 회사의 지역별 라이선스 정책을 반영합니다.시장 환경 및 응용 사례이번 출시로 텐센트는 인터랙티브 3D 세계 생성 시스템을 개발하는 기타 기업들과 어깨를 나란히 하게 되었습니다. 구글은 8월에 Genie 3를 발표했고, 다이나믹스 랩의 Mirage 2는 사진을 플레이 가능한 공간으로 변환할 수 있도록 해줍니다. Voyager는 비디오 제작과 3D 재구성을 중점적으로 다루어, 순수한 인터랙티브 방식과 차별화됩니다.벤치마크 성과에도 불구하고, 전문가들은 현재의 높은 컴퓨팅 요구사항과 장기간, 일관된 장면 생성의 한계로 인해, 실시간 게임이나 대규모 애플리케이션에서는 즉각적인 적용이 어렵다고 지적합니다. 해당 기술은 AI 기반 가상 세계 창조의 진보를 보여주지만, 대중적 도입은 하드웨어 사양과 라이선스 제한으로 인해 여전히 제약을 받고 있습니다.
1208 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입