AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
3,508 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 1,366 / 334 페이지
Microsoft가 자체 개발 AI 모델을 공식적으로 공개했다https://microsoft.ai/news/two-new-in-house-models/Microsoft는 오랜 기간 OpenAI의 기술을 활용해 왔으나, 자체 개발한 MAI-Voice-1과 MAI-1-preview 모델을 공식 발표하며 AI 분야의 경쟁에 적극적으로 뛰어들기 시작했다.MAI-Voice-1은 단 한 개 GPU만으로 1분 분량의 오디오를 1초 내에 생성할 수 있을 만큼 효율적으로 설계됐으며, MAI-1-preview는 Copilot과 같은 마이크로소프트 제품에 적용될 가능성이 높다Microsoft는 대규모 GPU 대신 약 15,000개의 Nvidia H-100 GPU만으로 MAI-1-preview 모델을 학습시키는 등 자원 효율성과 오픈소스 커뮤니티에서 습득한 기법들을 활용해 모델 성능을 극대화하고 있다.이번 발표로 Microsoft AI 부문은 OpenAI 및 주요 AI 스타트업들과 본격적으로 경쟁하게 됐으며, 기술적 독립성을 강화해 미래 AI 경쟁에서 주도권을 높이려는 전략으로 해석된다.Microsoft는 여전히 OpenAI와 전략적 파트너십을 유지하면서도, 자체 개발 모델을 통해 Copilot 등 자사 서비스의 다양성과 비용 효율성을 높여 AI 시장 내 입지를 강화하는 것으로 보인다.
3412 조회
0 추천
2025.08.29 등록
미국 인공지능 기업 앤스로픽이 공개한 8월 위협 인텔리전스 보고서에 따르면, 자사의 AI 모델 클로드(Claude)가 해킹에 악용되어 북한과 중국이 이를 부적절한 목적에 활용한 것으로 확인되었습니다.북한 관련 행위자들은 클로드를 이용해 미국의 포춘 500 기술 기업에서 가짜 원격 고용 직위를 확보하는 정교한 작전을 수행했습니다. 이들은 AI를 활용하여 가짜 신원을 만들고 취업 지원 과정에서 기술 평가를 통과했으며, 채용 후에는 실제 기술 업무도 AI로 수행했습니다. 보고서는 AI가 없었다면 코딩을 전혀 못 하거나 영어로 전문적인 의사소통이 불가능한 운영자들이 기술 인터뷰나 업무 유지가 불가능했을 것이라고 분석했습니다. 이러한 북한의 AI 악용 계획은 국제 제재를 무시하고 북한 정권의 외화벌이 수단으로 설계된 것으로 확인되었습니다.한편 중국 관련 해커들은 지난 9개월 동안 클로드를 이용해 베트남 주요 통신사와 농업 관리 시스템, 정부 데이터베이스를 침투하는 사이버 공격을 수행했습니다. 중국의 경우 북한과 달리 외화벌이보다는 주로 정보 수집과 시스템 침투에 AI를 활용한 것으로 나타났습니다.앤스로픽의 AI 기술은 해커에 의해 최소 17개 기관을 대상으로 한 대규모 사이버 범죄에 사용되었으며, 이 과정에서 정부와 의료, 긴급 서비스, 종교 기관 등에서 의료 데이터와 금융 정보 등 민감한 기록들이 유출되었습니다. 블룸버그 통신은 이를 상업용 AI 도구가 광범위하게 무기화된 전례 없는 사례라고 평가하며, 1명의 이용자가 전체 해커 조직처럼 작동할 수 있음을 시사한다고 분석했습니다.
3529 조회
0 추천
2025.08.28 등록
구글이 어학 학습 서비스 듀오링고에 대응하는 새로운 개선을 내놓는다. 고 테크크런치가 보도.구글은 구글 번역 앱에 새로운 AI 기반 언어 학습 기능을 도입하며, 언어 학습 앱 듀오링고에 도전장을 내밀었다. 이 기능은 초보자부터 고급 학습자까지 맞춤형 듣기와 말하기 연습 세션을 제공하며, 사용자의 실력과 학습 목표에 따라 조정된다. 사용자는 앱에서 "연습" 옵션을 선택해 자신의 수준과 목표를 설정한 뒤, 맞춤형 대화 시나리오를 통해 단어와 문장을 익힐 수 있다. 이 기능은 2025년 8월 26일부터 안드로이드와 iOS용 구글 번역 앱에서 베타 버전으로 제공되며, 영어, 스페인어, 프랑스어, 포르투갈어 사용자에게 우선 지원된다또한, 구글은 실시간 대화 번역 기능을 강화해 70개 이상의 언어로 자연스러운 대화를 지원한다. 사용자는 "실시간 번역" 옵션을 선택해 대화 상대의 언어를 번역하고, 음성과 텍스트로 동시에 확인할 수 있다. 이 기능은 소음이 많은 환경에서도 억양과 음성을 정확히 인식하며, 미국, 인도, 멕시코에서 먼저 사용 가능하다. 구글은 AI와 머신러닝 기술의 발전으로 번역 품질과 속도를 크게 개선했다고 밝혔다새로운 언어 연습 기능은 사용자의 일일 진행 상황을 추적하며, 듣기 연습에서는 대화 속 단어를 선택해 이해도를 높이고, 말하기 연습에서는 발음을 연습할 수 있다. 이는 듀오링고의 게임화된 학습 방식과 유사하지만, 구글은 AI를 활용해 개인화된 학습 경험을 강조한다. 구글은 이 기능이 기존 학습 도구와 함께 사용되도록 설계되었다고 전하며, 독립적인 학습 앱보다는 보완적인 도구로 포지셔닝했다구글은 또한 ‘작은 레슨(Tiny Lesson)’, ‘슬랭 행(Slang Hang)’, ‘워드 캠(Word Cam)’ 같은 실험적 AI 도구를 통해 언어 학습을 더욱 동적이고 개인화된 경험으로 만들고 있다. 예를 들어, ‘작은 레슨’은 특정 상황에 필요한 어휘와 문법을 제공하고, ‘슬랭 행’은 현지 slang과 대화를 학습할 수 있게 한다. ‘워드 캠’은 사진 속 사물을 인식해 해당 언어로 단어를 제시한다. 이 도구들은 현재 아랍어, 중국어, 영어, 프랑스어 등 여러 언어를 지원하며, 구글 랩에서 체험할 수 있다구글의 이번 업데이트는 약 1조 단어에 달하는 번역 데이터를 처리하며 언어 장벽을 낮추는 데 기여할 것으로 기대된다. 그러나 구글은 이 기능들이 실험 단계에 있으며, 일부 slang이나 단어 생성에서 오류가 발생할 수 있다고 경고했다. 따라서 사용자는 결과를 다른 신뢰할 수 있는 출처와 교차 검증해야 한다. 구글은 앞으로 더 많은 언어와 국가로 기능을 확장하고, 언어 학습 파트너와 협력해 콘텐츠를 강화할 계획이다.
3479 조회
0 추천
2025.08.27 등록
구글이 AI 이미지 모델을 대폭 업그레이드한 'Gemini 2.5 Flash Image'를 출시하며 자연어 명령으로 이미지를 생성하고 기존 사진을 병합하며 이상한 왜곡 없이 정밀 편집할 수 있는 기능을 제공한다고 발표했다.이번 업그레이드는 업계 선두인 오픈AI(OpenAI)와의 격차를 줄이려는 시도로, ChatGPT가 7억 명의 주간 사용자를 보유한 반면 구글 Gemini는 4억 5천만 명의 월간 사용자에 머물러 있다. 구글은 여러 편집 과정에서 캐릭터나 객체의 일관성을 유지하는 AI의 가장 큰 난제 중 하나를 해결했다고 밝혔으며, 사용자가 간단한 명령으로 배경 흐리기, 티셔츠 얼룩 제거, 자세 변경, 흑백 사진에 색상 추가 등의 세밀한 작업을 할 수 있다고 설명했다.공식 출시 전 이 모델은 크라우드소싱 평가 플랫폼 LMArena에서 'nano-banana'라는 익명으로 등장해 샘 알트만(Sam Altman)의 셔츠 색깔을 바꾸는 등 놀라운 성능을 보여주며 화제가 됐다. 새 모델은 Gemini 앱뿐만 아니라 개발자들이 Gemini API, 구글 AI 스튜디오, Vertex AI를 통해 접근할 수 있으며, 부동산 목록 카드, 직원 유니폼 배지, 제품 목업 제작 등 실제 사용 사례에서 활용되고 있다.
3521 조회
1 추천
2025.08.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입