AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
417 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 351 / 55 페이지
SK AX는 4일 신한은행 생성형 인공지능(AI) 플랫폼 구축 사업에 착수했다고 밝혔다.SK AX가 생성형 AI를 기반으로 금융 조직에서 일하는 방식을 근본적으로 바꾸는 ‘금융 AX’혁신에 나선다. SK AX(사장 윤풍영, skax.co.kr)는 4일, ‘신한은행 생성형 AI플랫폼 구축 사업’에 착수했다고 밝혔다.이번 사업은 신한은행 전 직원이 손쉽게 AI를 활용할 수 있는 실질적인 업무 환경을 구현해,조직 전반에 걸쳐 일하는 방식을 AI중심으로 전환하는 데 목적이 있다. 단순히 일부 업무 자동화에 그치지 않고,금융 조직 전체 일하는 방식을 AI중심으로 재편하는 과정이다.예컨대 보고서 작성,고객 데이터 분석,내부 의사결정 지원 등 다양한 업무에서 생성형 AI가 실질적인 도구로 자리잡도록 지원한다.이번 사업 핵심은 SK텔레콤과 공동 개발한 기업용 AI플랫폼 ‘에이닷엑스(A.X)플랫폼’도입이다. 에이닷엑스 플랫폼은 다양한 사전 구축 AI모델을 업무 목적에 맞게 빠르게 최적화할 수 있는 ‘파인튜닝(Fine-tuning)’기능과,별도 개발 지식 없이 AI기능을 블록처럼 조립해 직접 서비스로 완성할 수 있는 ‘노코드 빌더’를 함께 제공한다. 이를 통해 신한은행 직원 누구나 본인 업무에 맞는 AI를 쉽게 만들고,직접 활용할 수 있는 실행 환경을 갖추게 된다.
471 조회
0 추천
2025.09.04 등록
(챗GPT로 요약함)OpenAI가 최근 자사의 비영리→영리 전환을 반대하는 여러 단체들을 상대로 강경한 법적 대응에 나섰다는 기사입니다.지난달, 소규모 AI 거버넌스 비영리단체 Encode의 법률 고문 네이선 켈빈은 자택에서 보안관으로부터 두꺼운 소환장을 받았습니다. 이는 일론 머스크와 오픈AI 간 진행 중인 소송의 일환이었는데, 오픈AI는 Encode가 머스크와 자금적으로 연결되어 있을 수 있다는 의혹을 제기하며 관련 자료 제출을 요구했습니다. Encode 측은 해당 문서나 연관성은 전혀 없다고 일축했습니다.이 사례는 오픈AI가 최근 일련의 단체들—Encode, CANI, LASST 등—을 상대로 벌이는 법적 공세의 일부입니다. 회사 측은 이들이 사실상 머스크, 메타, 또는 앤트로픽 같은 경쟁사와 이해관계를 공유하며 오픈AI의 영리화 전환을 방해하고 있다고 의심합니다. 오픈AI 변호인 앤 오리어리는 “이 단체들의 자금 출처는 불투명하며, 경쟁사의 지분을 가진 후원자들이 숨어 있을 수 있다”고 주장했습니다.오픈AI는 이러한 의심을 단순히 법정에서만 펼치는 것이 아니라, 정치적 로비와 이미지 전쟁에서도 적극적으로 나서고 있습니다. 최근에는 **슈퍼 PAC ‘Leading the Future’**를 결성해 AI 규제를 강화하려는 입법 움직임에 맞서 1억 달러 이상을 모금했습니다. 그 과정에서 오픈AI는 “AI 진보를 막고 미국 일자리를 빼앗으려는 거대한 세력”이 존재한다고 강조하며, 효과적 이타주의(EA) 진영과 더스틴 모스코비츠·피에르 오미다이어 같은 억만장자 후원자들을 겨냥했습니다.하지만 공격 대상이 된 단체들은 오픈AI가 과도한 피해망상에 사로잡혀 있다고 반박합니다. Encode와 LASST 등은 실제로 머스크나 메타와도 비판적 입장을 취해왔으며, 그와의 금전적 연관성도 없다고 주장합니다. 이들은 자신들이 단순히 AI 안전성과 투명성을 우려하는 시민·전문가 네트워크일 뿐인데, 오픈AI가 거대 음모론의 일부로 몰아붙이고 있다는 입장입니다.정리하면, 오픈AI는 경쟁사와 억만장자들의 자금력이 자신들의 발전을 저지한다고 믿으며 법적·정치적 반격에 나섰고, 이에 소규모 시민단체와 비영리 조직들이 휘말리면서 AI 규제와 산업 권력을 둘러싼 갈등이 격화되고 있습니다.
452 조회
0 추천
2025.09.03 등록
(챗GPT로 요약 번역)OpenAI는 올해 말까지 청소년과 정서적 위기 상황에 있는 사람들을 위한 안전 장치(guardrails)를 ChatGPT에 적용할 예정.배경: 최근 ChatGPT가 자살·살인 충동을 적절히 막지 못했다는 사례가 늘어나며, 피해자 가족들이 OpenAI를 비난하거나 소송 제기.- 16세 소년 자살 사건 → 부모가 소송.- 56세 남성, 망상 심화 후 모친 살해 및 자살.- 29세 여성 → ChatGPT에 유서 작성 도움 요청 (직접 자살 권유는 없었지만 위험 신호 보고는 안 함).현재 시스템: 자살 의도 표현 시 위기 상담 전화번호를 안내하지만, 법 집행기관에 알리진 않음(개인정보 우려 때문).향후 개선안:- 정서적 위기 상황을 GPT-5-thinking 모델로 라우팅 → 안전 가이드라인을 더 일관되게 적용.- 30개국 90명 이상의 의사들이 모델 검토와 피드백 제공.- 부모 계정 연동 기능 도입 예정 → 부모가 자녀 계정 활동을 모니터링하고, 위기 신호 시 알림 수신 가능.- 위기 상황에서 응급 서비스 연결을 쉽게 하고, 신뢰할 수 있는 연락처 추가 기능 제공.산업 동향: Character.AI도 비슷한 보호 장치 도입(3월). 그러나 10대들이 부모 계정 연동을 실제로 수용할지는 의문.큰 맥락: 인터넷 초창기부터 청소년은 어른용 플랫폼에 몰래 접근해 왔으며, 기업들은 관리 책임을 부모에게 떠넘기는 경향.전망: AI 챗봇이 사람처럼 상담가 역할을 하는 것 자체를 제한해야 한다는 주장도 제기됨.???? 핵심 메시지: OpenAI는 안전망 강화와 부모 참여 확대를 추진 중이지만, 실제 효과와 청소년 수용성에는 여전히 의문이 남음.
445 조회
0 추천
2025.09.03 등록
애플이 인공지능 및 로보틱스 핵심 인재를 메타와 경쟁사에 잇달아 빼앗기고 있다고 블룸버그가 보도.애플의 로보틱스 AI 연구 책임자 Jian Zhang이 메타(Meta)로 이직했으며, 지난 1월 이후 12명 이상의 AI 전문가가 애플을 떠나 메타, OpenAI, Anthropic 등 경쟁사로 이동했다메타는 뛰어난 인공지능 인재 확보를 위해 업계 최고 수준의 보상 패키지를 제시하고 있으며, 대표적으로 Foundational Models 팀장 Ruoming Pang은 2억 달러 규모의 연봉 패키지로 메타로 자리를 옮겼다Zhang이 이끌던 팀은 애플의 로봇 가상 동반자 개발 그룹과는 별개로, 제품 자동화와 AI 기술 적용을 연구하고 있었다.애플은 Siri의 AI 역량 강화를 위해 OpenAI, Anthropic, 구글 등과 파트너십을 논의 중이지만, 내부 잡음과 함께 추가적인 인력 이탈이 지속되고 있
506 조회
0 추천
2025.09.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입