Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
1,820 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 1,248 / 289 페이지
오픈AI는 사용자 의견을 수용하여 챗GPT의 모델 선택 메뉴를 되살렸습니다. 이제 사용자는 자동, 빠름, 싱킹(Thinking) 세 가지 모드 중에서 선택할 수 있습니다. 자동 모드는 쿼리에 따라 추론과 비추론 모델이 알아서 선택되며, 빠름 모드는 비추론 모델을 활용합니다. 싱킹 모드는 답변에 더 많은 컴퓨팅을 소모하고 출력 시간이 더 걸리는 추론 모델을 의미합니다.유료 사용자들은 지원이 중단된 GPT-4o와 GPT-4.1, o3 등 기존 모델과 새로 추가된 GPT-5 싱킹 미니 등을 이용할 수 있습니다. GPT-4o는 모델 선택기에 기본으로 포함되며, 다른 모델은 설정에서 추가할 수 있습니다. 샘 알트먼 CEO는 GPT-5에 적용된 4가지 개성을 더 따뜻한 느낌을 주면서도 불편하지 않도록 업그레이드하겠다고 밝혔습니다.이러한 업데이트들은 AI 도구들이 단순한 질문 답변을 넘어 실제 업무 환경에서 활용할 수 있는 실용적인 기능들로 진화하고 있음을 보여줍니다. 특히 사용자의 작업 흐름을 이해하고 지원하는 방향으로 발전하고 있어, 앞으로 AI 도구들이 개인 비서나 업무 파트너 역할을 더욱 효과적으로 수행할 것으로 예상됩니다.이 기능은 좌측 상단의 ChatGPT 5 버튼을 클릭하여 선택 가능합니다.
1877 조회
0 추천
2025.08.18 등록
YouTube, AI로 이용자 나이 추정해 미성년자 보호 강화유튜브가 나이 판단을 생년월일 입력방식에서 게시물을 통한 AI 의 추측으로 판단하는 것으로 변경하는 것을 테스트 중이라고CNN이 보도했다.이렇게 되면 AI가 만 18세 미만으로 판단한 이용자에게는 기존 청소년 보호 조치가 자동으로 적용된다. 여기에는 폭력적이거나 선정적인 민감 콘텐츠 제한, 반복 시청 제한, 휴식 알림, 맞춤형 광고 비활성화 등이 포함된다.만약 성인이 올린 것인데도 미성년자로 분류될 경우, 신분증, 신용카드, 또는 셀카(본인 확인용)를 제출해 나이 인증을 할 수 있다.이번 시스템은 로그인한 이용자에게만 적용될 것으로 알려졌으며, 로그아웃 상태에서는 일부 연령 제한 콘텐츠를 볼 수 없지만, 청소년이 부모 동의 없이 시스템을 우회할 가능성도 일부 남아 있다.
1940 조회
0 추천
2025.08.18 등록
최근 5년 동안 미국인의 전기요금은 약 30% 상승했으며, 이 주요 원인 중 하나는 AI와 클라우드 기술의성장으로 인한 데이터 센터의 대규모 전력 소비 때문이라고 Quartz 가 보도데이터 센터는 점점 더 많은 전기를 요구하고 있는데, 앞으로 미국 전체 전력의 최대 12%까지 차지할 수 있을 것으로 전망되며이는 가정과 산업의 부담으로 이어질 것으로 예상.특히 AI 산업의 성장과 빅테크 기업들의 클라우드 사업 확장은 더 많은 서버, 쿨링 시스템, 그리고 전력을 필요로 해 전반적인 에너지 수요를 빠르게 늘리고 있으며, 이러한 수요 급증이 전력망 압박 및 요금 인상으로 직결된다고 지적한다.일부 지역에서는 데이터 센터 신규 건설이나 전력 증강 프로젝트로 인프라 투자 논란이 발생하고 있다.효율적인 에너지 정책과 지속 가능한 데이터 센터 운영이 시급하다는 목소리가 커지고 있다고 매체는 보도했다.
1906 조회
1 추천
2025.08.18 등록
마이크로소프트(Microsoft) 연구진이 생성형 AI에 가장 취약한 직업 40개와 가장 안전한 직업 40개를 분석한 연구 결과를 발표했다.The top 10 least affected occupations by generative AI:Dredge OperatorsBridge and Lock TendersWater Treatment Plant and System OperatorsFoundry Mold and CoremakersRail-Track Laying and Maintenance Equipment OperatorsPile Driver OperatorsFloor Sanders and FinishersOrderliesMotorboat OperatorsLogging Equipment OperatorsThe top 40 most affected occupations by generative AI:Interpreters and TranslatorsHistoriansPassenger AttendantsSales Representatives of ServicesWriters and AuthorsCustomer Service RepresentativesCNC Tool ProgrammersTelephone OperatorsTicket Agents and Travel ClerksBroadcast Announcers and Radio DJsBrokerage ClerksFarm and Home Management EducatorsTelemarketersConciergesPolitical ScientistsNews Analysts, Reporters, JournalistsMathematiciansTechnical WritersProofreaders and Copy MarkersHosts and HostessesEditorsBusiness Teachers, PostsecondaryPublic Relations SpecialistsDemonstrators and Product PromotersAdvertising Sales AgentsNew Accounts ClerksStatistical AssistantsCounter and Rental ClerksData ScientistsPersonal Financial AdvisorsArchivistsEconomics Teachers, PostsecondaryWeb DevelopersManagement AnalystsGeographersModelsMarket Research AnalystsPublic Safety TelecommunicatorsSwitchboard OperatorsLibrary Science Teachers, Postsecondary
1878 조회
0 추천
2025.08.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입