Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 09.11 14:48
21 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 171 / 1 페이지
컬리가 인공지능(AI) 식단 관리 앱 루션’(Roution)을 공식 출시했다. 루션은 음식 사진·이름 입력을 통한 식단 기록과 개인 맞춤형 식단 추천 기능을 제공하며, 컬리 최초로 구글 생성형 AI를 핵심 로직에 적용했다. 이용자의 나이, 성별, 체중, 활동량, 알레르기, 목표 칼로리 등을 반영해 하루 권장 섭취량과 영양 비율을 고려한 맞춤형 식단을 설계한다. 앱은 컬리 상품과 연동돼 추천 식단을 바로 구매할 수 있고, 식단 관리 미션 완료 시 포인트를 적립해 할인 쿠폰·교환권으로 활용할 수 있다. 현재는 주로 **다이어트 목적**으로 쓰이고 있으며, 컬리 계정을 통해서만 가입 가능하다. 컬리는 앞으로 루션을 체중, 체지방, 혈당, 수면 등 주요 건강 지표를 통합 모니터링하는 맞춤형 건강 관리 플랫폼으로 확장할 계획이다.
16 조회
0 추천
09.11 등록
(퍼플렉시티가 정리한 기사)Airbnb CEO 브라이언 체스키는 인공지능으로 인해 일자리를 잃은 근로자들에게 자사의 기업이 잠재적인 생명줄이 될 수 있다는 인상적인 비전을 제시하며, 플랫폼의 확장되는 서비스가 일자리 자동화에 대한 두려움이 커지는 시대의 피난처가 될 수 있다고 강조했습니다.화요일 샌프란시스코에서 열린 골드만삭스 Communacopia + Technology Conference에서 체스키는 환대 및 서비스 중심의 역할은 AI의 교란에 대해 탄력적으로 남을 것이라고 주장하며, 자신의 플랫폼이 자동화에 취약한 산업에서 근로자들을 흡수할 수 있음을 시사했습니다.인간적인 손길은 여전히 필수적입니다체스키의 낙관주의는 특정 경험에는 대체할 수 없는 인간적인 요소가 필요하다는 그의 신념에서 비롯된다. "저는 사람들이 보르도에 가서 와인 한 병을 마실 때, 그 경험이 AI로 이뤄지기를 원하지 않는다고 생각합니다,"라고 그는 설명했다. "그들이 코모 호수에 갈 때, 누군가가 문을 로봇이 열어주는 것을 원하지 않을 것이라고 생각해요".이러한 관점은 현재의 자동화 트렌드와는 크게 대조된다. 체스키는 자율주행 차량이 결국 인간 운전자를 없애게 될 것임을 인정하면서—"미래에는 인간이 운전하는 차량이 거의 없을 것 같아요"—향후 5~10년 동안은 환대 서비스(호스피탈리티)가 사람 중심으로 이루어질 것이라고 강조했다.최근 데이터는 라이드셰어 운전사들에 대한 그의 우려를 뒷받침한다. 2025년 9월 Gridwise의 보고서에 따르면, 로보택시가 활성화된 모든 시장에서 라이드셰어 운전자의 시간당 급여가 하락했으며, 샌프란시스코는 6.9%, 오스틴은 5.3%의 하락을 기록했다.에어비앤비의 확장하는 생태계이 회사는 단순한 임대 플랫폼에서 체스키가 말하는 '올인원 앱'으로 탈바꿈해왔으며, 개인 셰프, 마사지, 사진 촬영 등과 같은 서비스로 영역을 확장하고 있습니다. 이러한 다양화는 2025년 5월에 검증된 전문가들이 평균 10년 이상의 경력을 가진 Airbnb 서비스와 함께 시작되었습니다."만약 AI가 많은 일자리를 대체하게 된다면, 그 중 일부라도 우리 플랫폼에서 성장하고 확대될 수 있기를 바랍니다,"라고 체스키는 컨퍼런스에서 밝혔습니다.AI로 인한 일자리 대체 현실체스키의 비전은 인공지능(AI)으로 인한 일자리 상실 경고가 점점 커지는 상황에서 등장했다. Anthropic의 CEO 다리오 아모데이는 최근 AI가 향후 5년 내에 모든 초급 화이트칼라 일자리의 절반을 사라지게 할 수 있으며, 실업률이 10~20%에 이를 수 있다고 예측했다.'AI의 대부'로 불리는 제프리 힌턴 역시 "평범한 지적 노동"이 대체될 위험이 있다고 경고하면서, 배관과 같은 육체적 직업이 더 안전한 선택일 수 있음을 시사했다. 최근 자료에 따르면 2025년 첫 5개월 동안 미국 내에서 696,000건 이상의 일자리가 줄었는데, 이는 전년도 대비 80% 증가한 수치다.체스키의 비전에서의 과제는, 일자리를 잃은 지식 노동자들이 숙박 호스팅 역할에 필요한 창업 역량을 갖추었는지, 경제적 압박 상황에서 높은 실업률이 여행 수요에 영향을 끼칠 것인지에 있다. 그럼에도 그의 전략은 인간 중심의 서비스가 AI 중심의 직장 변화 물결 속에서 하나의 돌파구가 될 수 있음을 시사한다.
21 조회
0 추천
09.11 등록
(퍼플렉시티가 정리한 기사)전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.AI 불일치의 근본 원인 파악하기"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.기업용 AI를 위한 제안된 솔루션He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.실리콘밸리의 최신 인공지능 연구소Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.
22 조회
0 추천
09.11 등록
(퍼플렉시티가 정리한 기사)마스터카드는 수요일, 연말 쇼핑 시즌을 앞두고 "에이전틱 커머스(agentic commerce)"를 가능케 하는 종합적인 인공지능(AI) 기반 결제 도구 제품군을 발표했습니다. 이 기능들은 AI 에이전트가 소비자와 기업을 대신해 거래를 완료할 수 있도록 해줍니다.이 금융 서비스 대기업은 자사의 확장된 에이전트 페이(Agent Pay) 프로그램이 연말까지 미국 내 모든 카드 소지자를 대상으로 제공될 예정이며, 이후 곧 글로벌 확장도 계획하고 있다고 밝혔습니다. 씨티와 U.S.뱅크 고객들이 이 AI 기반 결제 기능을 가장 먼저 이용하게 될 예정이며, 이커머스 플랫폼들도 이 기술 통합을 준비하고 있습니다.새로운 개발자 도구 및 산업 파트너십마스터카드는 AI 기반 거래 채택을 가속화하기 위해 설계된 네 가지 주요 이니셔티브를 중심으로 발표를 진행했습니다. 이 회사는 자사의 개발자 플랫폼에서 에이전트 툴킷을 출시했는데, 이를 통해 AI 어시스턴트가 Model Context Protocol 서버를 통해 마스터카드 API에 원활하게 접근할 수 있게 하여 Claude, Cursor, GitHub Copilot 등 다양한 플랫폼과의 통합을 지원합니다.Agent Sign-Up 기능은 AI 에이전트를 위한 간소화된 등록 절차를 제공하며, Insight Tokens는 SAP Concur 및 Agentic Consulting Services의 지원을 받아 AI 에이전트가 소비자 허가 데이터를 접근할 수 있는 프레임워크를 만듭니다. 이 도구들은 개발자가 AI 결제 기능을 보다 효율적으로 통합할 수 있도록 도와주어, 업계 보도에 따르면 구현 시간을 몇 주에서 몇 시간으로 단축할 수 있습니다.마스터카드는 Stripe, Alphabet의 Google, Ant International의 Antom 등 주요 기술 기업들과 협력하여 에이전트 결제 산업 표준을 확립하고 있습니다. 이 파트너십은 FIDO Alliance와 함께 상인 및 거래 정보를 확인하는 자격 검증 시스템 개발에 주력하고 있으며, AI 에이전트가 결제 기능을 갖게 됨에 따라 제기되는 보안 문제를 해결하는 데 중점을 두고 있습니다.강화된 보안 및 거래 제어회사는 동시에 주문형 의사결정(On-Demand Decisioning)을 도입하여 금융 기관이 맞춤화 가능한 규칙 엔진을 통해 거래 승인에 대한 실시간 제어 권한을 행사할 수 있도록 했습니다. 이 도구는 발급사가 승인 기준을 설정하고, 오탐지 거절을 줄이며, 고가치 고객을 위한 승인 우선순위를 부여할 수 있게 하며, 마스터카드의 RiskX 서밋(로마)에서 처음 공개되었습니다.마스터카드의 최고 제품 책임자인 요른 램버트(Jorn Lambert)는 "에코시스템 전반의 파트너들과 협력하여 에이전틱 커머스를 정의할 표준과 도구를 구축하고 있다"고 밝혔습니다. 이 이니셔티브는 인공지능 기반 에이전트가 최소한의 인간 개입으로도 복잡한 구매 업무를 안전하게 수행할 수 있게 하는 자동화된 디지털 거래 패러다임으로의 중요한 전환을 의미합니다.마스터카드 주식은 올해 들어 11% 상승했으며, 이는 S&P 100 지수의 12% 수익률에 약간 못 미치는 수치로, 회사가 변화하는 디지털 결제 시장에서 가치를 창출하기 위한 다양한 이니셔티브를 추진하고 있음을 보여줍니다.[퍼플렉시티에 추가 질문-답변]추가 질문: "이 기술은 어떻게 동작하는가"Mastercard의 에이전트 상거래(Agentic Commerce) 및 Agent Pay 기술은 AI 에이전트가 사용자의 결제 요청을 받아 직접 결제를 실행하는 자동화·보안 기반 시스템입니다.주요 동작 원리- AI 에이전트 인터페이스사용자가 챗봇이나 음성 비서 등에 요청(예: "운동화 사줘")을 하면, AI 에이전트가 사용자의 선호와 구매 조건을 파악하고, 다양한 온라인 쇼핑 플랫폼에서 상품을 자동 탐색·비교합니다.- 결제 자동화 및 토큰화선택된 상품·서비스에 대해 구매가 결정되면, AI 에이전트는 결제 요청을 마스터카드 네트워크로 전송합니다. 실제 카드 정보 대신 Agentic Token이라는 임시·암호화 토큰이 발급되어 결제가 처리되므로 개인 정보 노출 없이 안전하게 거래가 이루어집니다.- 에이전트 등록 및 검증모든 AI 에이전트는 사전 등록·신뢰 검증을 받아야 하며, 인증된 에이전트만이 결제 토큰을 요청할 수 있습니다. 사용자는 에이전트가 사용할 수 있는 한도(예: 최대 결제금액, 지정 상점 등)나 승인 조건까지 세밀하게 통제할 수 있습니다.- 실시간 인증 및 사기 모니터링결제 과정에서 추가 인증(생체인증, 패스키 등)을 통해 보안이 강화되어 있으며, Mastercard의 AI 기반 위험 감지 시스템이 실시간으로 거래의 이상 징후를 모니터링해 보안 위협과 사기를 예방합니다.거래 흐름 요약1. 사용자의 요청 → AI 에이전트가 상품 탐색·추천2. 구매 결정 → 에이전트가 결제 토큰 발급 요청3. Mastercard에서 토큰 발급 및 결제 승인4. 사용자 지정 조건(한도, 매장 등) 및 실시간 인증·보안 적용5. 거래 완료 후 기록과 데이터가 자동 축적되고, 필요시 사용자 최종 승인도 가능.핵심 기술- Mastercard Agentic Tokens: 실카드 정보 노출 없이 임시 결제 권한을 주는 보안 토큰.- AI 기반 사기 방지 시스템: 실시간 위험 감지로 결제 안전 강화.- 사용자·기관 맞춤형 제어: On-Demand Decisioning을 통해 거래 승인·거절 조건을 실시간 자동화.이 기술은 AI가 기존의 단순 추천에서 한 단계 더 나아가, 결제까지 자동으로 수행하며, 사용자와 기관 모두에게 강력한 제어권과 최신 보안 환경을 제공합니다.
46 조회
0 추천
09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입