Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
829 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 528 / 82 페이지
(퍼플렉시티가 정리한 기사)Google은 화요일 Agent Payments Protocol(AP2)을 공개하며, 통합된 스테이블코인 지원을 통한 AI 에이전트 기반 상거래를 위한 표준화된 인프라 구축에 대한 주요한 추진을 발표했다. 이 오픈소스 프로토콜은 이미 Coinbase, Mastercard, PayPal, American Express, 그리고 Salesforce를 포함한 60개 이상의 조직으로부터 지원을 확보했다.이 프로토콜은 AI 에이전트가 점점 더 자율적인 구매 결정을 처리함에 따라 중요한 인프라 개발을 나타낸다. 인간이 개시하는 거래를 위해 설계된 전통적인 전자상거래 시스템과 달리, AP2는 AI 에이전트가 검증 가능한 승인 체인과 거래 책임을 유지하면서 안전하게 결제를 개시할 수 있는 프레임워크를 생성한다.암호화폐 통합이 에이전트 상거래를 강화하다이 프로토콜의 가장 중요한 혁신은 Coinbase 및 이더리움 재단과 협력하여 개발된 암호화폐 통합에 있습니다. Google Cloud의 Web3 책임자인 James Tromans는 이 시스템이 “기존 결제 레일의 역량과 헤리티지뿐만 아니라 스테이블코인과 같은 앞으로 도입될 기능까지 모두 반영하도록 처음부터 구축되었다”고 말했습니다.Coinbase의 파트너십은 자체 AI 및 암호화폐 결제 인프라와의 상호운용성을 보장하며, 이 협업은 MetaMask 등 다른 암호화폐 업체로도 확장됩니다. Coinbase 개발자 플랫폼의 엔지니어링 책임자 Erik Reppel은 그들의 공통 목표를 강조하며 “우리는 모두 AI가 서로에게 가치를 전송할 수 있는 방법을 찾기 위해 노력하고 있다”고 밝혔습니다. 이 통합에는 또한 암호화폐 지갑에서 AI 기반 구매를 가능하게 하는 x402 프로토콜 지원도 포함됩니다.이중 명령 보안 아키텍처AP2는 암호화 서명이 된 디지털 위임장을 사용하여 에이전트 거래를 승인하는 정교한 보안 모델을 적용합니다. 시스템은 두 가지 별도의 승인을 요구합니다. 첫 번째는 에이전트가 특정 제품을 검색하고 판매자와 협상하는 것을 승인하는 “의향 위임장(intent mandate)”, 두 번째는 상품이 확인된 후 최종 구매를 승인하는 “장바구니 위임장(cart mandate)“입니다.완전 자동화된 구매의 경우, 이 프로토콜은 에이전트가 장바구니 위임장을 자동으로 생성할 수 있도록 허용하지만, 가격 한도, 시간 제약, 참여 조건 등 더 상세하게 명시된 의향 위임장이 요구됩니다. 이러한 이중 위임장 시스템을 통해 사용자 제어를 유지하면서 에이전트 활동에 대한 추적 가능한 감사 경로를 제공하여 사기 방지를 보장합니다.기존 구글 프로토콜을 기반으로 구축하기AP2는 4월에 출시된 Google의 기존 Agent2Agent(A2A) 프로토콜을 확장하는 것으로, 이는 다양한 플랫폼과 공급업체 간의 AI 에이전트 간 통신을 표준화했습니다. 결제 확장 기능은 또한 Anthropic의 Model Context Protocol(MCP)과 통합되어, 에이전트 간 상호작용과 거래를 위한 포괄적인 프레임워크를 만듭니다.Google은 GitHub에서 완전한 기술 사양을 제공하고, 표준화 기구를 통한 지속적인 협업을 통해 개방형 개발에 대한 의지를 강조했습니다. 회사 임원들은 더 넓은 결제 및 기술 커뮤니티가 참여하는 “개방적이고 협력적인 과정”을 통해 이 인프라를 구축하겠다는 헌신을 강조했습니다.
622 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)세계 최고의 AI 기업 두 곳이 이번 주에 자사의 챗봇 사용 방식에 대한 경쟁 연구를 발표했으며, 인공지능 시장에서 개인용과 기업용 애플리케이션 간의 새로운 분열이 나타나고 있음을 보여주는 현저하게 다른 패턴을 드러냈습니다.OpenAI에 따르면, ChatGPT는 주로 소비자용 도구로 진화했으며 이제 대화의 73%가 업무보다는 개인적인 작업에 초점을 맞추고 있습니다. 이는 불과 1년 전만 해도 거의 반반이던 것과 두드러진 변화입니다. 한편, Anthropic의 연구에 따르면 기업들은 Claude 어시스턴트를 압도적으로 자동화를 위해 사용하고 있으며, 기업 API 상호작용의 77%가 협업이 아닌 전체 작업 위임임을 보여줍니다.개인용도가 ChatGPT 플랫폼을 지배하다OpenAI가 하버드 경제학자 데이비드 데밍과 함께 실시하고 전미경제연구소(NBER) 워킹페이퍼로 발표한 연구는 7억 명의 주간 사용자들로부터 150만 건의 대화를 분석했다. 연구 결과, 업무 외 메시지 비율은 2024년 6월 53%에서 2025년 6월에는 70%를 넘어섰으며, 일일 메시지량도 4억 5,100만 건에서 26억 건으로 급증했다.하버드의 데밍은 전체 대화 중 인사 혹은 친근한 소셜 채팅이 2%에 불과하다고 밝혀, AI 동반자 행태의 광범위한 확산에 대한 우려와는 다르다고 지적했다. 대신 실용적 안내, 정보 탐색, 글쓰기 등 세 가지 주요 용도가 전체 상호작용의 약 78%를 차지한다는 점을 밝혔다. 또한 이번 연구에서는 젠더 격차가 좁혀지고 있음을 보여줬는데, ChatGPT 출시 당시 20%에 불과하던 여성 사용자가 현재는 52%를 차지한다.기업의 자동화 집중이 일자리 우려를 높인다Anthropic의 경제 지수 보고서는 비즈니스 사용자들에게 다른 관점을 제시합니다. Anthropic은 기업들이 주로 전체 작업을 AI 시스템에 위임하는 “지시적” 자동화에 Claude를 활용한다는 사실을 발견했으며, 이는 공동 작업 방식보다는 AI가 모든 작업을 대신 수행하는 형태입니다. 소프트웨어 개발은 기업 사용자들의 Claude API 트래픽 중 44%를 차지하며, 추가로 5%는 AI 시스템 자체를 개발하고 평가하는 데 사용됩니다.자동화 추세는 빠르게 가속화되고 있습니다. Anthropic은 일반 사용자 플랫폼에서 지시적 대화 비율이 단 8개월 만에 27%에서 39%로 상승했다고 보고했으며, 이는 자동화 사용이 공동 상호작용을 처음으로 넘어선 시점입니다.미래 업무에 대한 시사점이러한 상반된 사용 패턴은 AI가 고용에 미치는 영향에 대한 논쟁을 재점화시켰습니다. Anthropic의 CEO인 다리오 아모데이는 이전에 AI가 5년 내에 초급 사무직의 50%를 없앨 수 있으며, 이는 실업률을 10~20%까지 끌어올릴 수 있다고 경고한 바 있습니다. 최근 기업들이 인간-AI 협업보다는 완전 자동화를 선호한다는 새로운 데이터가 이러한 그의 발언에 더욱 힘을 싣고 있습니다.스탠퍼드 대학의 커뮤니케이션 교수 제프 핸콕은 AI 도입의 두려움이 특히 젊은 직원들 사이에서 작업이 자동화될 수 있다는 사실을 드러내는 것을 꺼리는 상황에서 직장 내 AI 채택을 제한하고 있을 수 있다고 언급했습니다. 연구 결과에 따르면 이런 긴장이 플랫폼마다 다르게 나타나고 있는데, ChatGPT는 점점 더 개인적인 용도로 사용되는 반면, Claude는 비즈니스 중심으로 활용되는 경향이 높아지고 있습니다.AI 기업들이 각기 다른 시장 영역을 개척하는 가운데, 이러한 사용 패턴은 AI 기술의 경제적 영향이 소비자의 일상 업무를 지원하는 용도인지, 아니면 전문적 워크플로우 전체를 자동화하는 데 쓰이는지에 따라 크게 달라질 수 있음을 시사합니다.
644 조회
0 추천
2025.09.16 등록
오늘 Apple은 iPhone, iPad, Mac, Apple Watch, Apple Vision Pro를 망라해 사용자 경험을 향상하는 새로운 Apple Intelligence 기능을 공개했다. 사용자가 언어의 장벽을 넘나들며 매끄럽게 소통할 수 있게 해주는 ‘실시간 번역’, 다양한 앱에서 화면 속 콘텐츠에 대한 자세한 정보를 제공하는 ‘비주얼 인텔리전스’,1 사용자가 개성을 표현할 수 있게 해주는 업데이트된 ‘젠모지’와 Image Playground까지, 오늘 공개된 신규 기능은 OS 전반에 걸쳐 깊숙이 통합되어 있다.2 이에 더해, ‘단축어’ 기능은 이제 Apple Intelligence 모델을 직접 활용해 워크플로를 가속할 수 있고, 개발자는 Apple Intelligence의 핵심에 자리한 온디바이스 파운데이셔널 모델을 이용해 개인정보를 보호하는 스마트한 기능을 앱에 설계할 수 있다Apple Intelligence가 활성화된 기기를 보유한 사용자는 오늘부터 iOS 26, iPadOS 26, macOS Tahoe 26, watchOS 26, visionOS 26에서 새로운 기능들을 만나볼 수 있다. 또한, Apple Intelligence 기능들은 머지않아 덴마크어, 네덜란드어, 노르웨이어, 포르투갈어(포르투갈), 스웨덴어, 튀르키예어, 중국어(번체), 베트남어까지 총 8개의 언어를 추가 지원할 예정이다.언어 장벽을 허무는 실시간 번역언어 장벽에 맞닥뜨리는 순간이 있을 수 있다. 이때, ‘실시간 번역’의 도움을 받아 특정 언어를 넘나들며 메시지를 작성하거나 대화할 수 있다. 이 기능은 ‘메시지’, FaceTime, ‘전화’에 매끄럽게 통합되어 있으며, AirPods Pro 3 사용자도 대면 대화 시 iPhone의 Apple Intelligence 기능으로 구동되는 실시간 번역 기능을 이용할 수 있다.3이 강력한 신규 기능으로 사용자는 통화, FaceTime, 대면 대화, ‘메시지’ 앱에서의 대화와 같이 모든 유형의 대화를 필요하다면 언제든지 번역할 수 있다. 또한 온디바이스 처리로 개인정보를 보호하고 개인 간 대화를 안전하게 지킨다.‘메시지’ 앱에서 ‘실시간 번역’은 사용자가 답장을 입력하면 자동으로 수신자의 언어로 번역해 전달한다.4 FaceTime 통화 중, 사용자는 친구 또는 가족의 음성을 듣는 동시에 실시간으로 번역된 자막을 따라 읽을 수 있으며, 통화 중에는 번역된 내용이 음성으로 실시간 제공된다.5AirPods에서 실시간 번역 기능을 통해 선호하는 언어로 음성을 들으려면 양쪽 스템을 동시에 누르는 완전히 새로운 제스처를 활용하거나, “시리야, 실시간 번역 시작해줘”라고 말하거나, iPhone의 동작 버튼을 조작하면 된다. 액티브 노이즈 캔슬링(ANC)은 말하는 사람의 음성을 낮춰주어 번역 음성에 집중하기가 쉬워진다.‘전화’, FaceTime, AirPods을 위한 ‘실시간 번역’ 기능은 올해 말부터 한국어, 이탈리아어, 일본어, 중국어(북경어, 간체), 중국어(북경어, 번체)로 확장 지원될 예정이다.자세한 내용은 아래 주소에서 확인할 수 있다. - 애플 보도자료
616 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)마이크로소프트()가 자사의 핵심 오피스 애플리케이션 전반에 걸쳐 무료 Copilot Chat 기능을 도입한다고 발표하며, 수백만 비즈니스 사용자를 대상으로 AI 지원 기능을 민주화하는 전략적 전환을 알렸습니다. 2025년 9월 15일부터 Word, Excel, PowerPoint, Outlook, 그리고 OneNote는 Microsoft 365 구독자를 위해 추가 비용 없이 Copilot Chat 사이드바를 제공할 예정입니다.무료 Copilot Chat은 각 애플리케이션 내의 사이드 패널에 나타나며, 현재 열려 있는 문서나 파일을 기반으로 한 상황에 맞는 지원을 제공합니다. 사용자는 별도의 애플리케이션 전환이나 파일 업로드 없이 워크플로우 내에서 직접 AI 어시스턴트를 이용할 수 있습니다. 또한 시스템은 향상된 파일 참조 기능을 포함하고 있어, 사용자가 “/“를 입력하면 관련 문서를 검색할 수 있고, Copilot이 최근에 사용한 파일을 자동으로 제안합니다.향상된 기능 및 GPT-5 통합이번 롤아웃에는 채팅 경험을 향상시키는 여러 가지 개선 사항이 포함되어 있습니다. 마이크로소프트는 입력 상자를 확장하여 더 긴 프롬프트를 입력할 수 있게 했으며, 채팅 인터페이스 내에서 여러 이미지를 직접 업로드할 수 있도록 지원을 추가했습니다. 사용자는 이제 Pages, 에이전트, 이미지 생성 도구 등 다양한 기능을 빠르게 이용할 수 있습니다.마이크로소프트에 따르면, 무료 버전은 GPT-5 기술로 구동되며 모든 사용자에게 점진적으로 제공되고 있습니다. 회사는 Copilot의 답변이 구조, 시각 자료, 인용이 개선되어 이전보다 30% 더 길어졌으며, 사용자 만족도가 11% 증가했다고 보고했습니다.Microsoft 365 Copilot 제품 마케팅 총괄 매니저 Seth Patton은 무료 버전에 대해 “콘텐츠 인식이 가능하며, 사용자가 작업 중인 내용을 빠르게 이해하여 현재 열려 있는 파일에 맞춰 답변을 맞춤 제공합니다”라고 강조했습니다. 이 서비스는 엔터프라이즈급 보안 보호 기능을 유지하며, 기존 Microsoft 365 Copilot Chat 관리 프로토콜을 따릅니다.프리미엄 기능은 여전히 구독이 필요합니다무료 요금제가 상당한 기능을 제공하지만, 마이크로소프트는 프리미엄 제품과의 명확한 차별점을 유지하고 있습니다. 월 $30의 Microsoft 365 Copilot 라이선스를 구매하면 단일 문서가 아닌 전체 업무 데이터셋을 대상으로 한 추론 등 고급 기능에 접근할 수 있습니다. 프리미엄 가입자는 파일 업로드, 이미지 생성, 최신 GPT-5 기술에 대한 우선 접근권과 더 빠른 응답 속도, 사용량이 많은 시간에도 꾸준한 가용성을 누릴 수 있습니다.라이선스 사용자는 Researcher와 Analyst와 같은 고급 추론 에이전트, AI 기반 검색 기능, 프로젝트별 노트북, Create 기능을 통한 종합적인 AI 그래픽 디자인 도구 등도 이용할 수 있습니다. 프리미엄 버전은 개인 및 공유 문서, 이메일, 회의, 채팅을 동시에 분석하고 추론할 수 있습니다.업계 분석가들은 이러한 움직임이 기존에 구독료를 부담스러워하던 중소기업들 사이에서 AI 도입을 가속화하려는 마이크로소프트의 전략을 보여준다고 지적합니다. 마이크로소프트에 따르면 Fortune 500 기업의 약 70%가 이미 Microsoft 365 Copilot을 사용하고 있으며, 무료 요금제는 더 많은 조직이 프리미엄 구독을 결심하기 전에 AI 기반 생산성 도구를 손쉽게 경험할 수 있는 진입점을 마련합니다.
661 조회
0 추천
2025.09.16 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입