AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
1,191 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 801 / 156 페이지
(퍼플렉시티가 정리한 기사)Meta는 9월 17일 Meta Connect 콘퍼런스에서 오랜 기간 기대를 받아온 EMG 뉴럴 손목밴드를 공개할 준비를 하고 있습니다. 이는 스마트 글래스 기술의 진화에 있어 중대한 순간을 의미합니다. 팔의 근육 신호를 감지하는 전기생리학(EMG) 기술을 사용하는 이 손목밴드는 Meta의 차세대 스마트 글래스인 하이퍼노바(Hypernova)와 함께 첫 선을 보일 예정이며, “Meta Celeste”라는 이름으로 출시될 가능성이 높습니다.EMG 손목밴드는 2019년 Meta가 CTRL-labs를 약 5억~10억 달러에 인수하면서 시작된 수년간의 연구의 결실입니다. 이 기기는 표면 근전도(sEMG) 기술을 활용해 팔뚝의 근육 수축으로 발생하는 전기 신호를 읽어내, 사용자가 손가락 집기, 두드림, 엄지 스와이프 등 미세한 손동작만으로도 디지털 인터페이스를 제어할 수 있게 해줍니다.혁신적인 제어 시스템내부 코드명 “Ceres”인 신경 손목밴드는 근육 활성화를 감지함으로써 손가락 움직임을 제어하므로, 외부 카메라나 센서 없이도 정밀한 제어가 가능합니다. Nature에 발표된 연구에 따르면, 이 장치는 손목 둘레에 16개의 금 도금 전극 센서를 배치하여 초당 2,000회(2kHz) 전기 신호를 샘플링하여 아주 미세한 움직임까지 포착할 수 있습니다.Meta Reality Labs의 신경운동 인터페이스 책임자이자 CTRL-labs의 전 대표인 Thomas Reardon은 이 기술이 사고(thought)를 읽는 것이 아니라 운동 정보(motor information)를 읽는 것이라고 밝히며 “이것은 사고를 담당하는 뇌의 부분이 아닌 운동 정보를 제어하는 뇌의 부분에서 나오는 것입니다”라고 설명했습니다. 해당 시스템은 검지 위로 엄지손가락을 쓸어 넘기는 제스처, 집는 동작, 손목 회전처럼 다양한 동작을 해석해 디지털 인터페이스를 탐색할 수 있습니다.스마트 안경 통합손목밴드는 Meta의 Hypernova 스마트 안경과 함께 패키지로 제공될 예정이며, 판매가는 약 $800로 예상됩니다. 이 안경은 Lumus에서 제조한 우측 렌즈에 작은 디스플레이를 탑재하고 있으며, 약 20도의 시야각을 제공하여 몰입형 경험보다는 실용적인 증강현실 응용에 초점을 맞추어 설계되었습니다.Apple의 Vision Pro가 카메라 기반의 손 추적에 의존하는 것과 달리, Meta의 방식은 손이 안경의 시야 밖에 있을 때에도 제스처 컨트롤이 가능합니다. 이 조합을 통해 사용자는 손의 자연스러운 움직임으로 알림을 받고, 인터페이스를 탐색하며, Meta AI와 상호작용하면서 주변 환경에 대해 완전히 인지할 수 있습니다.개발 과제 및 미래 응용 분야Meta는 개발 과정에서 여러 가지 기술적 문제에 직면했습니다. 여기에는 손목의 올바른 위치 선정, 사용자마다 다른 성능 편차, 그리고 긴 소매와 같은 옷가지로 인한 간섭 등이 포함됩니다. 이 회사는 개별적인 보정 없이 다양한 사용자가 기기를 사용할 수 있도록 기계 학습 알고리즘을 활용해 이런 문제를 해결하고 있습니다.이 기술은 스마트 글라스 제어를 넘어 의료, 제조, 접근성 등 다양한 분야에 활용될 잠재력을 가지고 있습니다. Meta 연구진은 카네기 멜론 대학과 협력하여 척수 손상을 가진 사람들을 대상으로 손목 밴드를 테스트하고 있으며, 이는 이동성이 제한된 사람들이 컴퓨터와 상호작용할 수 있는 새로운 길을 열어주고 있습니다.마크 저커버그는 2월에 이 프로젝트의 상용화가 머지않았음을 확인하며, “이 프로젝트를 수년간 진행해왔고, 실제로 머지않아 제품에 적용될 무언가가 준비되고 있다”고 밝혔습니다. Meta Connect 2025가 며칠 앞으로 다가온 지금, 이 신경 손목 밴드는 연구 시제품에서 소비자 제품으로 전환할 준비가 된 것으로 보이며, 우리가 디지털 환경과 상호작용하는 방식을 근본적으로 바꿀 수 있을 것으로 기대됩니다.
939 조회
0 추천
2025.09.13 등록
(퍼플렉시티가 정리한 기사)OpenAI는 인공지능 개발의 초기 단계, 즉 아이디어 전 단계부터 프리시드(Pre-seed) 창업까지의 기업가들을 지원하기 위해 특별히 설계된 5주간의 멘토십 프로그램인 OpenAI Grove를 출시했습니다. 이 회사는 9월 12일에 이 프로그램을 발표했으며, OpenAI의 COO인 브래드 라이트캡(Brad Lightcap)이 소셜미디어 플랫폼 X에서 해당 프로그램을 소개했습니다.전통적인 스타트업 액셀러레이터나 4월에 출시된 OpenAI의 기존 Pioneer Program과는 달리, Grove는 아직 아이디어를 탐색하거나 AI 창업에서 방향을 모색하는 개인들을 주요 대상으로 삼고 있습니다. OpenAI에 따르면, 이 프로그램은 “AI 분야에서 무언가를 만들어보고자 하는 깊은 호기심을 가진 아이디어 전 단계의 개인”을 위한 것이며, 참가자들에게는 “조밀한 인재 네트워크, OpenAI 연구자들과의 공동 개발, 그리고 여러분의 여정을 가속화할 수 있도록 설계된 리소스”가 제공될 예정입니다.프로그램 구조 및 일정첫 번째 Grove 코호트는 약 15명의 참가자를 포함하며, 2025년 10월 20일부터 11월 21일까지 진행됩니다. 지원 마감일은 9월 24일입니다. 이 프로그램은 OpenAI의 샌프란시스코 본사에서 개최되며, 대면 워크숍, 주간 오피스아워, 그리고 회사의 기술 리더들로부터의 멘토링을 제공합니다.참가자들은 매주 4-6시간의 비동기 학습에 전념해야 하며, 첫 주와 마지막 주에는 반드시 대면으로 참석해야 합니다. OpenAI는 이 필수 세션에 대한 여행 비용을 지원합니다. 주요 혜택으로는 OpenAI의 새로운 도구와 모델을 공개 전에 미리 체험할 수 있는 기회가 포함되어 있습니다.산업 환경과 경쟁그로브 프로그램은 인공지능(AI) 투자 활동이 급증하는 가운데 출범했다. J.P. 모건의 분석에 따르면, 2025년 미국 벤처 투자 자금의 71%가 AI 기업에 투입되어 전년도의 45%에서 크게 증가했다. CB 인사이트의 자료에 따르면 AI 스타트업은 2025년 상반기 동안 1,043억 달러를 조달했으며, 현재 1,300개 이상의 AI 스타트업이 1억 달러 이상의 가치가 있다.오픈AI는 유사한 이니셔티브를 내세우는 다른 IT 공룡들과 경쟁하고 있다. 구글은 지난 겨울에 Startups Cloud AI Accelerator를 도입했고, 마이크로소프트는 PearlX와 협력하여 프리시드(pre-seed) 기업을 위한 액셀러레이터 프로그램을 만들었다.프로그램 종료 후 기회Grove 프로그램을 완료한 후 참가자들은 OpenAI와 계속 협력하거나, 자금 조달을 모색하거나, 회사 생태계 안팎에서 다른 벤처에 도전할 기회를 얻게 됩니다. 이 프로그램은 AI 혁신가들의 장기 네트워크를 구축하고 스타트업 커뮤니티 내에서 영향력을 확대하려는 OpenAI의 광범위한 전략의 일부를 나타냅니다.이 프로그램은 모든 배경과 경험 수준의 개인에게 열려 있으며, 참가자들은 반드시 OpenAI의 API 플랫폼에서만 구축할 필요는 없습니다. 지원은 OpenAI 웹사이트를 통해 제출할 수 있으며, 그룹 지원도 환영한다는 점을 회사는 강조하고 있습니다.
1027 조회
0 추천
2025.09.13 등록
(퍼플렉시티가 정리한 기사)마이크로소프트(Microsoft)의 AI CEO 무스타파 술레이만(Mustafa Suleyman)은 목요일 전사 타운홀 미팅에서 이 기술 대기업이 AI 분야에서 “자급자족”을 달성하기 위해 자체 AI 칩 클러스터에 “대규모 투자”를 하겠다고 발표했다. 이는 외부 AI 공급업체에 대한 의존도를 줄이면서도 주요 파트너십을 유지하겠다는 전략적 전환을 의미한다.이 발표는 마이크로소프트와 오픈AI(OpenAI)가 챗GPT(ChatGPT) 개발사의 영리 목적 구조 전환을 허용하는 비구속적 합의를 최종 마무리한 가운데 나온 것으로, 이는 양사 간 수개월 간의 긴장된 협상을 마무리한다.마이크로소프트의 AI 독립 추진올핸즈 미팅에서 직원들에게 연설하면서, 술레이만은 회사가 AI 역량에 대해 더 큰 통제력을 가질 필요성을 강조했습니다. “우리 규모의 회사, 그리고 우리가 보유한 다양한 사업을 고려하면, 필요할 때 AI에서 자급자족할 수 있다는 것이 매우 중요합니다,“라고 그는 말했습니다.이번 인프라 투자 결정은 마이크로소프트가 AI 모델 트레이닝에서 겪고 있는 현재의 한계를 직접적으로 해결하기 위한 것입니다. 술레이만은 회사의 MAI-1-preview 모델이 단 15,000개의 엔비디아 H100 칩으로만 훈련되었으며, 그는 이를 경쟁사에 비해 “작은 클러스터”라고 설명했습니다. 구글, 메타, xAI의 모델들은 6~10배 더 큰 클러스터에서 훈련되었습니다.“우리는 모든 크기의 세계적 수준의 프런티어 모델을 직접 구축할 수 있는 역량을 갖춰야 하지만, 필요할 때는 매우 현실적으로 다른 모델을 활용해야 합니다,“라고 술레이만은 설명했습니다.증대하는 경쟁 속의 파트너십 전략독립에 대한 요구에도 불구하고, CEO 사티아 나델라는 Microsoft가 OpenAI와의 파트너십에 계속 전념하고 있음을 직원들에게 재확인했습니다. 나델라는 타운홀 회의에서 “우리는 OpenAI와 아주 훌륭한 파트너십을 맺고 있습니다. 그들과 계속 함께 일하고 그들을 지원할 수 있게 되어 매우 기대하고 있습니다.“고 말했습니다. “그리고 동시에, 우리는 또한 우리만의 역량을 구축하고 싶다는 점도 매우 분명히 밝혔습니다”.두 회사는 목요일, 관계를 재구성하기 위한 비구속적 양해각서를 체결했다고 발표했으며, OpenAI의 비영리 모회사 측이 통제권을 유지하고 1,000억 달러 이상의 가치로 평가되는 지분을 받게 됩니다.Microsoft는 또한 AI 파트너십을 다각화하여, 일부 업무(예: PowerPoint 프레젠테이션)에서 OpenAI의 기술을 뛰어넘는 것으로 확인된 Anthropic의 모델을 Microsoft 365 애플리케이션에 통합한 것으로 알려졌습니다.인프라 투자와 시장 위치마이크로소프트의 2025 회계연도 AI 인프라 지출은 약 800억 달러에 이를 것으로 보이며, 이 중 절반 이상이 미국에 집중되어 있습니다. 최근 이 회사는 자체 개발한 첫 AI 모델인 MAI-Voice-1과 MAI-1-preview를 공개하며 외부 의존도를 줄이기 위한 초기 단계를 밟고 있습니다.MAI-1-preview 모델은 현재 LMArena의 널리 알려진 리더보드에서 24위를 기록하고 있으며, 마이크로소프트가 훈련 인프라를 확장함에 따라 상당한 개선의 여지가 있음을 시사합니다.
987 조회
0 추천
2025.09.13 등록
(퍼플렉시티가 정리한 기사)Google DeepMind의 CEO 데미스 하사비스는 금요일 아테네의 고대 로마 극장에서 연설을 하며 인류의 미래에 대해 엄중한 메시지를 전했습니다: “학습하는 방법을 배우는 것”이 앞으로 AI로 변화하는 세상을 살아가는 데 가장 중요한 기술이 될 것이라는 것입니다.노벨상 수상자이자 신경과학자인 하사비스는 아크로폴리스 아래에서 연설하며 범용 인공지능이 10년 이내에 도래할 수 있고, 이는 교육과 경력을 근본적으로 바꿔놓을 것이라고 경고했습니다. “미래를 예측하는 것은, 예를 들어 10년 후를 예측하는 것은 보통의 경우에도 매우 어렵습니다. AI가 주마다 변화하는 오늘날에는 그 예측이 더 어렵죠,“라고 하사비스는 청중에게 말했습니다. “확실하게 말할 수 있는 유일한 사실은, 엄청난 변화가 다가오고 있다는 것입니다.”불확실한 시대를 위한 메타스킬하사비스는 수학, 과학, 인문학과 같은 전통적인 과목과 함께 “메타 스킬”의 개발을 강조했습니다. 여기에는 효과적으로 배우는 방법을 이해하고 새로운 과목에 접근하는 방식을 최적화하는 것이 포함됩니다. 그는 아테네 행사에서 “한 가지 확실한 것은 여러분이 경력 내내 계속해서 배워야 한다는 점입니다”라고 말했습니다.AI 시스템을 개발해 단백질 접힘을 예측하는 성과로 2024년 노벨 화학상을 공동 수상한 48세의 전직 체스 신동 하사비스는 꾸준히 적응형 학습 전략의 중요성을 주장해왔습니다. 올해 초 그는 10대들에게 AI 도구를 능숙하게 다루는 “닌자”가 되면서도 코딩과 STEM 분야의 기본기를 유지하라고 조언했습니다.정부의 인공지능 도입과 불평등 우려그리스 총리 키리아코스 미초타키스는 정부 서비스에서 AI 활용 확대에 관한 논의 이후 아테네 행사에서 하사비스와 함께했다. 그러나 미초타키스 총리는 기술 기업들 사이에서 부의 집중에 대한 우려를 표했다. “사람들이 실제로 이 AI 혁명에서 개인적인 이익을 보지 못한다면, 점점 더 회의적으로 변할 수밖에 없습니다,“라고 총리는 말했다. “그리고 극소수의 기업에서 엄청난 부가 창출되는 것을 본다면, 이는 심각한 사회적 불안의 원인이 될 것입니다.”이러한 경고는 그리스가 주요 AI 기업들과 거래를 체결하는 가운데 나왔다. 여기에는 최근 OpenAI와의 협약을 통해 ChatGPT Edu를 전국 중등 교육 과정에 도입하기로 한 것도 포함된다.단백질 접힘에서 교육 혁명까지하사비스는 2010년 런던에서 딥마인드를 공동 설립했으며, 구글이 4년 후에 이를 인수하였습니다. 그의 팀이 이뤄낸 알파폴드의 획기적인 성과는 단백질 구조를 정확히 예측함으로써 50년 된 생물학의 난제를 해결했고, 이 업적은 그와 동료 존 점퍼에게 2024년 노벨 화학상을 안겨주었습니다.현재 하사비스는 구글의 LearnLM과 같은 이니셔티브를 통해 교육 분야에 유사한 AI 원칙을 적용하고 있으며, 이 기술은 맞춤형 학습 경험을 제공하고 지식의 빈틈을 찾아낼 수 있습니다. 그는 AI 튜터가 전 세계 소외 지역에 양질의 교육을 제공할 수 있을 것으로 기대하고 있습니다.
1033 조회
0 추천
2025.09.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입