Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
459 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 374 / 59 페이지
(퍼플렉시티가 정리한 기사)Google은 Google Photos의 사진-동영상 변환 기능을 자사의 첨단 Veo 3 인공지능 모델로 업그레이드했으며, 이는 최첨단 생성형 AI 기술을 일반 사용자에게 제공하려는 최신 조치입니다. 이 업그레이드는 수요일에 공식 발표되었으며 2025년 9월 4일부터 미국 사용자들에게 제공될 예정으로, 이전 Veo 2 시스템에 비해 동영상 품질이 크게 향상될 것을 약속합니다.이 업그레이드는 Google Photos의 새로운 "Create"(만들기) 탭 내에 포함되어 있으며, 이 탭은 AI 기반 창작 도구를 한 곳에 모아놓은 허브로, 회사는 8월부터 점진적으로 이 기능들을 도입해 왔습니다. 사용자는 이미지를 선택한 후 "섬세한 움직임" 또는 "운에 맡기기"라는 두 가지 애니메이션 프롬프트 중 하나를 선택하여, 6초 길이의 고화질 동영상 클립을 생성할 수 있습니다.향상된 비디오 품질 및 성능Google 대변인 마이클 마르코니(Michael Marconi)에 따르면, Veo 3는 이전 버전에 비해 해상도와 전반적인 클립 품질 면에서 상당한 개선을 제공한다고 합니다. 업그레이드된 모델은 더 사실적인 물리 시뮬레이션, 더 나은 조명과 반사, 그리고 향상된 객체 추적 기능을 제공하여 이전 버전의 특징이었던 ‘부유하는 듯한 움직임’과 같은 일반적인 문제들을 해결했습니다.주요 발전점은 Veo 3의 우수한 프롬프트 처리 능력에 있습니다. Veo 2가 기본적인 영화 촬영 지시만 수용했던 반면, Veo 3는 더 복잡한 시각적 지시를 더욱 직설적으로 실행하고, 일반적인 결과물을 줄여 사용자들이 원하는 예술적 의도에 더 근접한 클립을 만들어냅니다.하지만 이 업그레이드는 몇 가지 절충점도 수반합니다. Veo 3를 통해 Google Photos에서 생성된 동영상의 길이는 이제 4초로, 이전의 6초 클립보다 짧아졌고, Veo 3가 기본적으로 소리 생성 기능을 갖추고 있음에도 불구하고 Gemini와 같은 다른 Google 제품에서와는 달리 음성 기능이 포함되어 있지 않습니다.접근 제한 및 구독 등급Google 포토 사용자는 하루에 제한된 수의 동영상 생성을 받을 수 있으며, 더 높은 할당량은 Google AI Pro(월 $20) 및 Google AI Ultra(월 $250) 구독자에게 제공됩니다. 무료 등급의 제한은 첨단 AI 동영상 생성에 필요한 계산 비용을 반영하며, 이는 업계 전반에 걸쳐 공통적으로 나타나는 제약입니다.Create 탭에는 사진을 애니메이션이나 만화 삽화와 같은 다양한 예술적 스타일로 바꿔주는 Remix, 여러 이미지를 결합할 수 있는 Collage, 사진 라이브러리로부터 자동으로 음악이 포함된 몽타주 영상을 만들어주는 Highlight Videos 등 추가적인 AI 도구들도 포함되어 있습니다.이러한 통합은 프리미엄 구독자에게만 제공됐던 첨단 AI 기능을, 2025년 5월 기준 월간 활성 이용자 15억 명 이상을 보유한 구글의 대표적인 사진 서비스로 대중화하려는 구글의 광범위한 전략을 반영하는 것입니다.
476 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사)Google DeepMind는 중력파 천문학에 중대한 전환점을 가져올 수 있는 인공지능 시스템을 개발했습니다. 9월 3일 과학 저널 Science에 게재된 이 혁신적인 AI 기술은 Deep Loop Shaping이라 불리며, 기존 방법에 비해 레이저 간섭계 중력파 관측소(LIGO)에서 불필요한 잡음을 30~100배까지 줄일 수 있음을 입증했습니다.Google DeepMind와 Caltech 및 이탈리아 그란사소 과학연구소 연구자들의 협업은 중력파 신호를 가릴 수 있는 LIGO의 40킬로그램짜리 거울의 미세한 진동을 제어하는 것에 집중했습니다. 이런 진동은 종종 먼 바다의 파도와 지진 활동에 의해 발생하며, 오랫동안 우주적 사건을 감지하는 관측소의 민감도에 한계를 주는 요인이었습니다.혁신적인 소음 제어 기술딥 루프 셰이핑(Deep Loop Shaping)은 강화 학습을 사용하여 AI 알고리즘이 LIGO의 거울을 더 잘 안정화하는 방법을 익히도록 합니다. “우리가 훈련 데이터를 제공했고, 구글 딥마인드가 시뮬레이션을 실행했습니다. 기본적으로, 그들은 수십 개의 시뮬레이션된 LIGO들을 병렬로 실행하고 있었습니다,”라고 캘리포니아 공과대학교(칼텍) 물리학 교수이자 논문 공동 저자인 라나 아디카리(Rana Adhikari)가 설명했습니다. 이 시스템은 노이즈 캔슬링 헤드폰의 고급 버전처럼 작동하지만, 기존 제어 시스템이 진동을 보상할 때 자체적인 “쉬익” 소음을 발생시키는 근본적인 문제를 해결합니다.이번 AI 혁신은 특히 10~30 헤르츠(Hz) 주파수 범위의 노이즈를 목표로 하며, 이는 더 거대한 블랙홀 합병을 탐지하고, 합병 과정 초기에 포착하는 데 매우 중요합니다. 이 주파수 대역은 유명한 중력파 “챠이프(chirp)”가 고주파로 올라가기 전에 시작되는 지점입니다.블랙홀 탐지의 새로운 지평을 열다향상된 감도 덕분에 LIGO는 이전에는 감지할 수 없었던 새로운 유형의 블랙홀, 즉 항성질량 블랙홀과 초대질량 블랙홀 사이의 간극을 잇는 중간질량 블랙홀까지 탐지할 수 있게 될 것으로 보입니다. 캘리포니아 공과대학교(칼텍)의 중력파 연구 과학자인 크리스토퍼 비프는 이 기술을 "지상 기반 탐지기가 할 수 있는 일에 대한 우리의 인식을 바꿔주는 도구"라고 설명했습니다.LIGO는 현재 네 번째 관측 기간 동안 이미 200건이 넘는 블랙홀 병합을 탐지했으며, 현재는 거의 3일에 한 번씩 블랙홀 병합을 식별하고 있습니다. 2025년 7월, 지금까지 가장 질량이 큰 블랙홀 병합을 탐지한 것은 관측소의 역량이 한층 강화되고 있음을 보여줍니다.구글 딥마인드의 주저자인 요나스 부흘리는 딥 루프 셰이핑(Deep Loop Shaping)을 "혁명적이다. 왜냐하면 LIGO에서 가장 불안정하고 가장 어려운 피드백 루프의 노이즈 수준을 줄일 수 있기 때문"이라고 평가했습니다. 이 AI 시스템은 LIGO에서 1시간 동안 개념 증명 시험이 이뤄졌으며, 연구진은 더욱 긴 시간 테스트와 LIGO 시스템 전반에 걸친 폭넓은 적용을 계획하고 있습니다.이 기술은 중력파 탐지 외에도 다양한 분야에 적용될 수 있습니다. 구글 딥마인드 연구원들에 따르면, 딥 루프 셰이핑은 "진동 억제, 소음 제거, 그리고 항공우주, 로봇공학, 구조공학 등에서 중요한 매우 동적이거나 불안정한 시스템"에 활용될 수 있습니다.
461 조회
0 추천
2025.09.05 등록
SWITCHBOT이 IFA2025에서 귀여운 AI 로봇 반려동물 'Kata friends' 을 소개했다.귀엽고 털복숭이한 로봇들은 카메라와 내장형 대형 언어 모델(LLM)을 탑재해 자연어 명령을 이해하고물체 인식이 가능하며, 저지연(on-device low-latency)으로 항상 사용자의 곁에 있어주는동반자 역할을 목표로 한다. Noa와 Niko라는 이름의 이 로봇들은 주로 반려용으로 설계되었다고Kata friends는 가족 구성원을 인식하고, 몸짓과 감정에 반응하며, 행복, 슬픔, 심지어 질투 같은 감정도 표현한다.시간이 지남에 따라 사용자의 일상과 기억을 학습해 진화하는 존재가 된다고 SwitchBot은 설명한다.심지어 이 로봇들이 질투를 느낄 수 있다는 점은 다소 신기하고 신선한 개념이라고 체험을 한 GIZMODO 기자는 소개한다.로봇들은 작은 바퀴를 가지고 있어 스스로 움직일 수 있으며, 이것이 더 많은 상호작용과 자유로운 행동을 가능하게 한다.그러나 아직 출시 일정이나 가격 정보는 공개되지 않았다. 따라서 현재로선 정확히 언제 만나볼 수 있을지는 미지수이지만,SwitchBot은 과거에 혁신적인 로봇 제품들을 실제로 출시한 전력이 있어 기대를 모은다
444 조회
1 추천
2025.09.05 등록
워너 브라더스 디스커버리(Warner Bros. Discovery)가 AI 이미지 생성 플랫폼 미드저니(Midjourney)를 상대로 저작권 침해 소송을 제기했다고 헐리우드리포터가 보도했다. 소송은 미드저니가 워너 브라더스의 캐릭터들을 무단으로 복제해 이미지와 비디오를 생성, 이를 이용자들에게 제공하며 불법적으로 수익을 창출하고 있다고 주장한다. 미드저니는 배트맨, 슈퍼맨, 벅스 버니, 스쿠비 두 등 워너 브라더스의 저작권 캐릭터들을 포함한 다양한 콘텐츠를 무단으로 사용했다는 혐의를 받고 있다워너 브라더스는 미드저니가 저작권자의 허가나 승인 없이 워너 브라더스의 지적 재산권을 상업적으로 이용하며 "법 위에 군림한다"고 비판했다. 특히 미드저니가 저작권 보호를 위한 안전장치를 고의적으로 제공하지 않았으며, 최근에는 영상 생성 모델에서 저작권 침해를 방지하려던 조치를 철회했다고 소송에서 지적했다. 이러한 행위는 저작권 침해가 명백하며, 이로 인해 워너 브라더스가 엄청난 경제적 손실을 입었다고 강조한다.이번 소송은 앞서 디즈니와 유니버설이 미드저니를 상대로 제기한 저작권 소송과 맥락을 같이 한다. 이들 스튜디오는 미드저니가 자체 AI 시스템 훈련에 영화 및 TV 프로그램 등 자사 저작물을 무단으로 활용했다고 주장하며, "무한한 불법 복제물을 생성하는 가상 자판기"라고 비판했다. 워너 브라더스 또한 자사 콘텐츠와 창작자들을 보호하기 위해 이번 법적 대응에 나섰다소송 문서에는 미드저니가 배트맨과 같은 특정 캐릭터 이름을 명시하지 않아도 저작권 침해 이미지와 영상을 생성할 수 있다고 적시돼 있다. 예를 들어 "클래식 만화 슈퍼히어로 배틀"과 같은 일반적인 문구를 사용해도 워너 브라더스 캐릭터들이 복제된 이미지가 만들어질 수 있다고 한다. 따라서 미드저니가 저작권 침해의 범위와 심각성을 인지하면서도 이를 고의적으로 방치하고 있다는 점이 강조된다.워너 브라더스는 이번 소송을 통해 저작권 침해에 따른 손해 배상과 미드저니의 저작권 침해 행위 중단을 요구하고 있으며, 미드저니가 적절한 저작권 보호 조치를 도입할 때까지 AI 이미지 생성 서비스 제한을 요청하고 있다. 현재까지 미드저니 측은 이 소송에 대한 공식 입장을 밝히지 않았다
452 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입