Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
1,842 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 1,252 / 296 페이지
알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다.이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다. 이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.다양한 이미지 사례는 링크에서 확인할 수 있다.오픈소스여서 설치형으로도 테스트 가능.
2181 조회
0 추천
2025.08.05 등록
미국 패션잡지 Vogue 가 AI 를 이용한 광고 사진 사용으로 논란이 일고 있다.최근 보그(Vogue) 잡지 8월호에 게재된 광고가 큰 논란을 불러일으키고 있다. Guess 브랜드의 광고에 AI로 생성된 모델이 등장하면서, 독자들은 이에 반발하며 구독을 취소하고 보이콧을 촉구하고 있는 것. 이 광고는 단순히 패션업계의 혁신으로 받아들여지기보다는, 기술이 인간의 창의성과 직업에 미치는 영향에 대한 광범위한 논쟁의 불씨를 당기고 있다고 테크크런치는 전했다. 이 사건은 소셜 미디어, 특히 틱톡에서 큰 논란이 되며 많은 비판이 일고 있다.보그 미국판 2025년 8월호에 실린 게스(Guess) 광고의 AI 모델은 금발의 백인 여성이다.광고 이미지 속에서 이 모델은 줄무늬 원피스와 플로럴 수트를 착용하고 포즈를 취하고 있었으며, 언뜻 보기에는 실제 사람처럼 보인다. 하지만 이미지 한쪽 구석에 'AI 생성 이미지'라는 작은 문구가 적혀 있어 이 모델이 인공지능으로 만들어진 것임을 알 수 있다.광고 제작사는 실제 모델을 고용하여 촬영한 데이터를 기반으로 AI 이미지를 완성했다고 밝혔고, 모델의 모습은 현실적인 동시에 AI가 만들어낸 '완벽한' 모습이기도 하였다.틱톡 링크 참고https://www.tiktok.com/@lala4an/video/7529605769386364191
2314 조회
0 추천
2025.08.04 등록
올해 초 애플은 'Answers, Knowledge and Information'이라는 전담팀을 신설하고, 이 팀에 'ChatGPT의 축소된 경쟁자'를 개발하는 임무를 부여했다고 블룸버그가 보도했다. 이는 2024년 Siri에 ChatGPT를 통합하기 위해 OpenAI와 협력하려던 이전 전략에서 방향을 전환한 것으로 보인다.로운 팀은 로비 워커(Robby Walker)가 이끌고 있으며, 웹을 탐색하여 질문에 답변할 수 있는 'ChatGPT와 유사한 검색 경험'을 만들 예정이라고 한다. 이 기술은 독립적인 애플리케이션으로 출시될 수도 있고, Siri, Spotlight, Safari 등 기존 애플 서비스의 기능을 강화하는 데 활용될 수도 있을 것으로 예상된다.
2245 조회
0 추천
2025.08.04 등록
두바이의 한 셰프가 OpenAI의 챗봇 ChatGPT를 활용해 개발한 피자 레시피가 예상외의 큰 성공을 거두고 있다고 보도되었습니다.국제 피자 체인 도도피자의 메뉴 개발 책임자인 스파르타크 아루티냔은 두바이의 요리 전통을 반영한 피자 레시피를 ChatGPT에게 요청했고, AI는 아랍 샤와르마 치킨, 인도식 구운 파니르 치즈, 중동 자타르 허브, 타히니 소스를 조합한 독특한 레시피를 제안했습니다.이는 특별히 독창적이라기보다는 피자에 얹을 수 있는 여러 문화의 맛을 섞어 만든 퓨전 스타일이었으나, 실제로 출시한 결과 핫케이크처럼 팔리기 시작했으며 현재도 메뉴에 올라와 있다고 합니다.아루티냥은 셰프로서 평소라면 이런 재료들을 피자에 섞지 않았을 것이지만 맛의 조합이 놀라울 정도로 좋았다고 평가했습니다.다만 ChatGPT가 제안한 딸기와 파스타를 얹은 피자나 블루베리와 시리얼을 곁들인 파이 등 다른 레시피들은 통과하지 못했다고 밝혔습니다.전문가들은 AI가 창의성이 침체되었을 때 뇌를 다시 활성화하는 좋은 도구가 될 수 있으며, 인간이 생각하지 못했을 수도 있는 것을 제안할 수 있다고 평가하고 있습니다.
2304 조회
0 추천
2025.08.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입