AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
1,342 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 958 / 197 페이지
(퍼플렉시티가 정리한 기사)로빈후드(Robinhood Markets, Inc.)의 CEO 블라드 테네브(Vlad Tenev)는 수요일 공개된 블룸버그 웰스(Bloomberg Wealth)와의 인터뷰에서 인공지능(AI)이 거래에서 차지하는 역할에 대해 신중한 시각을 제시했습니다. 그는 AI가 중요한 플랫폼 변화임을 인정하면서도, 금융 시장에서 궁극적으로는 인간이 의사결정 권한을 가질 것이라고 주장했습니다.테네브는 데이비드 루벤스타인(David Rubenstein)과의 대화에서, 거래는 단순한 이윤 극대화 이상이기 때문에 이러한 인간적인 요소가 완전한 자동화를 막을 것이라고 강조했습니다. 그는 “대부분의 경우, 단순히 돈을 벌기 위해서만 거래하는 것은 아니다”라며 “거래를 사랑하고, 그 일에 매우 열정적이기 때문이기도 하다”고 말했습니다.인간 표현으로서의 거래테네브의 발언은 8월 Axios와의 인터뷰에서 그가 투자자들이 "정말로 거래를 즐긴다"고 언급한 이전 의견을 바탕으로 한다. 이러한 관점은 금융 의사결정이 알고리즘 최적화로 단순화될 수 있다는 생각에 도전하며, 거래를 단순한 계산 효율성만으로 이뤄지는 것이 아니라, 열정과 개인적 참여에 의해 주도되는 활동으로 자리매김한다.2013년에 로빈후드를 공동 설립한 그는 AI가 산업 전반에 걸쳐 변혁적인 잠재력을 가진다고 인정했다. "AI가 분명히 모든 것을 바꿀 것이라고 생각합니다. 이는 모바일과 클라우드로의 변화보다 더 큰 엄청난 플랫폼의 변화일 수 있습니다,"라고 그는 밝혔다. 그러나 그는 "모든 기업이 AI 기업이 될 것"이지만 인간이 여전히 금융 전략의 궁극적 판단자임을 유지할 것이라고 강조했다.업계 리더들은 신중함을 강조했다테네브의 신중한 입장은 다른 금융 업계 리더들의 관점과도 유사합니다. 시타델의 창립자이자 CEO인 켄 그리핀은 5월 스탠퍼드 경영대학원 인터뷰에서 투자 관리에서 AI가 혁명적일 잠재력에 대해 회의적인 시각을 나타냈습니다."우리 투자 사업에서 AI를 사용하나요? 약간, 약간. 이것이 게임 체인저라고 말할 수는 없습니다,"라고 그리핀은 말하며, AI를 "생산성 향상 도구"로 묘사했고 "시간을 약간 절약해주지만" "금융 분야에서 우리가 하는 대부분의 일들을 혁신하지는 않을 것"이라고 덧붙였습니다. 또한 그는 AI가 단기 거래 시나리오에서는 뛰어난 성과를 내지만, 머신러닝 모델은 "장기 투자 시계에 적용될 때 정말 무너진다"고 언급했습니다.골드만삭스, 다른 접근법 시도골드만 삭스 CEO 데이비드 솔로몬은 AI의 생산성 향상 효과에 대해 보다 낙관적인 시각을 보이고 있습니다. 2024년과 2025년 초 여러 차례의 인터뷰에서 솔로몬은 과거에는 수시간이 걸리던 분석 과정이 AI로 인해 극적으로 빨라졌음을 강조했습니다.“40년 전, 제가 금융업을 시작했을 때는 두 주식을 비교하는 데 6시간이 걸렸습니다. 이제는 한순간이면 됩니다.”라고 솔로몬은 CNBC 인터뷰에서 밝혔습니다. 이 투자은행은 7,000명 이상의 직원이 사용하는 30개 이상의 AI 도구를 도입했으며, 솔로몬은 AI가 2025년까지 골드만 삭스의 운영 방식을 “크게 바꿀 것”이라고 전망했습니다.시장 환경과 미래적 시사점이러한 논평은 로빈후드가 헤지펀드와 정치인들의 공개적으로 보고된 거래를 포함해 사용자들이 거래를 공유하고 추적할 수 있는 소셜 미디어 플랫폼 계획을 발표한 가운데 나왔다. 이 플랫폼은 2026년 초 베타 출시를 앞두고 있으며, 인간의 사회적 상호작용과 금융 기술을 융합하려는 또 다른 시도를 의미한다.AI 역할에 대한 테네브의 관점은 그가 최근 Kleiner Perkins가 주도한 시리즈 B 펀딩을 유치한 AI 수학 연구소 하모닉(Harmonic)의 회장이자 공동 창업자라는 이중적인 역할을 동시에 수행하고 있다는 점에서 특히 중요한 시사점을 지닌다. 이러한 이중적인 역할 덕분에 그는 AI 개발과 실제 금융 응용 분야 모두에 대해 독특한 인사이트를 얻을 수 있다.금융 리더들 사이의 다양한 견해는 AI가 거래 및 투자 관리에 미칠 궁극적인 영향에 대한 광범위한 불확실성을 반영한다. 일부는 생산성 향상을 강조하는 반면, 다른 이들은 알고리즘 시스템이 복잡한 금융 결정에 필요한 미묘한 판단을 복제할 수 있는지 의문을 제기한다.
1101 조회
0 추천
2025.09.12 등록
(퍼플렉시티가 정리한 기사)Reddit는 대형 인터넷 퍼블리셔 연합에 합류해 콘텐츠 제작자가 인공지능 기업이 그들의 작업물을 수집할 때 보상을 받을 수 있도록 돕는 새로운 오픈 소스 프로토콜인 Really Simple Licensing(RSL)을 지원하게 되었습니다. 2025년 9월 10일에 발표된 이번 소식으로 Reddit은 Yahoo, Medium, Quora 등 여러 퍼블리셔들과 함께 업계 관계자들이 인터넷 규모에서 AI 데이터 라이선싱에 대한 첫 번째 표준화된 접근 방식이라고 설명하는 움직임에 동참하게 되었습니다.법적 분쟁 속에서 새로운 기준이 등장하다AI 기업들이 저작권 문제에 직면하고 있는 가운데 RSL 이니셔티브가 등장했습니다. 최근 Anthropic은 자사의 AI 모델을 훈련시키는 데 불법 복제된 책을 사용했다고 주장한 작가들이 제기한 집단 소송을 해결하기 위해 15억 달러를 지불하기로 합의했습니다. 이 합의는 법원의 승인을 기다리고 있으며, Anthropic이 약 50만 권의 저작물에 대해 권당 약 3,000달러를 지급하고 모든 불법 데이터셋을 파기하도록 요구합니다.이 시기는 AI 기업들이 합법적인 라이선스 체계를 마련해야 한다는 압박이 증가하고 있음을 보여줍니다. Reddit CEO인 Steve Huffman은 RSL 표준이 "AI 시대에 퍼블리셔와 플랫폼이 명확하고 확장 가능한 방식으로 라이선스 조건을 설정할 수 있게 해준다"고 강조했습니다. Reddit은 2025년 6월에 사용자 게시물의 무단 스크래핑을 주장하며 Anthropic을 상대로 소송을 제기한 바 있습니다.기술적 프레임워크 및 집행의 과제공동 개발자 에크하르트 발터(Eckart Walther)와 전 Ask.com CEO 더그 리즈(Doug Leeds)가 널리 채택된 RSS 표준을 기반으로 구축한 RSL은 발행인이 로봇.txt 파일에 기계가 읽을 수 있는 라이선스 조건을 직접 임베드할 수 있게 해줍니다. 이 프로토콜은 구독료, 크롤링당 요금, AI 시스템이 답변에 콘텐츠를 참조할 때의 추론별 보상 등 다양한 결제 모델을 지원합니다.하지만 표준의 효과는 전적으로 AI 기업의 자발적 준수에 달려 있습니다. 주요 AI 기업들 중 어느 곳도 RSL 조건을 준수하겠다고 약속하지 않았으며, 이는 이전에도 기업들이 자주 무시했던 robots.txt 지침과 비슷한 문제를 떠올리게 합니다. RSL 콜렉티브는 콘텐츠 전달 네트워크인 Fastly와 협력하여 기술적 집행을 제공하고 있으며, 이는 리즈가 "입구의 경호원"이라고 묘사한 역할을 수행합니다.업계 연합, 집단 교섭력 모색비영리 단체인 RSL Collective는 ASCAP와 BMI와 같은 음악 산업 조직의 성공을 본떠, 퍼블리셔들의 권리를 모아 더 강력한 협상력을 확보하는 것을 목표로 한다. 참여 기업에는 인터넷 베테랑인 Yahoo, Reddit, Medium뿐 아니라 Quora와 Ziff Davis(이 회사는 CNET과 Mashable을 소유)를 포함한 새로운 플랫폼 및 콘텐츠 네트워크도 있다.이 연합은 개별 라이선스 계약에서 집단적 행동으로의 전략적 변화를 나타낸다. Reddit은 이미 Google(알파벳 Inc.) 및 OpenAI와 연 6천만 달러 규모의 별도 계약을 체결했지만, RSL을 더 포괄적이고 실제 사용 패턴을 더 잘 반영할 수 있는 해법이라며 지지한다.업계의 지지에도 불구하고, 이 표준은 AI 기업들의 채택 없이는 미래가 불확실하며, 자발적 준수보다는 주로 법적 분쟁과 기술적 제약에 집행이 의존하게 된다.
1144 조회
0 추천
2025.09.12 등록
제목 AI 이미지 업스케일은 실제 사실을 보여주지 않는다최근 소셜미디어에서는 도널드 트럼프 대통령의 건강 악화설과 관련된 AI 이미지 업스케일 사진이 확산되었다. AI로 이미지를 '보정'하면 진짜 모습을 확인할 수 있을 것처럼 보이지만, 실제로는 원본에 없던 내용이 추가되어 잘못된 정보를 만들어 낸 것이다.예를 들어, 트럼프의 이마에 이상한 덩어리가 보인다는 의혹이 돌았으나, 이는 AI가 어두운 그림자나 주름을 임의로 해석해서 만들어낸 가짜 정보였다. 사람들은 이 이미지를 보고 '뇌수술 흔적'이라거나 구체적 진단을 내리기도 했지만, 모두 사실이 아니다이처럼 AI 이미지 보정이나 업스케일 도구는 실제 정보를 알려주기보다는, 픽셀의 패턴을 임의로 채워서 그럴듯하게 보이게 만들 뿐이다. 그래서 이미지를 검사하는 또 다른 AI(Grok 등)도 진위를 제대로 판별하지 못하는 사례가 많았다2022년 오스카 시상식에서 윌 스미스가 크리스 록을 뺨 때린 영상을 AI로 보정했더니, 록의 얼굴에 이상한 보호구가 있다고 오해하는 등 새로운 음모론을 낳았다. 이는 원본 이미지의 그림자나 주름을 AI가 과도하게 강조해 실제로 없는 내용을 덧입힌 결과였다.AI 업스케일 도구는 게임이나 픽션 장면 등을 선명하게 만드는 데는 활용 가치가 있지만, 역사적 영상이나 뉴스 이미지를 보정하여 '진실'을 밝히려는 시도에는 한계가 명확하다. 가짜 정보가 주로 퍼질 수 있으므로, 현실을 판단할 때 AI 보정 이미지를 신뢰해서는 안 된다.https://gizmodo.com/ai-zoom-enhance-does-not-work-2000651736
1140 조회
0 추천
2025.09.12 등록
컬리가 인공지능(AI) 식단 관리 앱 루션’(Roution)을 공식 출시했다. 루션은 음식 사진·이름 입력을 통한 식단 기록과 개인 맞춤형 식단 추천 기능을 제공하며, 컬리 최초로 구글 생성형 AI를 핵심 로직에 적용했다. 이용자의 나이, 성별, 체중, 활동량, 알레르기, 목표 칼로리 등을 반영해 하루 권장 섭취량과 영양 비율을 고려한 맞춤형 식단을 설계한다. 앱은 컬리 상품과 연동돼 추천 식단을 바로 구매할 수 있고, 식단 관리 미션 완료 시 포인트를 적립해 할인 쿠폰·교환권으로 활용할 수 있다. 현재는 주로 **다이어트 목적**으로 쓰이고 있으며, 컬리 계정을 통해서만 가입 가능하다. 컬리는 앞으로 루션을 체중, 체지방, 혈당, 수면 등 주요 건강 지표를 통합 모니터링하는 맞춤형 건강 관리 플랫폼으로 확장할 계획이다.
1170 조회
0 추천
2025.09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입