Loading...

AI 뉴스

동일 질문에 AI 모델이 매번 다른 답변을 내는 이유

페이지 정보

작성자 xtalfi
작성일 2025.09.11 14:48
1,357 조회
0 추천
0 비추천

본문

d92349c8d65a778fcf2ade9bee8162e2EYfG.jpg

(퍼플렉시티가 정리한 기사)

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.

이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.

 

AI 불일치의 근본 원인 파악하기

 

"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.

그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.

연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.

 

기업용 AI를 위한 제안된 솔루션

 

He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.

연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.

 

실리콘밸리의 최신 인공지능 연구소

 

Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.

회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.

2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.

“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.

댓글 0
전체 973 / 32 페이지
(퍼플렉시티가 정리한 기사)BigBear.ai Holdings Inc. [ +0.53%]는 월요일 월스트리트 예상치를 상회하는 3분기 실적을 발표하는 동시에 보안 정부 AI 플랫폼에서의 입지를 확대하기 위해 설계된 대규모 인수를 공개했습니다. 이 회사의 주가는 발표 후 시간외 거래에서 15% 급등했습니다.버지니아주 맥클린에 본사를 둔 이 AI 솔루션 제공업체는 3분기 매출 3,310만 달러를 기록하여 전년 대비 20% 감소했음에도 불구하고 애널리스트 예상치인 3,182만 달러를 넘어섰습니다. 이 회사는 주당 0.03달러의 손실을 기록했으며, 이는 컨센서스 예상치인 0.07달러보다 적은 수치입니다. 매출 감소는 주로 특정 미 육군 프로그램의 물량 감소에 기인합니다.Sage Acquisition에 방어 역량 강화 요청BigBear.ai는 국방 및 국가 안보 기관을 위해 특별히 구축된 생성형 AI 플랫폼인 Ask Sage를 2억 5천만 달러에 인수하는 최종 계약을 발표했습니다. 이번 인수는 회사가 국방 AI 부문에서 입지를 강화하고자 하는 주요 전략적 움직임을 나타냅니다.Ask Sage는 현재 16,000개의 정부 팀과 수백 개의 상업 기업에서 100,000명 이상의 사용자를 지원하고 있습니다. 이 플랫폼은 FedRAMP High와 DoD IL5, IL6 및 Top Secret 인증을 획득한 최초의 생성형 AI 솔루션입니다. Ask Sage는 2025년에 약 2,500만 달러의 연간 반복 수익을 창출할 것으로 예상되며, 이는 2024년 대비 6배 증가한 수치입니다.BigBear.ai의 CEO인 Kevin McAleenan은 “Ask Sage를 BigBear.ai와 통합함으로써, 우리는 시장이 요구해온 것, 즉 소프트웨어, 데이터 및 임무 서비스를 한 곳에서 연결하는 안전하고 통합된 AI 플랫폼을 만들고 있습니다”라고 말했습니다.매출 역풍에도 불구하고 견고한 현금 포지션회사는 2025년 9월 30일 기준 4억 5,660만 달러의 기록적인 현금 보유액을 보고했으며, 이를 통해 인수합병을 통한 성장 가속화를 추진할 수 있는 입지를 확보했습니다. 이는 2024년 말 5,010만 달러에서 대폭 증가한 수치입니다. BigBear.ai는 3억 7,600만 달러의 계약 잔고를 유지했습니다.긍정적인 실적 호조에도 불구하고, 회사는 여전히 수익성 문제에 직면해 있습니다. 3분기 비GAAP 조정 EBITDA는 마이너스 940만 달러로, 전년 동기 플러스 90만 달러에 비해 악화되었으며, 이는 주로 매출총이익률 감소와 판매관리비 증가에 기인합니다.BigBear.ai는 2025년 전체 연도 매출 가이던스를 1억 2,500만 달러에서 1억 4,000만 달러로 재확인했습니다. Ask Sage 인수는 2025년 4분기 말 또는 2026년 1분기 초에 완료될 것으로 예상됩니다.
35 조회
0 추천
11.11 등록
(퍼플렉시티가 정리한 기사)6sense 창립자 Amanda Kahlow가 설립한 영업 자동화 스타트업 1mind가 일요일 스텔스 모드에서 벗어나 총 4천만 달러의 자금 조달과 함께 첫 접촉부터 계약 체결까지 영업을 처리하는 감성 지능형 AI 에이전트를 배포한다고 발표했습니다. 샌프란시스코에 본사를 둔 이 회사는 1년 넘게 조용히 기술을 구축해왔으며 이미 HubSpot, Nutanix, Boston Dynamics를 포함한 45개 이상의 기업 고객을 확보했습니다.자금 조달에는 Battery Ventures가 주도한 3천만 달러 규모의 시리즈 A 라운드—2014년 6sense의 시리즈 A를 지원한 이후 Kahlow에 대한 이 회사의 두 번째 투자—와 Primary Ventures의 1천만 달러 규모의 시드 라운드가 포함됩니다. 회사는 이 자본을 기술 팀 확장과 AI 주도 성장 모델 확대에 사용할 예정이며, 이 모델은 기존 챗봇을 영업 대화 수행, 제품 시연 제공, 거래 협상이 가능한 사실적인 디지털 “슈퍼휴먼”으로 대체합니다.입증된 결과가 조기 도입을 촉진합니다HubSpot은 1mind의 기술에 대해 가장 상세한 성과 지표를 보고했습니다. Fiona라는 이름의 회사 AI 에이전트는 웹사이트 방문자와 88%의 참여율을 달성했고, 무료 체험 가입을 78% 증가시켰으며, 계약 성사 전환율을 25% 향상시켰습니다. HubSpot의 마케팅, AI 및 GTM 담당 수석 부사장인 Kieran Flanagan에 따르면, 회사는 초기 성공 이후 Fiona의 역할을 추가 비즈니스 부문으로 확대하고 있습니다.다른 고객들은 기본 자격 심사 챗봇과 비교하여 2배에서 5배 사이의 전환율 상승, 20일 단축된 영업 주기, 그리고 2배 이상 증가한 연간 계약 금액을 보고하고 있습니다. 이 기술은 B2B 영업의 중요한 격차를 해결합니다: 연구에 따르면 구매자의 78%가 가장 먼저 응답하는 회사로부터 구매하며, 1분 이내에 참여가 이루어질 때 전환율이 391% 증가합니다.연쇄 창업가, Battery의 지원을 받아 복귀하다2013년에 6sense를 설립하고 2020년 퇴사하기 전까지 기업 가치를 50억 달러 이상으로 성장시킨 Kahlow는 1mind를 B2B 영업을 혁신하기 위한 10년간의 노력에서 다음 진화 단계로 포지셔닝했다. Kahlow는 성명에서 “10년 전 6sense를 설립했을 때, 저는 기업들이 구매자를 찾도록 돕고자 했습니다. 이제 1mind를 통해, 저는 그들이 구매자를 성사시키도록 돕고 있습니다”라고 말했다.6sense에도 투자했던 Battery Ventures의 제너럴 파트너 Neeraj Agrawal은 1mind를 “카테고리를 정의하는” 기업이라고 평가하며, 이 기술이 기업들이 더 제한된 예산을 관리하면서 직면하는 영업 효율성 문제를 해결한다고 언급했다. 이 스타트업의 Superhumans는 전체 영업 프로세스를 독립적으로 관리하거나 복잡한 엔터프라이즈 거래를 위해 인간 담당자에게 인계를 조율할 수 있다.
37 조회
0 추천
11.11 등록
(퍼플렉시티가 정리한 기사)구글은 11월 10일 Google TV Streamer 기기에 Gemini for TV 배포를 시작하여 99달러 스트리밍 박스에서 Google Assistant의 종료를 알렸습니다. 앞으로 몇 주에 걸쳐 모든 기기에 도달할 이번 업데이트는 소비자 전자제품 전반에 걸쳐 고급 AI 기술을 통합하려는 회사의 최신 노력을 나타냅니다.이번 업그레이드는 보다 대화형 음성 상호작용을 도입하여 사용자가 엄격한 명령 구조 없이 복잡한 질문을 할 수 있게 합니다. 구글이 발표에서 공유한 예시에 따르면 “저는 드라마를 좋아하는데 제 아내는 코미디를 좋아해요. 우리가 함께 볼 수 있는 영화가 뭐가 있을까요?“와 같은 요청이 이제 가능합니다. AI 어시스턴트는 또한 이전 시즌의 프로그램을 요약하고, 인기 콘텐츠를 식별하며, 화면에 스마트 홈 카메라 피드를 표시할 수 있습니다.광범위한 AI 전략의 일부Gemini for TV는 9월 TCL의 QM9K 시리즈 텔레비전에서 처음 선보였으며, Google TV Streamer는 이 기능을 받는 두 번째 기기가 되었습니다. Google은 8월 Made by Google 이벤트에서 업그레이드 계획을 발표했으며, 임원 Rick Osterloh는 Gemini가 “올 가을” 자동차, TV, 스마트 디스플레이를 포함한 여러 플랫폼에 도입될 것이라고 말했습니다.Google은 전체 생태계에서 Google Assistant를 체계적으로 교체하고 있습니다. 10월 말, Google은 Early Access 프로그램을 통해 Nest 스피커와 디스플레이에 Gemini를 출시하기 시작했습니다. 이러한 단계적 종료는 Google Assistant가 2025년 말까지 중단되고 Gemini가 유일하게 지원되는 어시스턴트가 될 것이라는 3월 발표에 따른 것입니다.교육 및 스마트 홈 기능엔터테인먼트를 넘어, Google은 TV용 Gemini를 교육 도구로 포지셔닝하고 있습니다. 사용자는 어린이에게 맞춤화된 설명을 요청할 수 있습니다—“우리 초등학교 3학년에게 화산이 왜 폭발하는지 설명해줘”—그러면 AI 생성 응답과 함께 관련 YouTube 동영상을 받게 됩니다. 또한 이 어시스턴트는 동영상과 함께 DIY 프로젝트와 요리법을 안내할 수도 있습니다.Gemini에 액세스하려면, 사용자는 Google TV Streamer 리모컨의 마이크 버튼을 누르면 됩니다. 업데이트를 받은 사용자는 설정 > 계정 및 프로필 > 음성 어시스턴트로 이동하여 가용성을 확인할 수 있으며, 여기서 “TV용 Gemini”가 옵션으로 나타납니다. 이 기능은 현재 미국과 캐나다의 18세 이상 사용자로 제한되어 있으며, 영어와 프랑스어를 지원합니다.Google은 “TV에서 더 많은 Gemini 기능”이 곧 출시될 예정이라고 밝혔지만, 구체적인 일정은 제공하지 않았습니다.
34 조회
0 추천
11.11 등록
(퍼플렉시티가 정리한 기사)AirOps는 월요일 4천만 달러 규모의 시리즈 B 펀딩 라운드를 발표했으며, 마케팅 팀들이 점점 더 AI 주도적인 검색 환경에서 가시성을 유지하기 위해 분주한 가운데 뉴욕 기반 스타트업의 기업 가치를 2억 2천 5백만 달러로 평가했습니다. Greylock이 주도한 이번 라운드는 콘텐츠 엔지니어링 플랫폼의 총 펀딩을 6천만 달러로 끌어올렸으며, Unusual Ventures, Wing Venture Capital, XFund, Village Global VC, Frontline VC와 20여 명 이상의 성장 및 마케팅 리더들의 참여가 포함되었습니다.이번 투자는 검색 행동이 근본적인 변화를 겪는 시점에 이루어졌으며, Statcounter 데이터에 따르면 Google의 글로벌 검색 시장 점유율이 2015년 이후 처음으로 90% 아래로 떨어졌습니다. 전통적인 검색 결과를 스크롤하는 대신, 수십억 명의 사용자들이 이제 ChatGPT, Claude, Gemini와 같은 AI 어시스턴트로부터 직접 답변을 받고 있으며, 이는 브랜드들이 콘텐츠 전략을 재고하도록 강제하고 있습니다.[미지의 영역에서의 급속한 성장AirOps는 2022년 초 설립 이후 빠르게 성장하여, 2025년 초 20명의 직원에서 연말에는 거의 100명으로 늘었습니다. 회사는 2026년에 인력을 두 배 이상 늘리고, 유럽을 시작으로 해외 시장으로 확장할 계획입니다.이 플랫폼은 Ramp, Chime, Wiz, Carta, Klaviyo와 같은 기업들이 성과 분석, 격차 식별, 팀이 AI 시스템이 우선시하는 신뢰성 높은 자료를 제작할 수 있도록 지원함으로써, AI 검색 엔진에 최적화된 콘텐츠를 개선하는 데 도움을 줍니다. 단순히 순위만 추적하는 기존의 SEO 툴과 달리, AirOps는 마케팅 팀이 AI 인용에 최적화된 콘텐츠를 생성, 정제, 게시할 수 있도록 안내합니다.“마케팅 팀들은 이제 브랜드 내러티브를 AI에만 맡길 수 없다는 것을 깨닫고 있습니다,“라고 AirOps의 CEO이자 공동 창립자인 Alex Halliday가 밝혔습니다. 이 플랫폼은 팀이 브랜드 보이스, 고유한 지식, 타겟 페르소나를 직접 입력할 수 있게 하여, AI 에이전트가 다양한 채널에서 일관된 콘텐츠를 제작할 수 있도록 지원합니다.Chime의 성장 마케팅 부사장인 Nick Fairbairn은 베타 프로그램에 참여한 지 몇 주 만에 팀이 AI 검색 인용 횟수를 세 배로 늘렸다고 밝혔습니다. “베타에 참여한 지 몇 주 만에 AI 검색 인용이 세 배로 증가했고, 더욱 AI 기반의 성장 전략을 향해 실질적인 모멘텀을 구축할 수 있었습니다,“라고 그는 전했습니다.새로운 마케팅 패러다임Greylock의 파트너 Mike Duboe는 기존 검색에서 대형 언어모델로의 전환을 최고 마케팅 책임자들에게 “머리에 불이 붙은 듯한 난제”라고 표현했다. 그는 “전체 마케팅 산업이 유기적 성장을 이끌어내는 방법을 다시 배워야 하는 상황”이라고 말했다. “AirOps는 이미 콘텐츠 및 SEO 팀의 워크플로우에 깊게 통합되어 있으며, 제품 마케팅, 현지화, 프론트엔드 개발 등 마케팅 분야 전반에 걸쳐 확장되고 있습니다”Teespring, MasterClass, Bungalow에서 제품을 담당했던 Halliday는 ChatGPT가 공개되기 전에 AirOps를 설립했으며, 처음에는 비기술직 직원들이 데이터를 쉽게 접근할 수 있도록 돕는 데 집중했다. 대형 언어모델이 널리 이용 가능해지면서, 회사는 마케터들이 AI 검색에 맞게 콘텐츠를 적응시킬 수 있도록 지원하는 방향으로 전환했다.
36 조회
0 추천
11.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입