AI 뉴스

Microsoft Azure가 GB300 GPU로 초당 110만 토큰 달성

페이지 정보

작성자 xtalfi
작성일 2025.11.05 17:41
1,669 조회
0 추천
0 비추천

본문

LA_DC_60-1.jpg

(퍼플렉시티가 정리한 기사)


Microsoft는 Azure 클라우드 플랫폼에서 단일 랙 시스템으로 초당 110만 토큰이라는 전례 없는 성능을 달성하며 AI 처리 장벽을 무너뜨렸습니다. 이는 백만 토큰 임계값을 처음으로 돌파한 것으로, AI 추론 성능에 대한 새로운 업계 벤치마크를 확립했습니다.​

NVIDIA의 최첨단 GB300 GPU로 구동되는 Azure ND GB300 v6 가상 머신을 사용하여 달성한 이 이정표는 GB200 시스템으로 달성한 Microsoft의 이전 기록인 초당 865,000 토큰 대비 27% 향상된 수치입니다. 이 성능 테스트는 업계 표준인 Llama 2 70B 모델을 사용한 80분간의 벤치마크 실행 동안 Signal65에 의해 독립적으로 검증되었습니다.​


엔터프라이즈 AI를 위한 획기적인 성능

이 성과는 AI 배포의 경제성을 근본적으로 변화시켜, 기업들이 엄격한 규정 준수 요구사항을 유지하면서 수천 명의 동시 사용자를 지원할 수 있게 합니다. 각 NVIDIA GB300 GPU는 초당 15,200개의 토큰을 처리하여 이전 세대 H100 칩보다 5배의 처리량을 제공하며, Signal65가 "엘리트 AI 성능"이라고 부른 것이 이제 접근 가능한 유틸리티로 제공됨을 보여줍니다.​

Microsoft의 이 혁신은 회사가 대규모 AI 인프라 투자를 가속화하는 시기에 나왔습니다. 이 기술 대기업은 월요일에 세 건의 별도 수십억 달러 규모 AI 거래를 발표했으며, 여기에는 추가 NVIDIA GB300 용량을 위한 IREN Limited와의 97억 달러 규모 파트너십과 수만 개의 GPU 배포를 위한 Lambda와의 별도 계약이 포함됩니다.​


AI 군비 경쟁에서의 인프라 리더십

이 기록적인 성능은 이전 세대 대비 50% 더 많은 메모리와 16% 높은 열용량을 포함한 향상된 사양을 갖춘 72개의 GPU를 탑재한 단일 NVIDIA GB300 NVL72 랙에 걸쳐 18개의 가상 머신을 사용하여 달성되었습니다. 이 시스템은 가상 머신당 초당 평균 61,163개의 토큰 처리량으로 놀라운 일관성을 보여주었습니다.​

"이 성능 이정표는 NVIDIA와의 지속적인 협력을 보여주며 프로덕션 환경에서 광범위한 AI 워크로드를 관리하는 Azure의 능력을 강조합니다"라고 Microsoft CEO 사티아 나델라는 말하며, 이 성과가 Azure를 엔터프라이즈 AI 추론을 위한 최고의 플랫폼으로 자리매김하게 한다고 강조했습니다. 이 이정표는 단순한 기술적 성과 이상을 의미합니다. 산업 규모의 AI 처리가 클라우드에 도입되었음을 알리며, 대규모 내부 인프라 투자 없이도 주류 기업들이 정교한 AI 기능에 접근할 수 있게 되었습니다.

댓글 0
전체 1,366 / 28 페이지
웨어러블 AI 시장은 원격의료 플랫폼과의 통합으로 지속적인 건강 모니터링과 예측 진단이 가능해지면서 2025년 363억 8천만 달러에서 2030년 658억 달러로 연평균 12.4%의 성장률로 증가할 것으로 예상됩니다.삼성전자는 Galaxy Ring에 전고체 배터리 기술을 적용하여 연중무휴 의료급 모니터링을 구현하고 있으며, Philips와 Masimo는 실시간 환자 데이터를 위해 무선 센서를 임상 모니터링 대시보드에 통합하는 파트너십을 맺었습니다.Apple과 Alphabet은 각각 HealthKit 생태계와 Gemini AI 기반 Fitbit을 통해 경쟁하고 있으며, DexCom은 연속 혈당 모니터링을 위한 최초의 생성형 AI 플랫폼을 출시했고, FDA는 의료 관련 주장에 대한 규제 심사를 강화하고 있습니다.
825 조회
0 추천
2025.12.25 등록
• Google은 디스플레이 하단에 단일 행의 떠 있는 입력 상자를 배치한 새로운 Gemini 인터페이스를 테스트하고 있다. 이 디자인은 첨부 파일, 모델 선택기 같은 고급 도구들을 통합된 플러스(Plus) 버튼 뒤로 모아 시각적 혼잡을 줄이는 방식이며, 이는 Google 앱 16.51.52 버전 코드에서 발견된 내용에 따른 것이다.• “Gemini UX 2.0”으로 명명된 이번 전면 개편은 점진적 공개(pr​ogressive disclosure) 원칙을 따르며, 기본 상태에서는 인터페이스를 최소화하되 Deep Research, Canvas와 같은 기능들을 새로운 Tools 아이콘 아래에 배치해, 고급 제어 기능이 필요할 때에만 접근 가능하도록 한다.• 코드 문자열에 따르면, 실험적 기능을 위한 새로운 Gemini Labs 설정 영역이 추가되었으며, 이는 Google Labs와 Search Labs를 반영한 형태다. 초기 테스트 사용자들은 이 영역에서 완성되지 않은 기능들의 토글을 전환하고, 더 넓은 범위로 공개되기 전에 피드백을 제공할 수 있다.
801 조회
0 추천
2025.12.25 등록
• 엑서터 대학교(University of Exeter) 연구진은 AI 챗봇이 평판 훼손, 정서적 피해, 사회적 혼란을 야기하는 “야생형(feral)” 가십을 만들어 퍼뜨리고 있으며, 인간 의사소통을 조절하는 사회적 규범의 통제를 받지 않은 채 작동하고 있다고 경고했다.• Ethics and Information Technology에 게재된 이 연구는 AI 시스템들 사이에서 빠르게 확산되는 위험한 “봇-투-봇(bot-to-bot)” 가십을 강조하며, 챗봇이 **호주 시장 브라이언 후드(Brian Hood)**에게 뇌물 수수 혐의를, 라디오 진행자 **마크 월터스(Mark Walters)**에게 횡령 혐의를 거짓으로 뒤집어씌운 사례 등을 문서화했다.• 연구진은 기술 기업들이 메모리 기능, 음성 모드와 같은 개인화 기능을 갖춘 챗봇을 설계함에 따라, AI 가십이 더욱 만연해질 것이며, 그 결과 이용자들이 신뢰할 만한 정보와 함께 근거 없는 비난도 더 쉽게 수용하게 될 것이라고 예측한다.
825 조회
0 추천
2025.12.25 등록
• 애플은 2026년 말 공개를 목표로, 코드명 N50인 AI 기반 스마트 글라스를 개발 중이며, 이는 메타의 레이밴(Ray-Ban) 협업 제품과 경쟁하게 될 것으로 알려졌다. 이 제품은 개편된 시리를 통한 음성 기반 AI와, 디스플레이 없이도 시각 지능을 구현하기 위한 다수의 카메라를 탑재할 예정이라고 사안에 정통한 관계자들은 전했다.• 회사는 글라스 프로젝트에 자원을 집중하기 위해 더 가벼운 버전의 비전 프로(Vision Pro) 후속 모델 계획을 보류했으며, 이 스마트 글라스는 애플 워치처럼 아이폰과 페어링되고, 전력 효율에 최적화된 S-클래스 칩을 사용할 예정이다. 출하는 2027년 시작이 예상된다.• 애플은 또한 비주얼 룩 업(Visual Look Up)과 상황 인지형 알림 등 기능을 갖춘 AI 강화 에어팟(AirPods)을 선보일 계획이며, 이 시장에서 현재 메타가 약 60%의 점유율을 차지하고 있고, 애널리스트들은 AI 글라스 분야가 2030년까지 매년 100% 이상 성장할 것으로 전망하고 있다.
824 조회
0 추천
2025.12.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입