Loading...

AI 뉴스

엔비디아, 차세대 AI 슈퍼칩 '베라 루빈' 양산 돌입 선언

페이지 정보

작성자 symbolika
작성일 01.07 19:38
297 조회
0 추천
0 비추천

본문

Nvidia Rubin


• 엔비디아의 차세대 AI 칩 플랫폼 '베라 루빈'이 양산 단계에 진입했다고 젠슨 황 CEO가 CES 2026에서 발표
• 루빈 칩은 현행 블랙웰 대비 AI 모델 운영 비용을 10분의 1로 절감하고, 대형 모델 학습에 필요한 칩 수를 4분의 1로 줄일 전망
• 마이크로소프트와 CoreWeave가 올해 안에 루빈 기반 서비스를 최초로 제공할 예정
• 미국 천문학자 베라 루빈의 이름을 딴 이 시스템은 TSMC 3나노 공정으로 제작된 GPU와 CPU를 포함한 6개 칩으로 구성


기사 요약

엔비디아 젠슨 황 CEO가 라스베이거스 CES 2026 행사에서 차세대 AI 슈퍼칩 플랫폼 '베라 루빈'이 양산에 돌입했다고 발표했다. 2024년 처음 공개된 루빈 플랫폼은 현행 블랙웰 칩 대비 AI 모델 운영 비용을 90% 절감하고, 대규모 모델 학습에 필요한 칩 수량도 대폭 줄일 수 있어 AI 시스템의 경제성을 크게 개선할 것으로 기대된다.

마이크로소프트와 CoreWeave가 올해 안에 루빈 칩 기반 서비스를 최초로 제공할 예정이며, 마이크로소프트가 조지아주와 위스콘신주에 건설 중인 대형 AI 데이터센터에도 수천 개의 루빈 칩이 탑재될 계획이다. 엔비디아는 레드햇과 협력해 은행, 자동차 제조사, 항공사, 정부 기관 등을 대상으로 루빈 시스템에서 구동되는 엔터프라이즈 소프트웨어 제품군도 확대할 방침이다.


왜 중요한가

이번 발표는 AI 칩 시장의 절대 강자 엔비디아가 경쟁사들의 추격과 고객사들의 자체 칩 개발 움직임에도 불구하고 기술적 우위를 공고히 하고 있음을 보여준다. OpenAI가 브로드컴과 손잡고 자체 AI 칩 개발에 나서는 등 대형 고객사들이 엔비디아 의존도를 낮추려는 시도를 하고 있지만, 업계 전문가들은 엔비디아의 통합 플랫폼 전략이 단순 GPU 공급을 넘어 컴퓨팅, 네트워킹, 메모리, 스토리지, 소프트웨어 오케스트레이션까지 아우르는 '풀스택 AI 시스템 아키텍트'로 진화하고 있어 대체하기가 점점 어려워지고 있다고 분석한다.

2024년 블랙웰 칩이 발열 문제로 출하가 지연됐던 전례가 있어 루빈의 일정 준수 여부에 업계 관심이 집중됐는데, 이번 양산 선언은 "루빈이 예정대로 진행되고 있다"는 신호를 시장에 보내려는 의도로 해석된다. 루빈 시스템은 2026년 하반기부터 본격 출하될 예정이다.


핵심 인용

"베라 루빈이 양산에 돌입했습니다. 이 칩 시스템의 모든 구성요소는 완전히 혁신적이며 각 분야 최고의 성능을 자랑합니다." — 젠슨 황, 엔비디아 CEO
댓글 0
전체 1,366 / 25 페이지
구글이 빠른 속도와 낮은 비용을 갖춘 경량 인공지능(AI) 모델 '제미나이3 플래시'를 17일(현지시간) 공개했다. 이번 출시로 구글은 최상위 모델인 '딥싱크', 균형 모델인 '프로'와 함께 제미나이3 제품군의 삼각 편대를 완성했다.상위 모델 능가하는 성능, 4분의 1 가격제미나이3 플래시는 일부 벤치마크에서 상위 모델인 제미나이3 프로를 능가하는 성과를 보였다. 일반 지식을 측정하는 'MMLU-Pro'에서 81.2%, 코딩 능력을 재는 'SWE-벤치 베리파이드'에서 78%를 기록해 프로 모델의 각각 81%와 76.2%를 웃돌았다.​과학 지식 평가인 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE' 벤치마크에서도 각각 90.4%와 33.7%를 기록해 프로 모델(91.9%, 37.5%)과 큰 차이가 없는 수준을 보였다.​속도와 지능의 균형제미나이3 플래시는 제미나이 2.5 프로보다 3배 빠른 속도를 자랑하며, 일상적 작업에서 평균 30% 적은 토큰을 사용한다. API 요금은 토큰당 0.5∼3달러로 프로 모델(2∼12달러)의 4분의 1 수준이다.​조시 우드워드 구글랩스·제미나이 담당 부사장은 "오랫동안 AI는 비싸고 느린 대형 모델과 성능이 떨어지는 고속 모델 사이 선택을 강요했다"며 "제미나이3 플래시는 이와 같은 타협을 끝내고 지능과 속도를 모두 제공한다"고 밝혔다.​제미나이3 플래시는 무료 이용자를 포함해 전 세계에서 사용할 수 있으며, 구글은 제미나이 앱과 AI 모드에서 이를 기본 모델로 적용했다.경량 모델은 방대한 데이터로 학습한 상위 모델을 기반으로 '증류'라는 작업을 거쳐 만들어진다. 속도가 빠르면서도 상위 모델에 버금가는 성능을 내는 것이 특징이다.
387 조회
0 추천
2025.12.20 등록
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
379 조회
0 추천
2025.12.20 등록
OpenAI는 2025년 12월 17일 뉴스 조직을 위한 아카데미를 출범했으며, 이는 기자와 출판사가 AI 도구를 업무 흐름에 통합할 수 있도록 주문형 교육, 기술 플레이북 및 오픈 소스 프로젝트를 제공하는 무료 글로벌 학습 플랫폼입니다.이 이니셔티브는 뉴욕에서 열린 AI 및 저널리즘 정상회의에서 공개되었으며, Brown Institute for Media Innovation 및 Hearst와 공동 주최했고, American Journalism Project 및 The Lenfest Institute for Journalism과의 파트너십을 기반으로 합니다.이 아카데미는 OpenAI가 The New York Times Company [NYT +0.35%]로부터 저작권 소송을 받고 있는 동시에 News Corp [NWSA -0.95%] 및 Axel Springer를 포함한 주요 출판사들과 라이선스 계약을 추진하고 있는 가운데 출범했습니다
365 조회
0 추천
2025.12.20 등록
개발자 생산량이 76% 급증했습니다. 2025년 AI 코딩 도구가 개발자당 코드 라인 수를 4,450에서 7,839로 늘렸으며, 중간값 풀 리퀘스트 크기가 3월부터 11월까지 33% 증가했다고 2,000개 기업의 월 10억 라인 코드를 처리하는 Greptile 연구가 밝혔습니다.AI 코딩 어시스턴트 채택률이 **소프트웨어 개발 전문가의 90%**에 도달했으며, CodeRabbit의 470개 오픈 소스 풀 리퀘스트 분석 결과 AI 생성 코드가 사람이 작성한 코드보다 1.7배 더 많은 결함을 발생시키고, 논리 오류는 75% 증가했으며 성능 비효율성은 거의 8배 더 자주 나타나는 것으로 나타났습니다.OpenAI 대비 Anthropic SDK 다운로드 비율이 2024년 1월 47:1에서 2025년 11월 4.2:1로 급락하면서 경쟁 구도가 빠르게 변화하고 있으며, 전문가들은 AI의 예측 가능한 품질 약점을 완화하기 위해 더 엄격한 코드 리뷰 프로세스와 자동화된 테스트를 권장하고 있습니다.
379 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입