Loading...

AI 뉴스

PyTorch 창시자 친탈라, 무라티의 AI 스타트업에 합류

페이지 정보

작성자 xtalfi
작성일 2025.11.20 03:04
770 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1763575453_1696.jpg
 

(퍼플렉시티가 정리한 기사)


PyTorch의 공동 창시자이자 전 Meta AI 리더인 Soumith Chintala가 전 OpenAI 최고기술책임자 Mira Murati가 설립한 인공지능 스타트업 Thinking Machines Lab에 합류했습니다. 이번 이적은 Chintala의 Meta에서의 11년 재직 기간의 종료를 의미하며, 현재 약 500억 달러의 기업 가치로 자금 조달 협상 중인 Murati의 빠르게 성장하는 벤처에 중요한 인력 영입을 나타냅니다.​

"[T]hinking machines…사람들이 정말 놀랍습니다"라고 Chintala는 화요일 X에 게시하며 스타트업에서의 새로운 역할을 확인했습니다. 이달 초 작별 인사에서 그는 PyTorch를 이끌며 보낸 거의 8년을 회상하며, "아무것도 없는 상태에서 AI 분야에서 90% 이상의 채택률"로 성장시켰다고 밝혔습니다. 이 오픈소스 프레임워크는 현재 "거의 모든 주요 AI 회사의 프로덕션 환경에서 사용되고" "MIT에서 인도 시골까지 교실에서 가르쳐지고 있다"고 그는 썼습니다.​


공격적인 AI 인재 경쟁

Chintala의 영입은 Murati가 올해 초 Meta CEO Mark Zuckerberg로부터 제안받은 것으로 알려진 10억 달러 규모의 인수 제안을 거절한 지 몇 달 만에 이루어졌다. 거절 이후, Zuckerberg는 The Wall Street Journal에 따르면 약 50명의 직원을 보유한 Thinking Machines의 직원 중 12명 이상에게 수년에 걸쳐 2억 달러에서 10억 달러에 이르는 보상 패키지를 제안한 것으로 알려졌다.​

인재 영입 전쟁은 양측 모두에게 승리를 안겨주었다. 10월에 Thinking Machines의 공동 창립자이자 전 Meta 연구원인 Andrew Tulloch가 Murati의 스타트업을 떠나 Meta로 복귀했다. 그러나 Murati는 팀 대부분을 성공적으로 유지했으며, 이제 ChatGPT 개발을 공동 주도한 John Schulman, 연구원 Alec Radford, 그리고 OpenAI의 전 최고 연구 책임자 Bob McGrew를 포함하는 명단에 Chintala를 추가했다.​


메타의 AI 구조조정

친탈라의 퇴사는 메타가 AI 운영의 대대적인 구조조정을 진행하는 가운데 발생했습니다. 메타는 최근 Scale AI의 전 CEO인 알렉산드르 왕이 이끄는 새로운 슈퍼인텔리전스 랩스(Superintelligence Labs) 부서로 AI 팀을 통합했으며, 이는 메타가 해당 회사에 143억 달러를 투자한 이후의 일입니다. 10월에 메타는 민첩성과 의사결정 향상을 위해 이 부서에서 약 600개의 직책을 삭감했습니다.​

이러한 대변동은 메타의 리더십 계층으로도 확대되었습니다. 메타의 수석 AI 과학자이자 기초 AI 연구소(Fundamental AI Research lab) 설립자인 얀 르쿤(Yann LeCun)은 향후 몇 달 내에 메타를 떠나 자신의 스타트업을 시작할 준비를 하고 있는 것으로 알려졌습니다.​

싱킹 머신즈 랩(Thinking Machines Lab)은 10월에 첫 제품인 Tinker—대규모 언어 모델 미세 조정을 위한 API—를 출시했으며, 올해 초 100억 달러 가치 평가로 20억 달러를 조달했습니다. 블룸버그에 따르면, 이 스타트업은 현재 7월 가치 평가의 4배 이상인 약 500억 달러의 가치 평가로 새로운 펀딩 라운드를 진행하기 위한 초기 논의 중입니다.

댓글 0
전체 1,366 / 64 페이지
Amazon은월요일,해커들이취약점을악용하기전에이를찾아내기위해경쟁하는인공지능에이전트팀들을배치하는새로운사이버보안방어시스템을공개했으며,이는이거대기술기업이광범위한인프라를보호하는방식에중대한변화를나타낸다.자율위협분석(AutonomousThreatAnalysis)시스템,즉ATA는2024년8월내부해커톤에서시작되었으며,회사가공개하고WIRED가최초로보도한세부사항에따르면이후Amazon의보안운영을위한중요한도구가되었다.단일AI모델에의존하는대신,이시스템은공격자를시뮬레이션하는레드팀으로작동하는전문화된에이전트들과방어를개발하는블루팀을조율하며,모두Amazon의프로덕션시스템을반영하는격리된테스트환경에서기계속도로작동한다.​파이썬공격탐지에서입증된결과이시스템은이미해커들이손상된시스템에대한원격제어를확립하기위해사용하는일반적인기술인Python역방향셸공격을탐지하는데효과성을입증했습니다.ATA의레드팀에이전트는체계적으로37개의역방향셸기술변형을생성하고실행한후,64개의위협변형에대해테스트된개선된탐지규칙을개발했습니다.Amazon의공식발표에따르면,새로운규칙은프로덕션감사데이터에대해검증했을때1.00의완벽한정밀도와재현율점수를달성했습니다.WIRED는별도로이시스템이테스트에서100%효과성에도달했음을확인했습니다.​Amazon의최고보안책임자인SteveSchmidt는WIRED에"초기개념은보안테스트의중요한한계—제한된범위와빠르게진화하는위협환경에서탐지능력을최신상태로유지하는과제—를해결하기위한것이었습니다"라고말했습니다.Amazon에따르면,이시스템은일반적인보안테스트워크플로를수주의수동작업에서약4시간으로단축하여시간을96%줄였습니다.​인간감독하의기계속도이아키텍처는Amazon이"groundedexecution"이라고부르는것을중심으로하며,모든기술과탐지주장은테스트시스템의실제원격측정데이터와타임스탬프가찍힌로그로검증되어야합니다.레드팀에이전트는검증가능한로그를생성하는실제명령을실행하고,블루팀에이전트는실제데이터베이스를쿼리하여제안된방어가작동하는지확인합니다.이는AI환각을방지하기위한설계입니다.​자동화에도불구하고Amazon은"humanintheloop"접근방식을유지하며,프로덕션시스템에배포하기전에보안전문가가모든변경사항을승인하도록요구합니다.2024년해커톤에서ATA를제안한보안엔지니어중한명인MichaelMoran은이시스템을통해보안팀이일상적인테스트작업보다는복잡한과제에집중할수있다고언급했습니다.
613 조회
0 추천
2025.11.25 등록
Aalto대학교의연구진들은전기대신빛을사용하여인공지능계산을처리하는새로운방법을시연했으며,이는AI시스템의확장을제한해온주요병목현상을잠재적으로제거할수있다.​POMMM(ParallelOpticalMatrix-MatrixMultiplication)이라불리는이기술은신경망의수학적기초인복잡한텐서연산을단일통과의가간섭빛으로완료하며,이는11월14일NaturePhotonics에게재된연구에따른것이다.여러번의빛전파를필요로하는기존의광학컴퓨팅방법과달리,POMMM은전체행렬곱셈을동시에수행하여에너지소비를극적으로줄이면서더빠른처리속도로가는길을제공한다.​"여러다른기능을가진여러기계를통해모든소포를검사한다음올바른보관함으로분류해야하는세관직원을상상해보세요"라고Aalto대학교전자및나노공학과의제1저자인Dr.YufengZhang이말했다."우리의광학컴퓨팅방법은모든소포와모든기계를함께병합합니다—우리는각입력을올바른출력에연결하는여러개의'광학고리'를만듭니다.단한번의작업,한번의빛통과로모든검사와분류가즉시그리고병렬로일어납니다."​GPU병목현상해결현재AI시스템은텐서처리속도에한계를겪고있으며,이러한제약으로인해OpenAI,Anthropic,Google,xAI와같은기업들은대규모모델을훈련하고운영하기위해수천개의그래픽처리장치를병렬로실행하고있습니다.GPU는병렬처리에뛰어나지만,상당한전력을소비하고메모리대역폭제약에직면해있습니다.​POMMM프로토타입은이미지인식작업을위한합성곱신경망을실행할때94%이상의정확도를달성했으며,손글씨숫자분류에서94.44%,의류아이템인식에서84.11%의정확도를기록했습니다.이시스템은최대50x50크기의행렬에대해0.15미만의평균절대오차를보였으며,줄당20억회이상의연산효율성을나타냈습니다.​상업적통합으로가는길AaltoUniversity의PhotonicsGroup을이끄는ZhipeiSun교수는이접근법이"거의모든광학플랫폼에구현될수있다"고말했다.Zhang은이기술이3~5년내에주요AI플랫폼에통합될수있을것으로추정한다.​이혁신적발견은AI인프라를위한광학인터커넥트에대한업계의증가하는관심을바탕으로한다.AyarLabs와Lightmatter를포함한기업들은데이터센터병목현상을위한광학솔루션개발에수억달러의벤처캐피털을유치했다.NvidiaCEOJensenHuang은2025년3월에공동패키징된광학기술이네트워킹스위치에대해가능성을보여주지만,직접GPU연결에는전통적인구리연결이"몇배나"더신뢰할수있다고밝혔다.​연구진은POMMM을포토닉칩에직접통합하여광기반프로세서가더낮은전력소비로복잡한AI작업을수행할수있도록할계획이다.
596 조회
0 추천
2025.11.25 등록
이수페타시스가구글의텐서처리장치(TPU)생태계확장기대감에힘입어25일장중15%이상급등하며52주신고가를경신했다.증권가가잇따라목표주가를상향조정한가운데시가총액10조원을돌파하며TPU슈퍼사이클의핵심수혜주로주목받고있다.​증권가목표주가줄줄이상향이날오전9시30분이수페타시스는전거래일대비15.11%오른14만4000원에거래되며,장중한때14만8200원까지치솟아52주신고가를갈아치웠다.현재가기준시가총액은10조4200억원으로집계됐다.​양승수메리츠증권연구원은이날이수페타시스에대해투자의견'매수'를유지하고목표주가를기존14만원에서16만원으로14.3%상향조정했다.양연구원은"이수페타시스가PCB기준으로TPU내에서독보적인점유율을확보하고있으며,향후TPU를중심으로가격과물량이동시에확대되는국면에본격진입할것"이라고분석했다.​박형우SK증권연구원도"밸류체인내가장강한쇼티지상황이지속되고있어공급단가인상과수익성개선이기대되는가운데내년부터적층기술고도화로공급단가폭등이예상된다"며목표주가를14만4000원에서15만5500원으로상향했다.​구글제미나이3와TPU확장기대감주가급등의배경에는구글의AI전략전환이자리하고있다.구글이지난18일공개한제미나이3프로는자체개발한7세대TPU를기반으로엔비디아공급망에서벗어나독자적인AI인프라를구축했다는평가를받고있다.​구글의제미나이3와나노바나나등자체AI서비스가고성장구간에진입하며토큰사용량이급격히확대되고있다.특히TPU가내부활용을넘어외부고객판매로확장되고있다는점이주목받는다.구글은최근앤스로픽과TPU100만개규모공급계약을체결했으며,추가고객사확보를통한수요증대가예상된다.​이같은기대감은미국증시에도반영됐다.구글과2016년부터TPU를공동개발해온브로드컴은24일뉴욕증시에서11.1%급등하며2019년이후처음으로비트코인시가총액을넘어섰다.​메리츠증권에따르면이수페타시스가올해6월부터공급하는TPU7세대향물량은연초계획대비두배이상확대된것으로파악된다.내년출시되는차세대학습용TPU부터는고다층인쇄회로기판이적용돼평균판매단가상승구간에진입하며추가적인실적상향이예상된다.
616 조회
0 추천
2025.11.25 등록
샌프란시스코에기반을둔AI연구기업자이프라(Zyphra)는일요일,자사가최초로대규모Mixture-of-Experts(전문가혼합)기반파운데이션모델인ZAYA1을완전히AMD하드웨어에서학습시키는데성공했다고발표했습니다.이는AI모델학습분야에서NVIDIA의지배에도전하는중요한이정표로평가받고있습니다.이모델은AMDInstinctMI300XGPU및AMDPensando네트워킹,IBM클라우드인프라에서학습을진행했으며,NVIDIA의플랫폼외에도최첨단AI개발을충분히감당할수있다는점을입증했습니다.총83억개의파라미터에활성파라미터는7억6천만개만사용했음에도불구하고,ZAYA1은Meta의Llama-3-8B,Alibaba의Qwen3-4B,Google의Gemma3-12B등더큰모델들과견주거나더나은성능을추론,수학,코딩벤치마크에서보였습니다.​기술적돌파구가AMD의AI역량을입증하다이성과는AMD플랫폼의여러기술적장점을보여줍니다.MI300XGPU의192GB고대역폭메모리는비용이많이드는전문가샤딩이나텐서샤딩없이효율적인대규모학습을가능하게하여개발프로세스를간소화했습니다.Zyphra는AMD최적화분산I/O를사용하여10배이상빠른모델저장시간을달성했으며,이를통해학습신뢰성과효율성을향상시켰다고보고했습니다.​Zyphra의CEO인KrithikPuthalath는"ZAYA1은이러한철학을반영하며,AMD플랫폼에서대규모학습을시연한최초의회사가되어기쁘게생각합니다"라고말했습니다.이번협력은10월에발표된IBM과AMD간의다년간계약을기반으로하며,Zyphra에고급AI인프라를제공하기위한것입니다.​AI하드웨어시장에대한경쟁적시사점성공적인훈련은현재NVIDIA가지배하고있는AI인프라시장에서더많은점유율을확보하려는AMD의중요한과제를해결합니다.AMD는AI훈련GPU시장에서NVIDIA에비해약94%의시장점유율열세를보이고있지만,향후3~5년동안데이터센터AI사업이연평균60%이상의성장률을기록할것으로전망하고있습니다.​​Mixture-of-Experts아키텍처는OpenAI의GPT-5,Anthropic의Claude-4.5,DeepSeek-V3를포함한현대최첨단AI시스템의기본설계가되었습니다.이러한모델은동적으로활성화되는전문화된전문가네트워크를사용하여기존의밀집아키텍처보다더큰효율성과확장성을제공합니다.​AMD의수석부사장겸최고상업책임자인PhilipGuido는"이이정표는혁신적인AMD하드웨어및소프트웨어솔루션이업계선두기업들과함께차세대최첨단AI개발을가능하게하고있음을강조합니다"라고말했습니다.
608 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입