Loading...

AI 뉴스

구글 딥마인드 CEO, "AI 로봇 혁명이 도래했다"

페이지 정보

작성자 이수
작성일 18:49
3 조회
0 추천
0 비추천

본문

df0d02ba5b407c9b1b1c2be4e0b74555_1766828917_0444.jpg
 


Google DeepMind CEO 데미스 하사비스는 오랫동안 약속되어 온 로봇공학 혁명이 더 이상 미래의 전망이 아니라 현재의 현실이며, 이는 하드웨어 발전이 아닌 인공지능의 돌파구에 의해 주도되고 있다고 선언했습니다. 최근 로봇공학의 현황에 대해 언급하면서 하사비스는 "로봇공학의 병목 현상은 하드웨어가 아니라... 사실 소프트웨어 지능이 항상 로봇공학을 저해해 온 요인이라고 생각한다"고 강조했습니다. 그는 그 병목 현상이 마침내 해소되기 시작했다고 말합니다.

​이러한 변화는 파운데이션 모델이 로봇이 학습하고 작동하는 방식을 변화시키면서 나타났습니다. Boston Dynamics의 Atlas 로봇이 이미 2018년에 백플립을 수행하며 놀라운 물리적 능력을 보여주었지만, 이러한 기계들은 특정 작업에만 집중되어 있었습니다. 각 로봇 기능은 기술 이전이나 일반화 없이 별도의 프로그래밍이 필요했습니다—로봇은 상자나 병을 집어 올릴 수 있었지만, 조명이나 방향이 바뀌면 처음부터 다시 시작해야 했습니다.



파운데이션 모델은 로봇이 생각할 수 있게 한다

파운데이션 모델은 그 패러다임을 다시 작성했습니다. 2025년 3월에 출시된 구글 딥마인드의 제미니 로보틱스와 9월에 출시된 후속작 제미니 로보틱스 1.5는 하사비스가 "명확한 변곡점"이라고 부르는 것을 나타냅니다. 이러한 비전-언어-행동 모델은 로봇이 환경을 인식하고, 다단계 작업을 계획하며, 모든 상황에 대해 수작업으로 코딩된 행동 없이도 자율적으로 실행할 수 있게 합니다.
​결정적으로, 이러한 모델은 로봇이 "행동하기 전에 생각"할 수 있게 하여, 복잡한 명령을 일련의 단계로 분해합니다. 제미니 로보틱스 1.5는 색상별로 세탁물을 분류하고, 웹 검색에서 가져온 날씨 예보를 기반으로 여행 가방을 꾸리며, 지역 지침에 따라 재활용품을 분류할 수 있습니다. 이 모든 작업은 사전 프로그래밍된 응답이 아닌 진정한 이해를 필요로 합니다. 또한 이 모델은 서로 다른 로봇 유형 간에 학습을 전이하며, 한 플랫폼에서 학습한 기술이 휴머노이드 로봇을 포함한 다른 플랫폼에 성공적으로 적용됩니다.


AGI로 가는 길로서의 체화된 지능

Hassabis는 물리적 세계에서 감지하고, 계획하며, 행동할 수 있는 능력인 구현된 지능(embodied intelligence)을 인공 일반 지능(AGI) 달성의 핵심으로 자리매김합니다. "결국 AGI는 이 모든 것을 할 수 있어야 합니다"라고 그는 밝혔습니다. 이는 업계가 로봇공학을 평가하는 방식의 근본적인 전환을 나타내며, 고도로 전문화된 엔지니어링으로 가격을 책정하는 것에서 구현된 AI 시스템으로 취급하는 것으로 이동하고 있습니다.
이러한 변화는 개발 일정을 극적으로 가속화하고 있습니다. 수년간의 전문화된 프로그래밍은 훨씬 적은 예제로 적응할 수 있는 범용 모델의 신속한 미세 조정으로 대체되고 있습니다. Google의 2025년 12월 연구 요약에 따르면, 회사는 2025년을 "AI가 우리와 함께 진정으로 생각하고, 행동하며, 세상을 탐험하기 시작한 해"로 규정합니다. 구현된 AI 시장은 이러한 모멘텀을 반영하며, 2025년 44억 4천만 달러에서 2030년까지 230억 6천만 달러로 성장할 것으로 예상됩니다.

댓글 0
전체 1,356 / 1 페이지
알리바바는 12월 25일 Qwen Code v0.5.0을 공식 출시하여 커맨드라인 도구를 종합 개발 생태계로 전환했습니다. 이번 업데이트를 통해 개발자는 단일 터미널 창 내에서 4개의 동시 인스턴스를 실행할 수 있게 되어, 지능형 질의응답, 실시간 번역, 프로토타이핑, 창의적 드로잉과 같은 여러 작업을 동시에 실행하면서 대화형 작업 간 대기 시간을 없앴습니다.​이번 릴리스는 Qwen Code 대화 인터페이스를 편집기 환경에 직접 임베드하는 VSCode 플러그인과 함께 도구 기능의 프로그래매틱 통합을 가능하게 하는 TypeScript SDK를 도입했습니다. 알리바바 Tongyi Lab의 문서에 따르면 Java, Python 및 추가 프로그래밍 언어에 대한 지원은 향후 릴리스에서 계획되어 있습니다.생태계 통합 및 향상된 기능Qwen Code v0.5.0은 VS Code 및 JetBrains 시리즈를 포함한 주요 통합 개발 환경과의 심층 통합을 지원하며, 플러그인 메커니즘을 통해 코드 리뷰, 테스트 생성, 종속성 분석과 같은 타사 서비스 호출을 가능하게 합니다. 새 버전은 파일 간 및 다중 모듈 프로젝트에 걸친 엔지니어링 수준의 컨텍스트 이해를 강화하여, 코드를 생성하거나 수정할 때 전역 일관성을 유지하기 위해 전체 코드베이스 인덱스를 자동으로 로드합니다.​이번 업데이트에는 단위 테스트 생성, 보안 취약점 스캔, API 문서 자동 생성을 위한 10개 이상의 도구를 제공하는 플러그인 마켓에 대한 얼리 프리뷰 액세스가 포함되어 있습니다. 통이랩(Tongyi Lab)은 장기 목표가 Qwen Code를 중국 개발자를 위한 국내 지능형 소프트웨어 인프라의 핵심 구성 요소로 만드는 것이라고 밝혔습니다.성장하는 AI 코딩 어시스턴트 시장이번 출시로 알리바바는 빠르게 성장하는 AI 코딩 어시스턴트 시장에서 GitHub Copilot 및 Cursor와 같은 기존 도구들과 보다 직접적으로 경쟁할 수 있는 위치에 서게 되었습니다. 글로벌 AI 코드 어시스턴트 시장은 2024년 55억 달러 규모로 평가되었으며, 2034년까지 473억 달러에 달할 것으로 예상되며, 연평균 복합 성장률 24%로 성장할 것으로 전망됩니다. 2025년에는 개발자의 85%가 코딩 및 개발에 AI 도구를 정기적으로 사용하고 있으며, 62%는 최소 하나의 AI 코딩 어시스턴트에 의존하고 있습니다.​알리바바의 Qwen 기반 코딩 모델은 이미 전 세계적으로 2천만 건 이상의 다운로드를 달성했습니다. Qwen 모델로 구동되는 알리바바의 Tongyi Lingma 코딩 어시스턴트는 2024년 6월 AI Programmer 기능 출시 이후 30억 줄 이상의 코드를 생성했습니다. v0.5.0 릴리스는 글로벌 AI 프로그래밍 경쟁이 단일 지점 코드 생성에서 풀스택 엔지니어링 인텔리전스로 전환되고 있음을 반영합니다.
3 조회
0 추천
19:04 등록
OpenAI는 ChatGPT에 "writing blocks"라는 새로운 기능을 출시했으며, 이메일 작성 및 블로그 초안 작성과 같은 작업을 위해 채팅 인터페이스를 포맷된 문서 편집기로 자동 변환합니다. 12월 18일경부터 사용자들에게 나타나기 시작한 이 업데이트는 AI 챗봇이 콘텐츠 생성을 처리하는 방식의 최신 진화를 나타냅니다.​이 기능은 사용자가 ChatGPT의 서식 있는 텍스트 영역 내에서 텍스트를 강조 표시할 때 나타나는 미니 편집기 도구 모음을 도입하여, Word나 Gmail과 같은 외부 애플리케이션에 콘텐츠를 복사하지 않고도 굵게, 기울임꼴, 목록 만들기와 같은 직접적인 서식 작업을 가능하게 합니다. OpenAI 엔지니어 James Zhang은 12월 19일 "Writing blocks는 ChatGPT에서 완벽한 이메일을 작성하기 더 쉽게 만들어줍니다"라고 발표하며, 사용자가 "채팅에서 바로 텍스트를 업데이트하고 서식을 지정"하고 "강조 표시하여 변경을 요청하고, 제안을 수락하거나 거부"할 수 있다고 설명했습니다.​생성된 모든 콘텐츠를 일반 텍스트로 표시하던 기존 채팅 응답과 달리, 새로운 시스템은 사용자가 작성 작업을 수행할 때를 인식하고 대화 인터페이스를 서식 있는 텍스트 편집 영역으로 자동 전환합니다. 12월 25일 이 기능을 보도한 기술 미디어 매체 BleepingComputer에 따르면, ChatGPT는 이제 초안을 단순한 채팅 교환이 아닌 포맷된 문서로 취급합니다.확장된 계획과 함께하는 점진적 출시이 업데이트는 ChatGPT 사용자들에게 단계적으로 배포되고 있으며, OpenAI는 추가 문서 형식에 대한 지원이 나중에 추가될 것이라고 밝혔습니다. 현재 이 기능은 사용자가 완성된 초안을 전송 준비가 되면 이메일 클라이언트에서 직접 열 수 있도록 지원합니다.​기술 매체 AIbase는 이 디자인이 "생성-복사-붙여넣기-서식 지정"이라는 작업 과정의 마찰을 줄여, 특히 비즈니스 이메일, 소셜 미디어 콘텐츠 또는 기사 초안을 자주 작성하는 사용자들에게 창작 과정을 더욱 원활하게 만든다고 보도했습니다. 툴바의 논리는 주류 편집기를 반영하여, 표준 워드 프로세싱 애플리케이션에 이미 익숙한 사용자들에게 최소한의 학습 곡선만 필요합니다.​OpenAI는 표, 코드 블록, 이미지 삽입을 포함한 더 복잡한 문서 요소에 대한 지원을 확대하여 이력서 및 학술 논문과 같은 추가 콘텐츠 시나리오에 적응할 계획입니다. 회사는 아직 이 기능이 모든 사용자에게 언제 도달할지 또는 단계적 출시 단계에서 어떤 구독 등급이 접근 권한을 가지는지 명시하지 않았습니다.
4 조회
0 추천
19:02 등록
한국과학기술원(KAIST)의 연구진들은 Google Gemini를 포함한 주요 상용 AI 시스템을 구동하는 Mixture-of-Experts 아키텍처의 보안 취약점을 발견했으며, 단 하나의 악의적인 구성 요소가 전체 AI 모델의 안전 메커니즘을 손상시킬 수 있음을 입증했습니다.전기및전자공학부 신승원 교수와 전산학부 손수엘 교수가 이끄는 연구팀은 12월 12일 하와이에서 열린 Annual Computer Security Applications Conference 2025에서 Distinguished Paper Award를 수상했습니다. "MoEvil: Poisoning Experts to Compromise the Safety of Mixture-of-Experts LLMs"라는 제목의 논문은 MoE 구조의 근본적인 보안 취약점을 체계적으로 분석한 최초의 연구입니다.효율적인 AI 설계에 숨겨진 위협Mixture-of-Experts는 현대 대규모 언어 모델이 모든 요청에 대해 전체 시스템을 활성화하는 대신 특정 질문을 전문화된 "전문가" 모델로 라우팅하여 효율성을 향상시키기 위해 사용하는 아키텍처입니다. 이 설계는 컴퓨팅 성능을 절약하지만, KAIST 연구팀은 악의적으로 훈련된 단일 전문가를 오픈 소스로 배포하면 더 큰 AI 시스템에 통합될 때 위험한 취약점을 만들 수 있다는 것을 입증했습니다.​이 공격은 놀라울 정도로 효과적이며 탐지하기 어렵습니다. 연구에 따르면, 여러 전문가 중 단 하나만 손상되어도 유해한 응답 생성 성공률이 0%에서 80%로 급증합니다. 악의적인 전문가는 특정 주제가 언급될 때마다 제어권을 가져와 다른 작업에 대해서는 정상적인 기능을 유지하면서 AI가 위험하거나 제한된 콘텐츠를 생성하도록 강제합니다.​"이 프로세스는 모델 성능 저하를 거의 일으키지 않아 사전에 문제를 탐지하는 것이 극히 어렵습니다. 이것이 가장 중요한 위험 요소로 간주됩니다"라고 연구자들은 연구 결과에서 언급했습니다.오픈소스 AI 개발에 대한 시사점이 취약점은 AI 산업이 개발을 가속화하기 위해 공유된 오픈소스 구성 요소에 점점 더 의존함에 따라 특히 중요한 의미를 갖습니다. 이 연구는 전체 성능을 평가하는 것뿐만 아니라 개별 전문가 모델의 출처와 안전성을 검증하는 것이 필수적이 되었음을 강조합니다.​연구팀은 KAIST 전기및전자공학부의 김재한, 송민규 박사과정 학생과 현재에서 근무하는 나승호 박사로 구성되었습니다. 이들의 연구는 한국 과학기술정보통신부, 한국인터넷진흥원, 정보통신기획평가원의 지원을 받았습니다.​정보보안 분야에서 가장 영향력 있는 국제 학회 중 하나인 ACSAC는 올해 전체 제출 논문 중 단 두 편만을 최우수 논문상으로 선정했습니다. 이번 수상은 AI 보안 분야에서 한국 연구자들의 주목할 만한 성과를 나타냅니다.
4 조회
0 추천
18:56 등록
"바이브 코딩"이라는 소프트웨어 개발의 새로운 접근 방식이 주말 실험에서 AI 중심 업무의 핵심 패러다임으로 빠르게 진화했으며, 폭발적인 상업적 성공과 기술 부채에 대한 우려가 커지는 가운데 업계 리더들이 그 의미를 논쟁하고 있다.OpenAI 공동 창립자이자 전 Tesla AI 디렉터인 안드레이 카파시(Andrej Karpathy)가 2025년 2월에 만든 이 용어는 개발자들이 원하는 결과를 자연어로 설명하면 AI 코딩 에이전트가 실제 코드를 생성하는 방법을 설명한다. 2025년이 저물어가면서 카파시는 자신의 창작물이 미친 영향을 되돌아보며, 바이브 코딩이 "소프트웨어를 혁신하고 직무 설명을 바꿀 것"이라고 예측했다.상업적 호황이 현실 점검을 맞다상업적 검증은 신속하게 이루어졌다. Anthropic의 Claude Code는 2025년 5월 공개 출시 후 불과 6개월 만에 10억 달러의 매출을 달성했으며, Netflix, Spotify, Salesforce를 포함한 주요 기업들이 이 도구를 채택했다. 한편, AI 코딩 에디터 Cursor는 연간 매출 10억 달러를 돌파했으며, 현재 Fortune 500대 기업 중 절반이 이 플랫폼을 사용하고 있다.​그러나 시장이 폭발적으로 성장하는 가운데, 예상치 못한 곳에서 경고가 나타났다. 12월 24일, Cursor CEO Michael Truell은 vibe 코딩이 "불안정한 기반"을 구축하여 "상황이 무너지기 시작한다"고 경고하며, 개발자들이 여전히 생성되는 코드를 이해할 필요가 있다고 강조했다. 그의 회사는 현재 프로덕션 환경에서 코드의 40-50%를 생성하는 데 도움을 주고 있어, 감독이 매우 중요하다.​이러한 긴장감은 업계 전반의 재평가를 반영한다. AI 코딩 모델은 2025년 말에 전례 없는 벤치마크를 달성했으며, 일부는 SWE-bench Verified에서 80%를 돌파했다—이는 실제 GitHub 이슈 5개 중 4개를 자율적으로 해결할 수 있음을 의미한다. 그러나 보안 연구원들은 vibe 코딩이 "보안보다 빠르게 진행되고 있으며", AI 생성 코드에 대한 검토 프로세스가 불충분하다고 경고한다.Z세대의 관점: 유창함 대 불안12월 8-9일 샌프란시스코에서 열린 Fortune Brainstorm AI에서 응용 AI 연구소 Chima의 공동 창업자이자 CTO인 24세 키아라 니르긴(Kiara Nirghin)은 논란에 대한 세대적 반론을 제시했다. "젊은 세대는 AI를 채택하는 것이 아닙니다"라고 스탠포드 컴퓨터 과학 졸업생이자 피터 틸 펠로우인 그녀는 참석자들에게 말했다. "우리는 AI에 능통하게 자라나고 있습니다".​니르긴은 자신의 세대가 AI를 지름길로 사용한다는 서사를 거부하며, 대신 똑똑한 사용자들은 이러한 도구를 활용하여 단순 작업을 덜어냄으로써 "더욱 깊이 사고"한다고 주장했다. 그녀는 데이터 수집이 아닌 분석에 시간을 할애하기 위해 복잡한 금융 연구 보고서를 AI로 처리하는 것을 예로 들었다.​그러나 그녀는 독특한 부담을 인정했다: 기술의 끊임없는 개선 속도에서 비롯된 "AI 불안". "현재의 모델들은 앞으로 가장 멍청한 상태입니다"라고 니르긴은 경고하며, 최근 출시된 모델들이 "벤치마크를 압도"하여 성능이 하룻밤 사이에 "10배"가 될 수 있다고 언급했다. Z세대 근로자들에게 최신 상태를 유지하는 것은 일상적인 요구사항이며, 그렇지 않으면 "뒤처지게 됩니다".​기하급수적으로 개선되는 모델에 의해 지능이 상품화된다면, 무엇이 인간의 가치를 차별화할까? 니르긴에 따르면, 그것은 사용자가 실제로 원하는 것을 결정하는 인간 중심적 판단인 "취향"이다. 그녀는 코딩 에이전트가 특정 디자인 미학을 "좋아하기" 때문에 인터페이스에 "반짝이는 이모지"를 추가할 때 "그것이 바이브 코딩임을 알 수 있다"고 농담했다.​이러한 변화는 단순히 새로운 도구 이상을 의미한다. 12월 22일에 발표된 연말 리뷰에서 카파시(Karpathy)가 언급했듯이, 바이브 코딩은 "일반인"이 이전에는 전문 교육이 필요했던 소프트웨어를 만들 수 있게 하며, "무료이고, 일시적이며, 변형 가능하고, 한 번 사용 후 버릴 수 있는" 코드를 생성한다. 그 변화가 해방적인지 불안정한지는 업계가 야망에 맞는 안전장치를 얼마나 빨리 개발하느냐에 달려 있을 수 있다.
3 조회
0 추천
18:52 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입