Loading...

AI 뉴스

오픈AI, 휴머노이드 중심으로 로보틱스 팀 재구성

페이지 정보

작성자 xtalfi
작성일 2025.09.16 14:52
1,054 조회
0 추천
0 비추천

본문

1dc70e5a6a2e8a9676f3a2fecb2bddacunS0.jpg

(퍼플렉시티가 정리한 기사)

OpenAI는 인공일반지능(AGI)을 추구하는 전략의 일환으로 휴머노이드 시스템에 중점을 두면서 조용히 로보틱스 역량을 재구축하고 있습니다. 이는 5년 전 로보틱스 부서를 폐쇄한 이후 이 분야로의 의미 있는 복귀를 의미합니다. ChatGPT의 개발사인 OpenAI는 전문화된 팀을 구성하고 로보틱스 분야의 최고 인재를 적극적으로 영입하는 등, 물리적 세계에서 작동할 수 있는 AI 개발에 대한 새로운 의지를 보여주고 있습니다.

최근 보도에 따르면 회사는 특히 휴머노이드 로보틱스를 목표로 하고 있으며, 인간과 유사한 로봇 형태를 제어할 수 있는 알고리즘 개발에 전문성을 가진 연구원을 찾고 있습니다. OpenAI는 원격조종과 시뮬레이션을 통해 로봇을 훈련시키는 직무를 위한 여러 채용 공고를 게시했고, 그 중 한 역할은 부분적 및 완전한 휴머노이드 시스템 모두에 대한 경험을 명시적으로 요구하고 있습니다.

 

전략적 인재 확보

 

채용 열풍에는 OpenAI의 로보틱스 팀에 몇몇 주목할 만한 인재들이 추가된 것이 포함되어 있습니다. 특히 2025년 6월에 스탠퍼드 대학교에서 영입된 Chengshu Li가 주목받고 있는데, 그는 인간형 가정용 로봇이 다양한 가사 업무를 수행할 수 있도록 하는 벤치마크를 중심으로 박사 연구를 진행한 연구원입니다. Li가 가사 업무를 수행하는 인간형 로봇 평가 시스템을 만든 배경은 OpenAI가 소비자용 로봇 개발에 관심이 있음을 시사합니다.

또한 OpenAI는 링크드인 프로필에 따르면 다른 로보틱스 연구소 출신 연구자들을 영입했으며, 인간형 로봇 연구 센터의 교수들은 자신들의 학생들이 회사에 스카우트되었다고 전하고 있습니다. 이러한 전략적 인재 영입은 OpenAI가 인간형 로보틱스 개발의 전 분야에 걸쳐 전문성을 구축하고 있음을 보여줍니다.

 

휴머노이드 분야의 경쟁

 

이 확장은 OpenAI를 빠르게 성장하고 있는 휴머노이드 로보틱스 시장에서 여러 기존 강자들과 직접적으로 경쟁하게 만듭니다. 해당 시장은 2025년까지 29억 2천만 달러에 이를 것으로 예상됩니다. 테슬라(Tesla, Inc.) CEO 일론 머스크(Elon Musk)는 자사의 미래 가치의 80%가 옵티머스(Optimus) 휴머노이드 로봇에서 나올 것이라고 주장하며, 테슬라를 OpenAI의 노력에 대한 주요 경쟁자로 자리매김하고 있습니다. 한편, 보스턴 다이내믹스(Boston Dynamics)는 아틀라스(Atlas) 플랫폼의 뛰어난 이동성 시연으로 계속 발전을 이어가고 있고, Figure AI는 주요 테크 투자자들로부터 6억 7,500만 달러의 자금을 확보했습니다.

특히, Figure AI는 2025년 2월 OpenAI와의 파트너십을 종료했습니다. CEO 브렛 애드콕(Brett Adcock)은 "수직적으로 통합된 로봇 AI"의 필요성을 언급하며, 자사가 엔드-투-엔드(robotics 전 과정)에서 "주요 돌파구"를 달성했다고 밝혔습니다. 이 분리는 양사가 휴머노이드 개발에서 독립적인 길을 추구하고 있음을 시사하며, 경쟁이 더욱 심화될 가능성을 내포하고 있습니다.

 

기술적 집중 및 채용 공고

 

OpenAI의 현재 채용 공고는 로봇 공학 이니셔티브에 대한 구체적인 기술적 우선순위를 드러냅니다. 회사는 센싱 기술, 촉각 시스템, 그리고 힘 센서에 대한 전문 지식을 가진 기계 엔지니어를 모집하고 있는데, 이는 로봇이 물리적 환경과 안전하게 상호작용하기 위해 필수적인 요소들입니다. 한 공고에서는 "대량 생산을 위한 시스템 설계"를 명시하고 있어, OpenAI가 대규모 제조 응용 분야를 고려하고 있을 가능성을 시사합니다.

공고들은 "범용 로봇 공학의 잠재력을 열고, 실제 동적 환경에서 AGI 수준의 지능을 향해 나아간다"는 팀의 미션을 강조하며, OpenAI가 로봇 공학을 더 넓은 AGI 목표 달성에 필수적인 요소로 보고 있음을 나타냅니다. 이는 진정한 인공지능이 단순히 디지털 정보를 처리하는 것뿐 아니라 물리적 세계를 이해하고 다룰 수 있는 AI 시스템이 필요하다는 업계 시각과도 일치합니다.

OpenAI는 과거 창립 이후 2021년까지 로봇 공학 부서를 운영했으나, AI 시스템 발전에 필요한 충분한 훈련 데이터가 부족해 부서가 폐쇄되었습니다. 이제 다시 로봇 공학에 뛰어드는 것은 향상된 AI 역량과 더 나은 훈련 방법론의 이용 가능성을 반영하는데, 시뮬레이션 환경과 원격 조작 시스템이 현대 머신러닝 접근법에 필요한 대규모 데이터셋을 생성할 수 있도록 돕고 있습니다.

댓글 0
전체 834 / 163 페이지
(퍼플렉시티가 정리한 기사)배경훈 과기정통부 장관이 지난 12일 취임 50일 기자간담회에서 한국의 AI 글로벌 경쟁력 강화와 정보보호 체계 전면 개편 방안을 발표했다. 장관은 AI 3대 강국 실현을 위한 구체적 청사진과 함께 최근 통신사 해킹 사고에 대한 근본적 대응 방안을 제시했다.‘AI 3대 강국’ 전략, GPU 20만장 확보 목표배경훈 장관은 “AI 3대 강국이라는 것은 단순히 3위를 차지하는 것이 아니라 미국과 중국에 근접한 수준의 기술 역량과 시장 영향력을 확보하는 것”이라고 강조했다.과기정통부는 2030년까지 GPU 20만장 확보를 목표로 설정했다. 기존 5만장 계획을 2028년으로 앞당기고 최종 목표를 4배 확대한 것이다. 배 장관은 “지금 AI 기술과 시장이 바뀌는 속도를 보면 5만장도 충분치 않다”며 “내부에서 2030년까지 GPU 20만장 구축할 계획을 수립 중”이라고 밝혔다.또한 연말까지 글로벌 톱10 수준의 독자 AI 파운데이션 모델을 발표할 예정이다. 배 장관은 “올해 말이면 세계 10위 안에 드는 수준의 거대언어모델(LLM)이 나올 것”이라며 “이를 멀티모달, 행동모델로 발전시켜 피지컬 AI까지 구현하겠다”고 말했다.‘포용적 K-AI’로 글로벌 진출 추진배 장관은 K-AI에 대해 “소버린 AI로만 정리하고 싶지 않다. 포용성을 넘어 글로벌 선택을 받는 AI 기술을 가져야 된다”고 강조했다. 한국만의 AI가 아닌 전 세계가 선택할 수 있는 포용적 AI 개발에 나선다는 방침이다.이를 위해 ‘AI 기본법’의 과태료 부과를 최소 1년 이상 유예하기로 했다. 배 장관은 “AI 기본법의 핵심은 산업 진흥에 있다”며 “AI 기술의 악남용을 막기 위한 최소한의 규제는 두겠지만 과태료는 유예할 것”이라고 밝혔다.해킹 대응 체계 전면 개편SK텔레콤 등 통신사 해킹 사고와 관련해 배 장관은 근본적 정보보호 대책을 마련하겠다고 발표했다. 현행 기업 신고 후 조사하는 방식에서 벗어나 선제적 대응 체계로 전환한다는 계획이다.배 장관은 “해킹 기술이 계속 발전하고 조직화, 지능화되고 있어 근본적 대책을 고민하고 있다”며 “기존 국장급에서 2차관을 단장으로 하는 TF를 꾸리고 현재 기업 신고 시에만 민관합동조사를 할 수 있는 체계를 바꾸기 위해 국회와 얘기하고 있다”고 설명했다.과기정통부 부총리급 격상, AI 거버넌스 강화10월 과기정통부의 부총리급 격상과 함께 ‘과학기술 AI 장관회의’가 신설된다. 배 장관은 “내년 AI 예산이 10조원을 넘는다”며 “부처 간 중복된 예산을 없애고 효율화하는 작업이 필요하다”고 장관회의 신설 배경을 설명했다.배 장관은 “2023년 미국과의 AI 경쟁력 차이가 1.3년이었다면 2030년에는 0.5년으로 줄이겠다”며 “AI 대전환을 통해 정체된 잠재 성장률을 3% 수준으로 끌어올리는 데 기여하겠다”고 강조했다.
1010 조회
0 추천
2025.09.14 등록
(퍼플렉시티가 정리한 기사)구글의 Gemini 앱이 처음으로 Apple App Store에서 1위를 차지하며 ChatGPT를 제치고 Nano Banana AI 이미지 생성 기능의 폭발적인 성공을 활용했습니다. 이 이정표는 인공지능 주도권을 놓고 경쟁이 갈수록 치열해지는 구글(알파벳)과 오픈AI 간의 주요한 성과를 의미합니다.나노 바나나가 전례 없는 성장을 이끈다이 인기가 급상승하게 된 직접적인 원인은 Nano Banana(공식 명칭: Gemini 2.5 Flash Image)에서 비롯된 것으로, 사용자가 간단한 텍스트 프롬프트만으로 일반 사진을 하이퍼리얼리즘 3D 피규어로 변환할 수 있게 해주는 기능입니다. Google 부사장 Josh Woodward에 따르면, 이 기능은 8월 말 출시 이후 2억 장 이상의 이미지를 생성했으며, Gemini 앱에 1,000만 명 이상의 신규 사용자를 유치했다고 합니다.이 바이럴 트렌드는 전 세계 소셜 미디어 이용자들을 매료시켰으며, 사람들은 저마다 자신, 반려동물, 심지어 유명인의 수집품 스타일 피규어와 포장 모형, 투명 아크릴 받침대까지 만들어내고 있습니다. 이 기능은 기술적 지식이나 결제가 전혀 필요하지 않아 누구나 쉽게 사용할 수 있으며, 고품질 AI 이미지 생성의 민주화를 이뤄냈고, 누구든지 몇 초 만에 전문가 수준의 결과물을 만들 수 있게 했습니다.앱 스토어 순위 변화현재 앱 순위에 따르면 Gemini가 무료 앱 부문에서 1위를 차지하며 ChatGPT를 2위로 밀어냈습니다. 이는 구글의 AI 어시스턴트가 애플 플랫폼에서 처음으로 정상에 오른 것으로, 이전에 ChatGPT의 지브리 열풍과 같은 바이럴 AI 트렌드에서 보았던 성공 패턴을 따른 결과입니다.Gemini 앱은 최근 몇 주 동안 급격히 상승했으며, 트래킹 데이터에 따르면 9월 초 기준 Google Play 스토어에서 생산성 부문 2위, 전체 13위에 올랐습니다. 업계 관계자들은 이 빠른 성장의 원인을 Nano Banana의 기능과 구글의 마케팅 전략, 특히 CEO 순다 피차이 등 경영진의 바나나 이모지 티저가 포함된 해커톤과 소셜 미디어 캠페인에 있다고 분석합니다.경쟁 환경이 더욱 치열해지고 있다이번 개발은 2022년 출시 이후 ChatGPT가 지배해온 AI 챗봇 시장에 잠재적인 변화가 있을 수 있음을 시사합니다. 여전히 ChatGPT가 전체 시장 점유율의 약 60%로 Gemini의 13.5%와 비교해 선두를 유지하고 있지만, 구글의 모바일 측면에서의 성장세는 특히 Android 기기에서 Gemini 사용자의 거의 90%가 집중되고 있는 만큼, 사용자 선호도가 변화하고 있음을 보여줍니다.Nano Banana의 성공은 Gemini를 차별화하기 위한 Google의 광범위한 전략을 뒷받침합니다. 멀티모달 기능과 Google 서비스의 원활한 통합을 통해 Gemini의 경쟁력을 높였습니다. 이 기능은 수정 과정에서 캐릭터의 일관성을 유지하고, 여러 이미지를 자연스럽게 조합할 수 있어 기존 AI 이미지 툴이 어려움을 겪었던 주요 문제들을 해결함으로써, Google이 창의적 응용 분야에서 경쟁우위를 가지게 했습니다.AI 경쟁이 계속되는 가운데, 이번 앱스토어에서의 성공은 ChatGPT와 같은 기존의 강자들에 맞서 바이럴한 기능이 시장의 흐름을 얼마나 빠르게 뒤바꿀 수 있는지를 보여줍니다.
1070 조회
0 추천
2025.09.14 등록
(퍼플렉시티가 정리한 기사)구글 AI 리서치와 딥마인드는 프라이버시에 중점을 둔 10억 매개변수의 오픈소스 언어 모델인 VaultGemma를 공개했습니다. 이는 차등 프라이버시 인공지능 분야에서 중요한 진전을 의미합니다. 구글의 최고 과학자 제프 딘(Jeff Dean)이 발표한 이 모델은 차등 프라이버시로 완전히 처음부터 학습된 최대 규모의 오픈웨이트 LLM으로, 프라이버시 보호형 AI 개발의 새로운 기준을 세웠습니다.VaultGemma는 웹 규모 데이터셋으로 학습된 시스템에서 민감한 정보가 추출될 수 있는 AI 모델의 암기 공격에 대한 중요한 우려를 해결합니다. 구글 리서치에 따르면, 이 모델은 훈련 중에 보정된 노이즈를 추가하여 어느 하나의 데이터 포인트가 최종 모델에 크게 영향을 미치지 못하도록 하는 고급 차등 프라이버시 기법을 활용해 개발되었습니다.기술 혁신과 프라이버시 보장이 모델은 그래디언트 클리핑과 가우시안 노이즈 추가가 결합된 DP-SGD(차등 개인 정보 보호 확률적 경사 하강법)를 사용하여, 시퀀스 수준에서 (ε ≤ 2.0, δ ≤ 1.1e-10)의 공식적인 프라이버시 보장을 달성합니다.VaultGemma는 Gemma 2에 사용된 것과 동일한 13조 토큰 데이터셋으로 학습되었으며, 이는 주로 웹 문서, 코드, 과학 논문 등 영어 텍스트로 구성되어 있습니다.구글 연구팀은 특히 차등 개인 정보 보호를 적용한 언어 모델을 위한 새로운 스케일링 법칙을 개발했으며, 이는 컴퓨트-프라이버시-유틸리티의 균형 이해를 위한 종합적인 프레임워크를 제공합니다. 이러한 스케일링 법칙은 모델의 성능을 정확하게 예측하고, 2048개의 TPUv6e 칩 클러스터에서의 학습 과정에서 효율적인 자원 할당을 가능하게 했습니다.성능 및 접근성VaultGemma는 훈련 데이터에 대한 감지 가능한 암기 현상을 보이지 않지만, 현재 성능은 비공개 모델에 비해 뒤처지고 있습니다. 학술 벤치마크에서 약 5년 전의 비공개 모델과 유사한 점수를 기록하고 있으며, 그 예로 ARC-C에서 26.45점을 달성한 반면 Gemma-3 1B는 38.31점을 기록했습니다.Google은 VaultGemma의 가중치를 Hugging Face와 Kaggle에 공개했으며, 이에 더해 포괄적인 기술 보고서와 연구 논문도 함께 제공하고 있습니다. 회사가 이렇게 오픈 릴리스를 진행한 배경에는, 강력한 모델과 명확한 방법론을 커뮤니티에 제공함으로써 프라이빗 AI 연구 및 개발 가속화를 도모하려는 의도가 있습니다.이번 공개를 통해 Google은 개인정보 보호를 중시하는 AI 개발 분야의 선두에 섰으며, 데이터 보호에 대한 규제가 강화되는 상황에서 경쟁력 있는 AI 역량을 유지함과 동시에 관련 문제를 해결하고 있습니다. 이 연구는 대규모 언어 모델이 엄격한 프라이버시 보장을 적용해도 실제 응용 사례에서 비현실적으로 변하지 않고 충분히 실용적으로 훈련될 수 있음을 보여줍니다.
1026 조회
0 추천
2025.09.14 등록
(퍼플렉시티가 정히한 기사)구글는 구글 지도의 데이터를 카메라 뷰파인더에 직접 통합하여 증강현실 내비게이션 경험을 제공하는 Gemini Live AI 어시스턴트의 혁신적인 업그레이드를 테스트 중이라고 Android Authority가 숨겨진 코드에서 발견했습니다. 최신 구글 앱 베타 버전에서 포착된 이 기능은 사용자가 스마트폰 카메라로 상점, 랜드마크 또는 거리를 비추면 이름, 평점, 리뷰와 같은 정보 카드가 즉시 화면에 오버레이되어 표시됩니다.이 업그레이드는 8월 Pixel 10 시리즈 출시와 함께 구글이 도입한 시각적 안내 기능을 기반으로 하며, Gemini Live는 화면에 특정 객체를 강조하여 사용자의 업무를 도왔습니다. Android Authority의 테스트에 따르면, 새로운 지도 통합 기능은 카메라 화면에 여러 상점이나 위치가 인식될 경우 동시에 여러 정보 카드를 표시한다고 합니다.실시간 AR 내비게이션 기능Google의 기존 Maps 내 Lens 기능과는 달리, 이번 통합 기능은 사용자가 주변 환경에 대해 자연스러운 대화를 나누면서 시각적 데이터 오버레이를 받을 수 있도록 해줍니다. 사용자는 Gemini Live에게 자신이 보고 있는 레스토랑, 상점, 혹은 랜드마크에 대해 질문하면서 동시에 Google Maps 정보가 화면에 표시되는 것을 볼 수 있습니다.이 기능은 위치 서비스와 독립적으로 작동하며, 주로 시각 인식을 통해 Google의 방대한 Maps 데이터베이스에서 관련 데이터를 불러옵니다. 초기 테스트 결과, 시스템은 카메라 입력만으로도 위치를 식별할 수 있었으나, 위치 서비스를 활성화하면 정확도가 향상될 것으로 보입니다.Android Authority는 Google 앱 버전 16.35.63 베타에서 이 기능을 성공적으로 활성화했으며, 사업장 이름, 종류, 평균 평점, 리뷰 수 등이 표시되는 정보 카드가 잘 작동하는 모습을 시연했습니다. 이 구현은 오디오 전용 모드에서도 작동하므로, 사용자는 카메라 뷰파인더를 사용하지 않고도 특정 위치 정보를 요청할 수 있습니다.스마트 안경 통합 전망업계 분석가들은 이번 개발을 스마트 글래스 통합을 위한 준비 단계로 보고 있습니다. 특히 삼성은 9월 29일 Unpacked 행사에서 Galaxy Glasses를 공개할 계획인 것으로 전해지고 있습니다. AR 스타일 오버레이 기술을 통해 사용자는 비즈니스 정보와 길 안내가 담긴 플로팅 정보 카드를 시야 내에서 바로 볼 수 있게 됩니다.이번 일정은 구글이 삼성, 퀄컴과 협력해 발표한 안드로이드 XR 이니셔티브와도 맞물립니다. 이들 기업은 안드로이드 XR 기반 XR 헤드셋과 스마트 글래스를 개발하고 있으며, 삼성의 오디오 중심 Galaxy Glasses는 메타의 Ray-Ban 스마트 글래스와 직접 경쟁할 것으로 예상됩니다.구글은 아직 지도 통합 기능의 공식 출시 일정을 발표하지 않았으나, 관련 코드 인프라는 이미 베타 버전에 적용된 상태입니다. 회사는 최근 업데이트를 통해 Calendar, Keep, Tasks와의 통합 및 Google Maps 기능 강화 등 Gemini Live의 역량을 지속적으로 확대해 나가고 있습니다.
1049 조회
0 추천
2025.09.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입