Loading...

AI 뉴스

알리바바, 미국 Plaud에 도전하는 70달러 AI 음성 녹음기 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.05 04:05
935 조회
0 추천
0 비추천

본문

439c6e137095da74a44e30d2a87f4902Vx0s.jpg

(퍼플렉시티에서 정리한 기사입니다.)

알리바바는 경쟁이 치열한 AI 하드웨어 시장에 진출하며 신용카드 크기의 디바이스인 딩톡 A1 보이스 레코더를 출시했습니다. 이 제품은 미국 기반의 Plaud와 같은 기존 업체에 직접적으로 도전장을 내미는 제품으로, 8월 말 딩톡의 10주년 행사에서 공개되었고 9월 2일에 공식 출시되었습니다. 이번 출시로 중국의 기술 대기업인 알리바바가 처음으로 물리적 AI 하드웨어 시장에 본격적으로 진입하게 되었습니다.

딩톡 A1은 499위안(약 70달러)과 799위안(약 112달러)의 두 가지 모델로 출시되었으며, 이는 플로드(Plaud)에서 새롭게 출시한 노트 프로(Note Pro)의 179달러에 비해 훨씬 저렴한 가격입니다. 이러한 공격적인 가격 전략은 중국의 제조 비용 우위, 특히 세계 전자제품의 약 90%를 생산하는 선전(Shenzhen)과 같은 전자 생산 허브에서 비롯된 것입니다.

컨설팅 업체 런투(Runto)에 따르면, 중국의 AI 하드웨어 시장은 2025년 1.1조 위안(1,530억 달러) 규모에 이를 것으로 전망되며, 2030년에는 2.5조 위안으로 두 배 이상 성장할 것으로 예상됩니다. 이러한 빠른 성장세는 정부의 정책적 지원, 기술 자립에 대한 중국의 강한 의지, 그리고 전통 산업 전반에서의 AI의 광범위한 도입에 힘입은 것입니다.

DingTalk A1은 알리바바의 Tongyi AI 연구소와의 협력을 통해 개발된 첨단 기술을 도입했습니다. 이 기기의 음성 전사 시스템은 1억 시간 이상의 오디오 콘텐츠로 훈련되어 100개 이상의 언어와 30개 중국 방언을 실시간으로 번역할 수 있습니다.

2025년 3월, 스타트업 HHO를 창업한 뒤 플랫폼으로 복귀한 DingTalk의 CEO 첸항은 출시 행사에서 이 기기의 전문적인 기능을 강조했습니다. A1에는 6개의 마이크로 이루어진 배열과 골전도 기술이 탑재되어 있어, 8미터의 초장거리 오디오 픽업과 45시간 연속 녹음을 지원합니다. 3.8mm의 얇은 두께와 자석 부착 방식은 스마트폰이나 기타 표면에 쉽게 부착할 수 있을 만큼 휴대성을 높여줍니다.

이 기기는 초기 물량이 매진되며 AI 통합 하드웨어에 대한 강한 소비자 수요를 알렸습니다. 이번 출시로 인해 이미 Mobvoi의 TicNote 녹음기와 같은 중국 경쟁업체뿐만 아니라 Plaud를 넘어선 국제 업체들까지 포함된 시장의 경쟁이 더욱 치열해지고 있습니다.

업계 분석가들은 알리바바의 하드웨어 진출의 전략적 중요성에 주목합니다. Runto의 Liu Chuang은 예상되는 시장 성장과 함께 “복수의 플레이어가 공존하며 빠른 제품 사이클, 기능 경쟁, 그리고 AI 하드웨어 생태계의 혁신을 이끌 것으로 예상된다”고 밝혔습니다.

딩톡 A1의 출시는 알리바바가 경영진이 역사적 성장 기회로 규정한 더 큰 AI 전략을 뒷받침하고 있습니다. 1분기 실적이 기대에 미치지 못했음에도 불구하고, 분석가들은 생성형 AI와 클라우드 인프라에서의 경쟁 우위 등 내재된 강점을 꼽았습니다. AI 하드웨어 진출은 독자적인 AI 칩과 오픈소스 프로젝트에 3년간 530억 달러를 투자한다는 알리바바의 계획과 부합하며, 이는 미국 공급 업체에 대한 의존도를 줄이고 지역 AI 생태계를 육성하는 데 목적이 있습니다.

댓글 0
전체 565 / 105 페이지
(퍼플렉시티가 정리한 기사)구글의 혁신적인 AI 이미지 편집 도구인 'Nano Banana'는 출시 첫 주에만 1천만 명이 넘는 신규 사용자를 Gemini 앱으로 끌어들이고 2억 장 이상의 이미지를 처리하면서 전 세계적인 주목을 받고 있습니다. 이처럼 빠른 성공은 최근 AI 역사상 가장 빠른 사용자 도입 속도 중 하나로 평가받고 있습니다.구글의 랩스와 Gemini 담당 부사장인 Josh Woodward는 9월 4일 X(구 Twitter)를 통해 “2억 개 이상의 이미지가 편집되었고, 1천만 명 이상이 @GeminiApp에 새롭게 접속했다”고 이정표가 되는 수치를 발표했습니다. 그는 “TPUs가 뜨겁고 SRE 호출기가 울린다”는 문구를 포함해, 이 기능이 엄청난 서버 수요를 불러왔음을 강조하기도 했습니다.세계적인 현상이 앱 다운로드를 이끈다공식 명칭은 Gemini 2.5 플래시 이미지(Gemini 2.5 Flash Image)이지만, 이 도구는 내부 테스트 중에 "Nano Banana(나노 바나나)"라는 별명을 얻었으며, 대중 출시 때에도 이 재치 있는 별명을 유지하고 있습니다. 현재 이 기능은 LMArena의 이미지 편집 리더보드에서 경쟁자들보다 171점 앞서며 1위를 차지하고 있습니다.이러한 급증으로 Gemini 앱은 앱스토어 생산성 카테고리 2위, 플레이스토어 전체 무료 차트 13위에 올랐습니다. Android Police의 보도에 따르면, 이 도구는 이전에 Gemini를 사용해본 적 없는 신규 사용자들을 끌어들였으며, 이는 기존 사용자 참여가 아닌 진정한 신규 사용자 유입을 의미합니다.피규어 트렌드, 입소문을 타고 화제"피규어 프롬프트"가 가장 인기 있는 사용 사례로 떠오르면서, 사용자들은 개인 사진을 사실적인 콜렉터블 스타일의 액션 피규어로 변환하고 있습니다. 필리핀은 이 트렌드의 선도적인 수용 국가가 되어, 2,500만 개 이상의 이미지를 생성하며 전 세계 최고 사용 국가로 자리매김했습니다.구글은 특정 프롬프트를 적극적으로 홍보하고 있습니다: "나노-바나나 모델을 사용하여, 일러스트 캐릭터의 1/7 스케일 상업용 피규어를 사실적인 스타일과 설정으로 디자인하세요. 피규어를 컴퓨터 책상에 배치하고, 텍스트 없이 투명한 원형 아크릴 베이스에 장착하세요".기술적 이점이 도입을 촉진한다모델의 성공은 여러 번의 편집을 거쳐도 캐릭터의 일관성을 유지하는 능력에서 비롯되었으며, 이는 AI 이미지 생성에서 흔히 발생하는 ‘언캐니 밸리(uncanny valley)’ 문제를 해결합니다. Android Police에 따르면, 사용자는 얼굴 특징과 객체 특성을 인지할 수 있도록 반복적으로 수정할 수 있습니다.엑세스(Access)는 단계별 시스템으로 운영되며, 무료 Gemini 사용자는 하루에 100번의 편집이 가능하고, 유료 구독자는 하루 최대 1,000번의 편집을 이용할 수 있습니다. 모든 결과물에는 AI 생성 콘텐츠임을 식별할 수 있도록 구글의 SynthID 워터마크가 포함됩니다.Nano Banana의 빠른 채택은 사용하기 쉬운 AI 도구가 실제 창의적인 과제를 해결하면서 일반 대중에게 접근 가능할 때, 대중적으로 인기를 얻을 수 있음을 보여줍니다.
967 조회
0 추천
2025.09.06 등록
사이버 범죄자들이 X의 Grok AI를 악용하여 악성 링크를 유포하는 새로운 기법이 발견되었다고 합니다. Guardio Labs의 나티 탈이 이 기법을 Grokking이라고 명명했다고 합니다.이 방법은 X의 광고 보호 시스템을 우회하는 방식으로 작동한다고 합니다. 범죄자들은 성인 콘텐츠를 미끼로 사용한 비디오 카드 광고 게시물을 올리고, 악성 링크를 비디오 플레이어 아래 From 메타데이터 필드에 숨겨둔다고 합니다. 이 부분은 X 플랫폼에서 스캔하지 않는 영역이라고 합니다.다음 단계에서 사기꾼들은 해당 게시물에 댓글로 Grok을 태그하고 이 비디오가 어디서 나온 것인지 묻는다고 합니다. 그러면 Grok AI 챗봇이 응답으로 해당 링크를 눈에 보이게 표시한다고 합니다.탈은 수백만 조회수를 기록한 게시물에서 Grok이 링크를 언급함으로써 SEO와 도메인 신뢰도가 증폭된다고 설명했습니다. X에서 명시적으로 금지하는 악성 링크가 시스템이 신뢰하는 Grok 계정의 게시물에 나타나 수백만 피드와 검색 결과로 확산된다고 합니다.이 링크들은 사용자를 의심스러운 광고 네트워크로 보내서 가짜 CAPTCHA 사기, 정보 탈취 악성코드 및 기타 의심스러운 콘텐츠로 연결된다고 합니다. 해당 도메인들은 동일한 Traffic Distribution System의 일부로 평가되며, 이는 악성 광고 기술 업체들이 유해하거나 기만적인 콘텐츠로 트래픽을 라우팅하는데 자주 사용된다고 합니다.Guardio는 지난 며칠 동안 이런 행동을 하는 수백 개의 계정을 발견했다고 했으며, 각각이 수백 또는 수천 개의 유사한 게시물을 올렸다고 합니다. 이들은 플랫폼 정책 위반으로 계정이 정지될 때까지 며칠 동안 논스톱으로 게시하는 것 같다고 합니다.
922 조회
0 추천
2025.09.06 등록
(퍼플렉시티가 정리한 기사)Tencent은 단일 이미지를 탐색 가능한 3D 세계로 변환하는 오픈소스 AI 모델인 HunyuanWorld-Voyager를 출시했습니다. 이 모델은 스탠퍼드 대학교의 WorldScore 벤치마크에서 77.62라는 최고 종합 점수를 달성해 WonderWorld(72.69)와 CogVideoX-I2V(62.15) 등 경쟁 모델을 능가했습니다.HunyuanWorld-Voyager는 7월에 공개된 Tencent의 이전 HunyuanWorld 1.0 모델을 기반으로 합니다. 새로운 시스템은 RGB 비디오와 깊이 정보를 동시에 생성해 사용자가 키보드나 조이스틱 컨트롤을 통해 가상 환경을 탐색할 수 있게 합니다. 9월 2일 Tencent의 발표에 따르면, 이 모델은 업계 최초로 네이티브 3D 재구성 기능을 갖춘 초장거리 세계 모델입니다.기술 혁신과 성과이 모델은 이전에 생성된 3D 포인트를 저장하는 "월드 캐시" 메커니즘을 사용하여 확장된 가상 공간에서 일관성 있는 탐색이 가능합니다. 기존의 비디오 생성 방식과 달리, Voyager는 49개의 프레임이 포함된 2.5초 길이의 클립을 생성하며, 이를 이어 붙이면 더 긴 시퀀스도 만들 수 있습니다. 시스템은 캐시에 저장된 3D 포인트를 새로운 카메라 뷰에 투영하여, 다른 월드 생성 모델에서 흔히 발생하는 시각적 결함을 피하면서 공간적 일관성을 유지합니다.Tencent는 10만 개 이상의 비디오 클립을 분석한 자동화된 데이터 파이프라인을 통해 Voyager를 학습시켰으며, 실제 영상과 Unreal Engine의 합성 렌더 파일을 조합했습니다. 이 접근 방식 덕분에 카메라 움직임과 깊이 정보에 대한 수작업 주석이 필요하지 않았습니다. 이 모델은 객체 제어(66.92), 스타일 일관성(84.89), 주관적 품질(71.09) 등 여러 WorldScore 분야에서 우수한 성과를 냈으나, 카메라 제어 부문에서는 WonderWorld의 92.98점에 이어 2위를 차지했습니다.하드웨어 요구 사항 및 제한 사항Voyager를 운영하려면 상당한 컴퓨팅 리소스가 필요하며, 540p 해상도 출력을 위해 최소 60GB의 GPU 메모리가 필요하고, 최적의 결과를 위해 텐센트는 80GB를 권장합니다. 이 회사는 단일 및 다중 GPU 구성을 모두 지원하는 코드와 함께 모델 가중치를 Hugging Face에서 제공하고 있습니다.그러나 이 모델은 유럽 연합, 영국, 대한민국에서의 사용을 제한하는 라이선스 제한이 있습니다. 월간 활성 사용자가 1억 명을 초과하는 상업적 활용의 경우 텐센트와 별도의 라이선스 계약이 필요합니다. 이러한 제한은 텐센트의 훈위안(Hunyuan) 생태계 내 기타 모델에도 적용되며, 이는 회사의 지역별 라이선스 정책을 반영합니다.시장 환경 및 응용 사례이번 출시로 텐센트는 인터랙티브 3D 세계 생성 시스템을 개발하는 기타 기업들과 어깨를 나란히 하게 되었습니다. 구글은 8월에 Genie 3를 발표했고, 다이나믹스 랩의 Mirage 2는 사진을 플레이 가능한 공간으로 변환할 수 있도록 해줍니다. Voyager는 비디오 제작과 3D 재구성을 중점적으로 다루어, 순수한 인터랙티브 방식과 차별화됩니다.벤치마크 성과에도 불구하고, 전문가들은 현재의 높은 컴퓨팅 요구사항과 장기간, 일관된 장면 생성의 한계로 인해, 실시간 게임이나 대규모 애플리케이션에서는 즉각적인 적용이 어렵다고 지적합니다. 해당 기술은 AI 기반 가상 세계 창조의 진보를 보여주지만, 대중적 도입은 하드웨어 사양과 라이선스 제한으로 인해 여전히 제약을 받고 있습니다.
869 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사)국민 메신저 카카오톡에 오픈AI의 생성형 인공지능 챗GPT가 탑재될 예정이다. 카카오는 메신저 앱 이탈 없이 채팅 탭에서 직접 챗GPT를 사용할 수 있도록 하는 기능을 개발하고 있으며, 이는 지난 2월 시작된 카카오와 오픈AI 간 전략적 제휴의 첫 결과물이 될 전망이다카카오톡 채팅 탭에 챗GPT 아이콘 탑재업계 관계자들에 따르면, 카카오는 카카오톡의 채팅 탭에 챗GPT 아이콘을 탑재하는 방식으로 서비스를 구현할 계획이다. 이용자가 별도 앱을 실행하지 않고도 카카오톡 내에서 특정 버튼을 클릭해 즉시 챗GPT와 대화할 수 있게 된다. 카카오는 또한 카카오톡 채팅방의 '샵(#) 검색' 기능에서도 챗GPT를 활용할 수 있는 방안을 검토 중인 것으로 알려졌다.정신아 카카오 대표는 지난 8월 2분기 실적발표에서 "그동안 AI 서비스 경험이 없던 이용자도 친구와 채팅 중 챗GPT 검색 결과를 공유받거나 하루에도 수십 번 접속하는 핵심 지면에서 챗GPT와 마주하면 자연스럽게 관심을 가질 것"이라고 설명했다.9월 23일 '이프 카카오'에서 공식 발표카카오는 오는 9월 23일부터 25일까지 경기도 용인 카카오 AI 캠퍼스에서 개최되는 연례 개발자 컨퍼런스 '이프 카카오25'에서 오픈AI와의 협업 결과물을 처음 공개할 예정이다. 컨퍼런스 첫날 정신아 대표가 카카오톡 개편과 신규 AI 서비스, 오픈AI 공동 프로덕트를 발표할 계획이다.정 대표는 "이프 카카오에서 오픈AI와 협업한 실제 제품 형상을 공개할 예정"이라며 "늦어도 다음 실적 발표 전에는 모두가 제품을 사용할 수 있을 것"이라고 예고했다. 이에 따라 카카오톡의 챗GPT 탑재는 빠르면 11월 전에 이용자들이 사용할 수 있을 것으로 전망된다.오픈AI 한국 법인 설립과 시너지이번 협업은 오픈AI의 한국 진출과도 맞물려 있다. 오픈AI는 지난 5월 한국 법인 설립을 공식 발표했으며, 오는 10일 한국 사무소 공식 출범을 앞두고 있다. 오픈AI 한국 법인은 서울 강남구 테헤란로에 설치되며, 전 세계 12번째, 아시아에서는 세 번째 거점이다.한국은 챗GPT 유료 구독자 수 기준으로 미국에 이어 전 세계 2위를 기록하고 있으며, 국내 월간 활성 이용자가 2000만 명을 넘어서는 등 오픈AI에게 중요한 시장으로 평가받고 있다. 카카오의 월간 활성 이용자는 4930만 명에 달해, 오픈AI는 이번 협력을 통해 한국 시장에서의 영향력을 크게 확대할 수 있을 것으로 기대한다.카카오 관계자는 "오픈AI와의 협업 프로젝트의 구체적인 형상 일부를 이번 이프카카오에서 공개할 예정"이라며 "구체적인 내용은 아직 확인해주기 어렵다"고 밝혔다.
896 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입