Loading...

AI 뉴스

알리바바, 미국 Plaud에 도전하는 70달러 AI 음성 녹음기 출시

페이지 정보

작성자 xtalfi
작성일 09.05 04:05
40 조회
0 추천
0 비추천

본문

439c6e137095da74a44e30d2a87f4902Vx0s.jpg

(퍼플렉시티에서 정리한 기사입니다.)

알리바바는 경쟁이 치열한 AI 하드웨어 시장에 진출하며 신용카드 크기의 디바이스인 딩톡 A1 보이스 레코더를 출시했습니다. 이 제품은 미국 기반의 Plaud와 같은 기존 업체에 직접적으로 도전장을 내미는 제품으로, 8월 말 딩톡의 10주년 행사에서 공개되었고 9월 2일에 공식 출시되었습니다. 이번 출시로 중국의 기술 대기업인 알리바바가 처음으로 물리적 AI 하드웨어 시장에 본격적으로 진입하게 되었습니다.

딩톡 A1은 499위안(약 70달러)과 799위안(약 112달러)의 두 가지 모델로 출시되었으며, 이는 플로드(Plaud)에서 새롭게 출시한 노트 프로(Note Pro)의 179달러에 비해 훨씬 저렴한 가격입니다. 이러한 공격적인 가격 전략은 중국의 제조 비용 우위, 특히 세계 전자제품의 약 90%를 생산하는 선전(Shenzhen)과 같은 전자 생산 허브에서 비롯된 것입니다.

컨설팅 업체 런투(Runto)에 따르면, 중국의 AI 하드웨어 시장은 2025년 1.1조 위안(1,530억 달러) 규모에 이를 것으로 전망되며, 2030년에는 2.5조 위안으로 두 배 이상 성장할 것으로 예상됩니다. 이러한 빠른 성장세는 정부의 정책적 지원, 기술 자립에 대한 중국의 강한 의지, 그리고 전통 산업 전반에서의 AI의 광범위한 도입에 힘입은 것입니다.

DingTalk A1은 알리바바의 Tongyi AI 연구소와의 협력을 통해 개발된 첨단 기술을 도입했습니다. 이 기기의 음성 전사 시스템은 1억 시간 이상의 오디오 콘텐츠로 훈련되어 100개 이상의 언어와 30개 중국 방언을 실시간으로 번역할 수 있습니다.

2025년 3월, 스타트업 HHO를 창업한 뒤 플랫폼으로 복귀한 DingTalk의 CEO 첸항은 출시 행사에서 이 기기의 전문적인 기능을 강조했습니다. A1에는 6개의 마이크로 이루어진 배열과 골전도 기술이 탑재되어 있어, 8미터의 초장거리 오디오 픽업과 45시간 연속 녹음을 지원합니다. 3.8mm의 얇은 두께와 자석 부착 방식은 스마트폰이나 기타 표면에 쉽게 부착할 수 있을 만큼 휴대성을 높여줍니다.

이 기기는 초기 물량이 매진되며 AI 통합 하드웨어에 대한 강한 소비자 수요를 알렸습니다. 이번 출시로 인해 이미 Mobvoi의 TicNote 녹음기와 같은 중국 경쟁업체뿐만 아니라 Plaud를 넘어선 국제 업체들까지 포함된 시장의 경쟁이 더욱 치열해지고 있습니다.

업계 분석가들은 알리바바의 하드웨어 진출의 전략적 중요성에 주목합니다. Runto의 Liu Chuang은 예상되는 시장 성장과 함께 “복수의 플레이어가 공존하며 빠른 제품 사이클, 기능 경쟁, 그리고 AI 하드웨어 생태계의 혁신을 이끌 것으로 예상된다”고 밝혔습니다.

딩톡 A1의 출시는 알리바바가 경영진이 역사적 성장 기회로 규정한 더 큰 AI 전략을 뒷받침하고 있습니다. 1분기 실적이 기대에 미치지 못했음에도 불구하고, 분석가들은 생성형 AI와 클라우드 인프라에서의 경쟁 우위 등 내재된 강점을 꼽았습니다. AI 하드웨어 진출은 독자적인 AI 칩과 오픈소스 프로젝트에 3년간 530억 달러를 투자한다는 알리바바의 계획과 부합하며, 이는 미국 공급 업체에 대한 의존도를 줄이고 지역 AI 생태계를 육성하는 데 목적이 있습니다.

댓글 0
전체 164 / 14 페이지
구글이 사진 앱에 수정사항을 텍스트로 바로 수정요청하는 기능을 적용.이 기능은 곧 런칭할 픽셀10에서부터 적용이 될 예정.또한 사진이 어떻게 편집되었는지 C2PA 인증 기술로 추적이 가능하다고.아래는 구글 블로그의 소개 내용.Google Photos에서는 이제 사진을 편집할 때 원하는 내용을 텍스트나 음성으로 직접 요청할 수 있습니다. 사용자는 어떤 편집 효과를 적용할지 직접 고르지 않아도 되고, 그저 "차를 배경에서 제거해줘"처럼 자연스럽게 말을 하면 AI가 알아서 반영해 줍니다. 이 기능은 미국의 Pixel 10 기기에서 우선 제공됩니다.새롭게 디자인된 사진 편집기는 직관적 UI와 AI 기반 제안으로 일반 사용자도 쉽게 다양한 효과를 활용할 수 있습니다. 이번에 도입된 대화형 편집 기능으로, 구체적인 요청뿐 아니라 "사진 복원해줘", "색감 보정해줘" 등 복합적인 요구도 한 번에 처리할 수 있습니다. 여러 번 연속해서 추가 요청을 하며 세부 조정도 가능합니다.밝기 조절, 배경 제거 같은 기본 편집뿐 아니라 배경 교체, 파티 모자 추가 등 창의적인 효과 요청도 대화로 손쉽게 처리할 수 있습니다. 사용자가 별도의 편집툴을 배우지 않아도 다양한 AI 편집을 자유롭게 즐길 수 있게 되었습니다.Pixel 10 기기에서는 C2PA(디지털 콘텐츠 인증) 기술이 적용되어, AI가 사진 수정에 개입한 흔적·정보를 확인할 수 있습니다. Google Photos에도 점진적으로 이 기능이 적용되며, 사진이 어떻게 만들어지고 어디에 AI 편집이 사용됐는지 투명하게 확인할 수 있습니다.
135 조회
0 추천
2025.08.22 등록
AI의 진화: 수동적 도구에서 자율적 에이전트로2023년까지 AI는 주로 문서 작성, 정보 조사 등의 보조 업무에 활용되는 수동적 도구였습니다. 하지만 2025년 현재 AI 에이전트는 기억하고 계획하며 독립적으로 행동할 수 있는 자율적 시스템으로 발전했습니다.실제 기업 도입 사례서비스나우(ServiceNow): IT 요청 처리를 완전 자동화하여 직원이 소프트웨어 설치나 라이선스 갱신을 요청하면 에이전트가 전 과정을 처리깃허브 코파일럿(GitHub Copilot): 개발자의 의도를 이해하고 반복적인 코딩 작업을 자동 수행하는 에이전트 모드 도입시스코 웹엑스(Webex): 고객 상담, 실시간 통화 지원, 대화 요약 및 감정 분석까지 여러 AI 에이전트가 협업하여 고객 지원 업무 처리성공 요인과 한계AI 에이전트는 명확하고 표준화된 절차를 따르는 작업에서 뛰어난 성과를 보입니다. 최근에는 복잡한 비즈니스 분석까지 수행할 수 있도록 발전하고 있지만, 여전히 작업 완료 시점을 정확히 판단하지 못하는 문제가 있습니다.도입 시 고려사항업무 프로세스 재설계: 기존 업무 방식에 AI를 단순히 추가하는 것이 아닌, 에이전트 중심의 업무 프로세스로 근본적 재설계 필요신뢰성 확보: 안전 규칙, 테스트 시스템, 명확한 기록 체계 구축이 필수새로운 역할 창출: 에이전트 관리, 모니터링, 컴플라이언스 점검을 담당하는 새로운 직무 등장 예상향후 전망앞으로 2년 내에 AI 에이전트는 고객 지원과 소프트웨어 개발 영역에서 일상적인 도구가 될 것으로 예상됩니다. 클라우드 플랫폼들도 에이전트 개발부터 운영까지 통합 솔루션을 제공할 가능성이 높습니다.
132 조회
0 추천
2025.08.21 등록
애플의 인공지능 기능에 대해 부정적인 뉴스가 나오면서 시리의 활용에 대해 조사한 결과가 나오고 있다.https://9to5mac.com/2025/08/20/seven-years-later-people-still-havent-changed-how-they-use-siri/YouGov 설문조사에 따르면, 사용자의 대다수는 2018년 이후로도 Siri와 다른 음성 비서를 여전히 다섯 가지 기본 용도로 사용하고 있다. 가장 많이 사용하는 기능은 날씨 확인(59%), 음악 재생(51%), 웹 검색(47%), 타이머/알람 설정(40%), 핸즈프리 전화 걸기(39%)이다사용자들은 Siri가 기본적인 명령만 이해하도록 적응했으며, 새로운 AI 음성 모드가 나오더라도 기존 사용자들이 이를 익히는 데는 시간이 걸릴 것으로 보고 있다. 또한 새로운 Siri가 나와도 2027년쯤에는 사용자 경험이 크게 개선되길 기대하고 있다.원래부터 거의 모든 사용자가 지금 하는 행동을 7년 전에도 할 수 있었을 정도로 Siri 사용은 정체되어 있다.일부 사용자들은 음성 비서가 기대만큼 똑똑하지 않고, 정확한 답변을 제공하지 못해 답답함을 느끼고 있다.전반적으로 사용자들은 Siri의 기본 기능에는 만족하지만, 더 복잡한 작업을 수행하거나 자연스러운 대화를 기대하는 데는 한계가 있으며 이는 앞으로 개선이 필요한 점으로 남아 있다
147 조회
0 추천
2025.08.21 등록
20일 구글은 Made by google 행사를 열었다. 이 자리에서 주로 Pixel 폰과 관련된 내용이 발표되었지만,인공지능 Gemini 의 픽셀 연결 버전 "제미나이 라이브" 와 관련된 업데이트가 있었다..https://blog.google/products/gemini/gemini-live-updates-august-2025/주요 동영상은 위 주소에서 확인이 가능하다.이번 업데이트로 Gemini Live는 더욱 시각적으로 인지력이 높아졌고, 화면에서 실시간으로 사용자에게 시각적 가이드(예: 화면에 중요한 부분 하이라이트)를 제공한다.예를 들어 신발 두 켤레 중 어느 것이 더 잘 어울리는지, 또는 적절한 공구가 무엇인지 Gemini가 화면을 보며 직접 알려줄 수 있다 이 시각적 가이드 기능은 8월 28일 출시되는 Pixel 10 시리즈에 먼저 적용되며, 이후 안드로이드 및 iOS 기기로 확장될 예정이다.Gemini Live는 구글 캘린더, 킵, 테스크 등 기존 앱뿐 아니라 곧 메시지, 전화, 시계, 지도 앱과도 더 깊게 통합되어 스케줄 관리, 메시지 전송 등의 실생활 업무를 돕는다.예를 들어 생일 선물을 찾다가 바로 가족에게 전화를 걸거나, 지하철 경로를 찾으면서 메시지를 바로 보내는 등 대화하면서 여러 앱을 넘나드는 지원이 가능해진다.음성 대화 품질도 크게 개선되어 어조, 리듬, 음높이 등을 자연스럽게 사용해 스트레스 상황에도 차분한 반응을 하는 등 보다 인간다운 대화가 가능해진다.사용자 요청에 따라 말하는 속도를 조절하거나, 재미있는 악센트로 이야기해주는 기능과, 인물 시점의 생생한 스토리텔링 기능도 곧 선보인다.이번 업데이트는 Gemini를 더 자연스럽고 도움이 되는 AI 비서로 만들기 위한 구글의 지속적인 노력의 일환이며, 앞으로도 사용자와 함께 발전시켜 나가겠다는 계획이다.
146 조회
0 추천
2025.08.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입