AI 뉴스

2025년, AI가 스마트홈을 망친 이유

페이지 정보

작성자 symbolika
작성일 2025.12.30 00:05
334 조회
0 추천
0 비추천

본문

AI Smart Home 2025

• 생성형 AI 음성 비서가 기존 음성 비서를 대체했으나, 조명 켜기나 가전제품 작동 같은 기본 명령 수행에서 일관성이 크게 떨어짐

• 아마존 알렉사 플러스와 구글 제미나이 포 홈 모두 '얼리 액세스' 단계로, 사용자들은 사실상 베타 테스터 역할을 하고 있음

• LLM은 무작위성(확률적 특성)이 내재되어 있어, 예측 가능하고 반복적인 작업에 최적화된 기존 시스템과 근본적으로 호환되지 않음

• 전문가들은 AI가 더 신뢰할 수 있게 되려면 수년이 걸릴 수 있으며, 그 사이 스마트홈 경험은 저하될 수 있다고 경고


오늘 아침, 필자는 알렉사 연동 보쉬 커피머신에 커피를 내려달라고 요청했다. 그런데 루틴을 실행하는 대신, 그건 할 수 없다는 대답이 돌아왔다. 아마존의 생성형 AI 기반 음성 비서인 알렉사 플러스로 업그레이드한 이후, 커피 루틴이 제대로 작동한 적이 거의 없다. 매번 다른 핑계를 댄다.


2025년인 지금도 AI는 스마트홈을 안정적으로 제어하지 못한다. 과연 언젠가 가능해질지 의문이 들기 시작한다.


생성형 AI와 대규모 언어 모델(LLM)이 스마트홈의 복잡성을 해소하고, 연결된 기기의 설정, 사용, 관리를 더 쉽게 만들어줄 가능성은 분명 매력적이다. 능동적이고 상황 인식이 가능한 '새로운 지능 레이어'를 구현할 수 있다는 약속도 그렇다.


하지만 올해는 그런 미래가 아직 한참 멀었음을 보여주었다. 제한적이지만 안정적이던 기존 음성 비서들이 '더 똑똑한' 버전으로 교체됐지만, 대화는 더 자연스러워졌을지언정 가전제품 작동이나 조명 켜기 같은 기본 작업은 제대로 수행하지 못한다. 왜 그런지 알고 싶었다.


2023년 데이브 림프와의 인터뷰에서 필자는 처음으로 생성형 AI와 LLM이 스마트홈 경험을 개선할 가능성에 흥미를 느꼈다. 당시 아마존 디바이스 & 서비스 부문 총괄이던 림프는 곧 출시될 새 알렉사의 기능을 설명하고 있었다(스포일러: 출시는 그렇게 빠르지 않았다).


어떤 방식으로 말하든 사용자의 의도를 이해하는 더 자연스러운 대화형 비서와 함께, 특히 인상적이었던 것은 새 알렉사가 스마트홈 내 기기들에 대한 지식과 수백 개의 API를 결합해 맥락을 파악하고, 스마트홈을 더 쉽게 사용할 수 있게 해준다는 약속이었다.


기기 설정부터 제어, 모든 기능 활용, 다른 기기와의 연동 관리까지, 더 똑똑한 스마트홈 비서는 매니아들의 기기 관리를 쉽게 할 뿐 아니라 누구나 스마트홈의 혜택을 누릴 수 있게 해줄 잠재력이 있어 보였다.


3년이 지난 지금, 가장 유용한 스마트홈 AI 업그레이드라고 할 만한 것은 보안 카메라 알림에 대한 AI 기반 설명 기능 정도다. 편리하긴 하지만, 기대했던 혁명적 변화와는 거리가 멀다.


새로운 스마트홈 비서들이 완전히 실패한 것은 아니다. 알렉사 플러스에는 마음에 드는 점이 많고, 올해의 스마트홈 소프트웨어로 선정하기도 했다. 더 대화적이고, 자연어를 이해하며, 기존 알렉사보다 훨씬 다양한 질문에 답할 수 있다.


기본 명령에서 때때로 어려움을 겪지만, 복잡한 명령은 이해한다. "여기 조명 좀 어둡게 하고 온도도 올려줘"라고 하면 조명을 조절하고 온도조절기를 올린다. 일정 관리, 요리 도우미 등 가정 중심 기능도 더 나아졌다. 음성으로 루틴을 설정하는 것은 알렉사 앱과 씨름하는 것보다 훨씬 개선됐다. 다만 실행의 안정성은 떨어진다.


구글도 스마트 스피커용 제미나이 포 홈 업그레이드로 비슷한 기능을 약속했지만, 출시 속도가 너무 느려서 정해진 데모 외에는 직접 써보지 못했다. 네스트 카메라 영상을 AI 생성 텍스트로 요약해주는 제미나이 포 홈 기능을 테스트해봤는데, 정확도가 심각하게 떨어졌다. 애플 시리는 여전히 지난 10년의 음성 비서 수준에 머물러 있으며, 당분간 그 상태가 지속될 것으로 보인다.


문제는 새 비서들이 스마트홈 기기 제어에서 기존 비서만큼 일관성이 없다는 것이다. 기존 알렉사와 구글 어시스턴트(그리고 현재의 시리)는 사용하기 답답할 때도 있었지만, 정확한 명령어만 사용하면 대체로 조명은 항상 켜졌다.


오늘날 '업그레이드된' 비서들은 조명 켜기, 타이머 설정, 날씨 확인, 음악 재생, 그리고 많은 사용자들이 스마트홈의 기반으로 삼아온 루틴과 자동화 실행에서 일관성 문제를 겪고 있다.


필자의 테스트에서도 이런 현상을 확인했고, 온라인 포럼에도 같은 경험을 한 사용자들의 글이 넘쳐난다. 아마존과 구글도 생성형 AI 기반 비서가 기본 작업을 안정적으로 수행하는 데 어려움을 겪고 있음을 인정했다. 스마트홈 비서만의 문제도 아니다. ChatGPT도 시간을 알려주거나 숫자를 세는 것조차 일관성 있게 하지 못한다.


왜 이런 일이 일어나고, 나아질 것인가? 문제를 이해하기 위해 에이전틱 AI와 스마트홈 시스템 경험이 있는 인간 중심 AI 분야 교수 두 명과 대화했다. 핵심은 새 음성 비서가 기존 비서와 거의 같은 일을 하게 만드는 것은 가능하지만 많은 작업이 필요하며, 대부분의 기업은 그런 작업에 관심이 없다는 것이다.


전문가들에 따르면, 이 분야의 자원은 한정되어 있고 조명을 안정적으로 켜는 것보다 훨씬 더 흥미롭고 수익성 있는 기회가 많기 때문에, 기업들은 그쪽으로 움직이고 있다. 이런 상황에서 기술을 개선하는 가장 쉬운 방법은 실제 환경에 배포하고 시간이 지나면서 개선되도록 하는 것이다. 알렉사 플러스와 제미나이 포 홈이 '얼리 액세스' 단계인 이유가 바로 이것이다. 기본적으로 우리 모두가 AI의 베타 테스터인 셈이다.


안타깝게도 상황이 나아지려면 시간이 꽤 걸릴 수 있다. 미시간대학교 컴퓨터공학과 조교수이자 사운더빌리티 랩 소장인 드루브 자인도 연구에서 새로운 스마트홈 비서 모델이 덜 안정적임을 발견했다. "대화는 더 자연스럽고 사람들이 좋아하지만, 이전 버전만큼 성능이 좋지 않습니다"라고 그는 말한다. "테크 기업들은 항상 빠르게 출시하고 데이터를 수집해서 개선하는 모델을 써왔습니다. 몇 년 후에는 더 나은 모델을 얻겠지만, 그 몇 년간 사람들이 씨름하는 비용이 따릅니다."


근본적인 문제는 기존 기술과 새 기술이 잘 맞지 않는다는 것이다. 새 음성 비서를 만들기 위해 아마존, 구글, 애플은 기존 것을 버리고 완전히 새로운 것을 구축해야 했다. 그런데 이 새로운 LLM들이 이전 시스템이 잘하던 예측 가능하고 반복적인 작업에 적합하게 설계되지 않았다는 것을 금세 깨달았다. 조지아공대 인터랙티브 컴퓨팅 스쿨 교수 마크 리들은 "모두가 생각했던 것만큼 간단한 업그레이드가 아니었습니다. LLM은 훨씬 더 많은 것을 이해하고 더 다양한 방식의 소통에 열려 있는데, 그것이 해석의 여지와 해석 오류를 만들어냅니다"라고 설명한다.


기본적으로 LLM은 기존의 명령-제어 방식 음성 비서가 하던 일을 하도록 설계되지 않았다. 리들 교수는 "기존 음성 비서는 '템플릿 매처'라고 부릅니다. 키워드를 찾고, 그것을 보면 추가로 한두 단어가 올 것을 예상합니다"라고 설명한다. 예를 들어 "라디오 재생"이라고 하면 다음에 채널 번호가 올 것을 안다.


반면 LLM은 "많은 확률성, 즉 무작위성을 도입합니다"라고 리들은 설명한다. ChatGPT에 같은 프롬프트를 여러 번 물으면 다른 답변이 나올 수 있다. 이것이 LLM의 가치이기도 하지만, LLM 기반 음성 비서에 어제와 같은 요청을 해도 같은 방식으로 응답하지 않을 수 있는 이유이기도 하다. "이 무작위성이 기본 명령을 오해하게 만들 수 있습니다. 때때로 너무 과하게 생각하려 하기 때문입니다."


이를 해결하기 위해 아마존과 구글 같은 기업들은 LLM을 스마트홈(그리고 웹에서 하는 거의 모든 것)의 핵심인 API와 통합하는 방법을 개발했다. 하지만 이것이 새로운 문제를 만들었을 수 있다.


리들 교수는 "이제 LLM은 API에 함수 호출을 구성해야 하고, 구문을 정확하게 만들기 위해 훨씬 더 열심히 작업해야 합니다"라고 말한다. 기존 시스템이 키워드만 기다렸던 것과 달리, LLM 기반 비서는 API가 인식할 수 있는 전체 코드 시퀀스를 작성해야 한다. "이 모든 것을 메모리에 유지해야 하고, 여기서 또 실수할 수 있습니다."


이 모든 것이 필자의 커피머신이 때때로 커피를 내려주지 않는 이유, 또는 알렉사나 구글 어시스턴트가 예전에는 잘하던 일을 하지 못하는 이유를 과학적으로 설명해준다.


그렇다면 왜 이 기업들은 작동하던 기술을 버리고 작동하지 않는 것을 택했을까? 잠재력 때문이다. 특정 입력에만 반응하는 것이 아니라 자연어를 이해하고 그에 따라 행동할 수 있는 음성 비서는 무한히 더 유능하다.


리들 교수는 "알렉사와 시리 등을 만드는 모든 기업이 정말로 원하는 것은 서비스의 연결입니다. 이를 위해서는 복잡한 관계와 과제가 말로 어떻게 전달되는지 이해할 수 있는 일반적인 언어 이해가 필요합니다. 모든 것을 연결하는 if-else 문을 즉석에서 만들고 순서를 동적으로 생성할 수 있습니다"라고 설명한다. 에이전틱해질 수 있다는 것이다.


리들 교수는 기존 기술을 버리는 이유가 바로 이것이라고 말한다. 기존 기술로는 이것이 불가능했기 때문이다. 자인 교수는 "비용-편익 비율의 문제입니다. 새 기술은 기존의 비확률적 기술만큼 정확하지 않을 것입니다. 하지만 충분히 높은 정확도에 새 기술이 제공하는 확장된 가능성의 범위가 100% 정확한 비확률적 모델보다 가치가 있는지가 문제입니다"라고 말한다.


한 가지 해결책은 여러 모델을 사용해 비서를 구동하는 것이다. 구글의 제미나이 포 홈은 제미나이와 제미나이 라이브라는 두 개의 별도 시스템으로 구성된다. 구글 홈 앤 네스트 제품 책임자 아니시 카투카란은 궁극적으로 더 강력한 제미나이 라이브가 모든 것을 운영하게 하는 것이 목표지만, 현재는 더 제한된 제미나이 포 홈이 담당하고 있다고 말한다. 아마존도 마찬가지로 여러 모델을 사용해 다양한 기능의 균형을 맞춘다. 하지만 이는 불완전한 해결책이고, 스마트홈에 일관성 없음과 혼란을 초래했다.


리들 교수는 LLM이 언제 매우 정확해야 하고 언제 무작위성을 수용해야 하는지 이해하도록 훈련하는 방법을 아무도 제대로 알아내지 못했다고 말한다. '길들여진' LLM도 여전히 실수할 수 있다는 의미다. "전혀 무작위적이지 않은 기계를 원한다면, 모든 것을 억제할 수 있습니다"라고 리들은 말한다. 하지만 그 챗봇은 더 대화적이거나 아이에게 환상적인 취침 이야기를 들려주지 못할 것이다. 둘 다 알렉사와 구글이 내세우는 기능이다. "모든 것을 하나에 담으려면 정말로 트레이드오프가 필요합니다."


스마트홈 배포에서의 이런 어려움은 이 기술의 더 광범위한 문제를 예고하는 것일 수 있다. AI가 조명조차 안정적으로 켜지 못한다면, 더 복잡한 작업에 어떻게 의존할 수 있겠느냐고 리들 교수는 묻는다. "걷기도 전에 뛰려고 해선 안 됩니다."


하지만 테크 기업들은 빠르게 움직이고 뭔가를 망가뜨리는 성향으로 유명하다. "언어 모델의 역사는 항상 LLM을 길들이는 것이었습니다"라고 리들은 말한다. "시간이 지나면서 더 온순해지고, 더 신뢰할 수 있고, 더 믿을 만해집니다. 하지만 우리는 계속해서 그렇지 않은 영역의 경계로 밀어붙입니다."


리들 교수는 순수하게 에이전틱한 비서로 가는 길을 믿는다. "AGI에 도달할지는 모르겠지만, 시간이 지나면서 이것들이 최소한 더 신뢰할 수 있게 되는 것은 볼 수 있을 것입니다." 하지만 오늘날 집에서 이 불안정한 AI를 다루고 있는 우리에게 남은 질문은, 우리가 기다릴 의향이 있는지, 그리고 그 사이 스마트홈은 어떤 대가를 치르게 될 것인지다.

댓글 0
전체 1,366 / 32 페이지
노코드 인공지능 플랫폼 시장은 MarketsandMarkets™가 12월 12일 발표한 시장 분석에 따르면 2024년 49억 달러에서 2029년 247억 달러로 급증하며 폭발적인 성장세를 보일 것으로 전망됩니다. 이 예측은 연평균 성장률 38.2%를 나타내며, 혁신의 기술적 장벽을 제거하는 접근 가능한 AI 솔루션에 대한 수요 증가가 성장을 견인하고 있습니다.​이러한 플랫폼은 컴퓨터 비전, 자연어 처리, 딥러닝, 예측 분석을 포함한 첨단 기술을 민주화하고 있으며, 프로그래밍 전문 지식이 없는 사용자도 직관적인 드래그 앤 드롭 인터페이스와 시각적 워크플로를 통해 AI 애플리케이션을 구축할 수 있도록 지원합니다. 이러한 접근성은 의료, 금융, 소매, 제조업 등 다양한 분야의 기업들이 AI 기반 솔루션을 구현하는 방식을 변화시키고 있습니다.시민 개발자 역량 강화노코드 AI 플랫폼은 비기술 전문가인 "시민 개발자"가 이제 독립적으로 정교한 애플리케이션을 만들 수 있도록 지원함으로써 개발 환경을 재편하고 있습니다. Forrester는 2025년까지 시민 개발자가 생성형 AI 기반 자동화 애플리케이션의 30%를 제공할 것으로 예측합니다. 이 기술은 텍스트, 이미지, 비디오, 오디오 및 멀티모달 입력을 포함한 여러 데이터 모달리티를 처리하여 감정 분석 및 이미지 인식과 같은 복잡한 작업을 단순화합니다.​주요 기술 기업들이 이 분야에서 적극적으로 경쟁하고 있습니다. IBM, Microsoft, Google, Amazon Web Services, 그리고 Salesforce가 C3 AI, H2O.ai, DataRobot, Dataiku, Qlik을 포함한 전문 벤더들과 함께 시장을 주도하고 있습니다. 2025년 1월, IBM은 노코드 플랫폼에 통합된 향상된 AI 기능을 발표했으며, Microsoft는 개선된 AI 통합으로 Power Platform을 확장했습니다.애플리케이션이 도입을 이끈다챗봇과 가상 비서는 AI를 활용하여 고객 상호작용을 혁신하면서 2024년에 가장 큰 시장 점유율을 차지할 것으로 예상됩니다. 다른 주요 응용 분야로는 워크플로우 자동화, 예측 리드 스코어링, 시각 인식 등이 있습니다. 은행, 금융 서비스 및 보험 부문은 특히 빠른 성장을 경험하고 있으며, 기관들은 광범위한 IT 개입 없이 대출 처리, 사기 탐지 및 위험 평가를 위해 노코드 AI를 사용하고 있습니다.​신흥 플랫폼들은 시장의 진화를 보여줍니다. KuaFuAI의 CodeFlying은 50만 명 이상의 크리에이터와 자연어 프롬프트로부터 관리 백엔드를 포함한 풀스택 애플리케이션을 자동으로 생성하는 모바일 우선 AI 앱 빌더를 통해 생성된 100만 개의 앱을 보고하고 있습니다. 이 플랫폼은 160억 줄의 AI 코드를 생성했습니다.​​시장 조사 기업 Grand View Research는 노코드 AI 플랫폼 시장이 2024년에 42억 8천만 달러에 달했으며 연평균 성장률(CAGR) 30.2%로 2033년까지 441억 5천만 달러로 성장할 것으로 예측하고 있습니다. 한편 다른 분석가들은 시장의 역동적인 특성을 반영하여 다양한 궤적을 예측하고 있습니다.
395 조회
0 추천
2025.12.13 등록
전설적인 게임 디렉터 히데오 코지마는 게임 개발에서 인공지능에 대한 자신의 입장을 명확히 했으며, 시각적 콘텐츠 생성보다는 적응형 제어 시스템에 AI를 사용하는 것에 관심이 있다고 밝혔다. 목요일 CNN과의 인터뷰에서 메탈 기어 솔리드와 데스 스트랜딩의 크리에이터는 자동화된 콘텐츠 생성보다는 지능형 시스템을 통해 더 역동적인 게임플레이 경험을 만드는 데 중점을 두고 있다고 강조했다.​"AI가 시각 자료를 생성하도록 하는 것보다, 저는 제어 시스템 내에서 AI를 사용하는 것에 더 흥미를 느낍니다"라고 코지마는 CNN에 말했다. 그는 100명의 플레이어가 게임에 참여하면, 각자가 캐릭터를 조작하고 환경을 탐색하는 방식에서 고유한 습관과 성향을 보인다고 설명했다. "AI를 활용하여 이러한 차이를 조정함으로써 게임플레이가 더 깊이 있는 수준에 도달할 수 있습니다"라고 그는 말했다.​더 똑똑한 적, 더 깊이 있는 게임플레이코지마의 비전은 AI를 사용하여 논플레이어 캐릭터의 행동을 더 현실적이고 반응적으로 만드는 것에 중점을 두고 있습니다. "대부분의 게임에서 적들은 실제 인간처럼 행동하지 않습니다"라고 그는 언급했습니다. "하지만 AI를 통해 적의 행동은 플레이어의 경험, 행동, 패턴에 따라 적응할 수 있습니다. 이러한 역동적인 반응성은 훨씬 더 풍부한 게임플레이를 가능하게 할 수 있습니다."​이러한 발언은 AI 도입을 둘러싼 게임 업계의 지속적인 긴장 속에서 나왔습니다. 비디오 게임 배우들은 자신들의 목소리와 초상권에 대한 무단 AI 복제에 대한 보호 조치를 확보한 후 2025년 7월 11개월간의 파업을 마무리했습니다. SAG-AFTRA 회원의 95%가 비준한 이 합의는 AI 디지털 복제본에 대한 동의 및 공개 요구 사항을 확립했습니다.기술에 대한 일관된 입장고지마의 입장은 이전 발언들과 일관된 상태로 남아 있다. 2025년 10월, 그는 AI를 효율성을 높이고 개발 비용과 시간을 줄이기 위해 “지루한 작업”을 처리해 줄 수 있는 “친구”라고 표현하면서도, 자신은 계속해서 제작의 “창의적인 부분을 주도할 것”이라고 강조했다. 그는 AI를 “그냥 사용하는 것이 아니라 함께 만들어 간다”는 점을 강조했다.​게임 개발에서 AI의 역할을 둘러싼 논쟁은 2025년 내내 격화되어 왔다. 에픽게임즈 CEO 팀 스위니는 11월, AI가 “앞으로 거의 모든 제작 과정에 관여하게 될 것”이라면서, 디지털 스토어에서의 AI 사용 공개 라벨이 과연 의미가 있는지에 대해 의문을 제기했다. 한편, 12월에는 커뮤니티의 반발 끝에 《Postal: Bullet Paradise》가 취소되는 등, 미공개 AI 사용 의혹을 둘러싼 굵직한 논란들이 잇따라 터져 나왔다.​​고지마의 접근 방식은 인간의 창의성이 AI에 의해 대체될 것이라는 우려와 대비된다. 2001년에 발매된 그의 작품 《메탈 기어 솔리드 2》는 AI의 통제, 정보 조작, 알고리즘적 영향력이라는 주제를 선견지명 있게 다뤘는데, 이는 현대 사회에서 기술이 미치는 영향에 대한 논의에서 점점 더 중요한 화두가 되고 있다.​​고지마의 최신작인 《데스 스트랜딩 2: 온 더 비치》는 2025년 6월 플레이스테이션 5 독점으로 발매되었다.
392 조회
0 추천
2025.12.13 등록
Google [ -1.03%]은 Vertex AI에서 Gemini 2.5 Flash Native Audio 모델을 기반으로 하는 Gemini Live API를 출시하여, 기업들이 별도의 텍스트 음성 변환 없이 오디오를 네이티브로 처리하는 실시간 음성 및 비디오 에이전트를 구축할 수 있도록 했습니다[cloud.google +1].업데이트된 모델은 ComplexFuncBench Audio 벤치마크에서 함수 호출 정확도를 71.5%로, 명령 준수율을 84%에서 90%로 향상시켰으며, 자연스러운 대화 전환, 감정 감지, 시각 데이터 분석과 같은 기능을 포함합니다[cloud.google +1].United Wholesale Mortgage의 AI 어시스턴트는 2025년 5월 이후 14,000건 이상의 대출을 생성했으며, Shopify [ -0.37%]는 사용자들이 “1분 안에 AI와 대화하고 있다는 사실을 종종 잊는다”고 회사의 제품 담당 부사장이 밝힌 멀티모달 어시스턴트 Sidekick을 개발했습니다[cloud.google +1].
416 조회
0 추천
2025.12.13 등록
OpenAI는 목요일 ChatGPT가 2026년 1분기에 “성인 모드”를 출시할 것이라고 발표했으며, 이를 통해 18세 이상의 인증된 사용자들이 성인용 콘텐츠를 포함한 덜 제한적인 콘텐츠에 접근할 수 있게 될 것이라고 애플리케이션 CEO Fidji Simo가 GPT-5.2 브리핑에서 밝혔다.회사는 특정 국가에서 행동 패턴을 사용하여 미성년자를 식별하고 콘텐츠 제한을 적용하는 연령 예측 시스템을 테스트하고 있으며, 18세 이상 사용자는 정부 발급 신분증과 공급업체 Persona를 통한 안면 인식으로 연령을 인증할 수 있다.이 기능은 정신 건강 우려로 인해 더 엄격한 제한을 적용한 후 OpenAI가 “성인 사용자를 성인처럼 대우하겠다”는 CEO Sam Altman의 10월 발언에 따른 것으로, 이미 노골적인 콘텐츠를 제공하는 xAI의 Grok 챗봇과 같은 경쟁사들과 경쟁할 수 있는 위치에 회사를 올려놓았다.
410 조회
0 추천
2025.12.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입