Loading...

AI 뉴스

구글, 맞춤형 인터페이스를 즉시 생성하는 AI 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.19 17:32
890 조회
0 추천
0 비추천

본문

IO25_AIDevAllUp_SocialShare.width-1300.png

(퍼플렉시티가 정리한 기사)


Google는 월요일에 Generative UI를 공개했습니다. 이는 AI 모델이 정적인 텍스트 응답을 제공하는 대신 완전히 맞춤화된 인터랙티브 인터페이스를 즉석에서 생성할 수 있게 하는 기술입니다. Gemini 앱과 Google Search의 AI Mode에 출시되는 이 기능은 개별 프롬프트에 맞춤화된 전체 사용자 경험을 생성함으로써 전통적인 챗봇 경험에서 벗어나는 변화를 의미합니다.​

Gemini 3 Pro로 구동되는 이 기술은 모든 질문이나 지시에 대한 응답으로 웹 페이지, 인터랙티브 도구, 게임 및 시뮬레이션을 생성할 수 있습니다. 발표와 함께 게시된 연구 논문 "Generative UI: LLMs are Effective UI Generators"에 따르면, 인간 평가자들은 생성 속도를 고려하지 않았을 때 표준 대규모 언어 모델 출력보다 이러한 AI 생성 인터페이스를 강력하게 선호했습니다.​


동적 인터페이스에 대한 두 가지 접근 방식

Google은 Gemini 앱에서 두 가지 구현 방식을 테스트하고 있습니다. 동적 뷰(Dynamic view)는 Gemini 3의 코딩 기능을 사용하여 각 프롬프트에 맞는 맞춤형 인터페이스를 설계하고 코딩하며, 컨텍스트에 따라 콘텐츠와 기능을 조정합니다. 시각적 레이아웃(Visual layout)은 사용자가 추가로 커스터마이징할 수 있는 인터랙티브 모듈이 포함된 매거진 스타일의 뷰를 생성합니다.​

회사는 연구 블로그에서 "5세 아동에게 미생물군집을 설명하는 것과 성인에게 설명하는 것은 서로 다른 콘텐츠와 다른 기능 세트가 필요하다는 점을 이해하여 경험을 맞춤화합니다"라고 밝혔습니다.​

Google 검색에서 생성형 UI 기능은 미국 내 Google AI Pro 및 Ultra 구독자를 대상으로 AI 모드를 통해 제공됩니다. 사용자는 모델 드롭다운 메뉴에서 "Thinking"을 선택하여 특정 쿼리에 맞춤화된 인터랙티브 도구와 시뮬레이션을 생성할 수 있습니다.​


기술적 기반 및 한계

이 구현은 Gemini 3 Pro를 세 가지 핵심 구성 요소와 결합합니다: 이미지 생성 및 웹 검색을 위한 도구 액세스, 신중하게 작성된 시스템 지침, 그리고 일반적인 오류를 해결하기 위한 후처리. 연구를 촉진하기 위해 Google은 전문가가 설계한 웹사이트 데이터셋인 PAGEN을 만들었으며, 이는 연구 커뮤니티에 공개될 예정입니다.​

그러나 이 기술은 한계에 직면해 있습니다. 현재 구현은 결과를 생성하는 데 1분 이상 걸릴 수 있으며, 출력물에서 때때로 부정확성이 나타납니다. Google Fellow인 Yaniv Leviathan과 연구 논문을 공동 집필한 동료들에 따르면, 이러한 부분은 여전히 진행 중인 연구 영역으로 남아 있습니다.​

이 발표는 Google이 가장 지능적인 모델로 설명한 Gemini 3의 광범위한 출시와 동시에 이루어졌습니다. Gemini 3 Pro는 LMArena 리더보드에서 1,501점을 기록하며 이전 버전을 능가했습니다. 또한 이 모델은 박사 수준 추론을 위한 GPQA Diamond에서 91.9%, 도구 없이 Humanity's Last Exam에서 37.5%를 달성하는 등 벤치마크에서 강력한 성능을 보였습니다.

댓글 0
전체 1,366 / 30 페이지
• OpenAI는 Apple Music이 ChatGPT와 통합되어 사용자가 자연어 프롬프트를 통해 재생목록을 만들고 음악 추천을 받을 수 있게 될 것이라고 간략히 발표했으나, 이후 애플리케이션 CEO Fidji Simo의 게시물에서 해당 내용을 삭제했다.• 이 통합은 10월에 출시된 ChatGPT의 기존 Spotify 기능과 유사하게 작동하여, 사용자가 “Apple Music, 운동용 재생목록 만들어줘”와 같은 프롬프트로 대화를 시작하여 재생목록을 생성할 수 있게 한다.• 수정된 발표는 시기상조의 공개를 시사하며, OpenAI의 확장되는 앱 생태계의 일부로 음악 스트리밍 기능이 언제 출시될지에 대한 공식 일정은 제공되지 않았다.
502 조회
0 추천
2025.12.17 등록
• Google의 Gemini [GOOG -0.51%] AI 어시스턴트는 이번 주에 새로운 자동 화면 컨텍스트 기능의 출시를 시작했으며, 이 기능은 사용자가 관련 질문을 할 때 화면의 콘텐츠를 자동으로 캡처하고 분석하여 “화면에 대해 물어보기” 버튼을 수동으로 탭할 필요를 없애줍니다• 이 기능은 언어 단서를 사용하여 “이 오류는 무엇을 의미하나요?” 또는 “이 글을 요약해 주세요”와 같은 화면 관련 프롬프트를 감지하며, 앱, 이미지 및 동영상 전반에서 작동합니다. 다만 초기 테스트 결과 이러한 쿼리를 약 50%의 정확도로 식별하는 것으로 나타났습니다.• 사용자는 Gemini 설정을 통해 자동 스크린샷 기능을 비활성화할 수 있으며, Android의 FLAG_SECURE 보호 기능은 뱅킹 앱, 스트리밍 서비스 및 비공개 브라우징 모드가 캡처에서 제외되도록 보장합니다.
481 조회
0 추천
2025.12.17 등록
• Google [GOOG -0.51%]은 12월 16일 Opal 워크플로우 빌더를 Gemini 웹 앱에 통합하여, 사용자들이 Super Gems라는 새로운 기능을 통해 코딩 없이 AI 기반 미니 애플리케이션을 만들 수 있도록 했습니다.• 이 통합은 Opal을 Gemini의 Gems Manager에 통합하며, 자연어 설명을 자동 생성된 단계와 인터페이스 요소가 포함된 시각적 워크플로우로 변환하는 Workflow Builder를 제공하고, 이는 공유 가능한 링크를 통해 게시될 수 있습니다.• 현재 출시는 미국 사용자로 제한되어 있으며, 이는 Google이 Gemini를 맞춤형 AI 도구 구축을 위한 중앙 플랫폼으로 포지셔닝하면서 다른 Labs 통합과 동일한 단계적 접근 방식을 따르고 있습니다.
533 조회
0 추천
2025.12.17 등록
• Jeff Li는 Super Data Science 팟캐스트에서 Netflix, Spotify, DoorDash에서 데이터 과학자로 근무한 경험을 바탕으로, 워크플로우에 대한 사전 인간 숙달 없이는 AI 자동화가 실패한다고 주장합니다 (https://www.youtube.com/watch?v=T7zG5-9-zIw).• Li가 AI 이미지 생성을 사용하여 광고 제작을 자동화하려던 시도는 크리에이티브 디자인에 대한 전문 지식이 부족하여 실패했으며, 그의 기술적 역량과 광고 업계 배경에도 불구하고 고객들은 제작된 광고를 “형편없다”고 평가했습니다[big-agile +1].• 여러 산업 분야의 연구는 AI 시스템이 새로운 실패와 예외 상황을 처리하기 위해 인간의 판단과 도메인 전문 지식을 필요로 한다는 것을 확인하며, 운영자가 효과적으로 개입할 수 있는 조직적 지식이 부족할 때 자동화가 불충분하다는 것을 입증합니다[big-agile +1].
491 조회
0 추천
2025.12.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입