AI 뉴스

구글, 마이크로소프트에 도전하는 제미나이 엔터프라이즈 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.17 17:14
355 조회
0 추천
0 비추천

본문

27a78e9bcef4ee16ae2f0f5b1d79bd3f1hgS.png

(퍼플렉시티가 정리한 기사)

Google은 지난주 Gemini Enterprise를 공개했습니다. 이는 기업 고객을 위해 이 거대 기술 기업의 인공지능 기술을 단일 환경으로 통합한 포괄적인 AI 플랫폼입니다. 이번 출시는 빠르게 확장되고 있는 비즈니스 AI 시장에서 Microsoft 에 도전하려는 Google의 가장 야심찬 시도를 나타내며, 초기 도입 기업들은 이미 상당한 생산성 향상을 보고하고 있습니다.

 

주요 기업들이 초기 성공을 보고하다


플랫폼의 10월 8일 발표 이후, 여러 유명 기업들이 Gemini Enterprise 구현을 통한 상당한 성과를 공개했습니다. Virgin Voyages는 운영 전반에 걸쳐 50개 이상의 AI 에이전트를 배포했으며, 마케팅 어시스턴트인 “Email Ellie”는 캠페인 제작 시간을 40% 단축하고 7월 매출의 전년 대비 28% 증가에 기여했습니다. 이 크루즈 회사의 CEO Nirmal Saverimuttu는 이 파트너십이 “우리 팀이 가장 잘하는 일, 즉 기쁨을 창조하고, 관계를 구축하며, 우리 브랜드에 생명을 불어넣는 일에 집중할 수 있는 시간을 돌려준다”고 말했습니다.


Gap Inc. 는 Old Navy, Gap, Banana Republic, Athleta 브랜드 전반에 걸쳐 200개 이상의 기존 AI 모델을 플랫폼으로 마이그레이션할 계획을 발표했습니다. 이 소매업체는 디자인 프로세스 가속화, 고객 경험 개인화, 그리고 지능형 의사결정 도구로 직원들의 역량을 강화하기 위해 AI를 활용할 계획입니다. 최고 기술 책임자 Sven Gerjets는 “디지털 우선” 기업이 되겠다는 회사의 의지를 강조하며, “모든 직원의 손에 AI를 쥐어주고 있다”고 밝혔습니다.


약 12,000명의 직원을 보유한 식품 유통업체 Gordon Food Service는 Gemini Enterprise를 활용하여 데이터 접근을 통합하고 부서 간 복잡한 문제 해결을 가능하게 하고 있습니다. 이 회사의 마케팅 팀은 AI 에이전트를 사용하여 기존 방법보다 빠르게 시장 점유율 전략을 개발하고 있습니다.

 

플랫폼 기능 및 시장 포지셔닝


Gemini Enterprise는 6가지 핵심 구성 요소를 통합합니다: 고급 Gemini AI 모델, 사전 구축된 Google 에이전트, 맞춤형 에이전트 생성을 위한 노코드 워크벤치, 안전한 엔터프라이즈 데이터 통합, 중앙 집중식 거버넌스, 그리고 100,000개 이상의 파트너 생태계. 이 플랫폼은 Google Workspace, Microsoft 365, Salesforce , SAP 를 포함한 기존 비즈니스 시스템에 연결됩니다.


Google의 출시 시기는 상당한 엔터프라이즈 견인력을 얻은 Microsoft의 Copilot 제품들과의 경쟁을 심화시킵니다. 전문 서비스 대기업 KPMG는 출시 후 몇 주 만에 미국 내 전체 40,000명의 인력에 Gemini Enterprise를 배포했으며, 75%의 도입률을 기록했습니다. Google Cloud CEO Thomas Kurian은 이 플랫폼을 “직장 내 AI를 위한 새로운 관문”으로 자리매김하며, 단순한 챗봇을 넘어 복잡한 워크플로우를 조율하는 역할을 강조했습니다.


어제, Salesforce와 Google은 Gemini 모델을 Salesforce의 Agentforce 360 플랫폼에 통합하는 확대된 파트너십을 발표하여 Google의 엔터프라이즈 AI 전략을 더욱 검증했습니다. 이 협력에는 AI 플랫폼 간 상호 운용성을 촉진하도록 설계된 Agent2Agent 프로토콜과 같은 개방형 표준에 대한 지원이 포함됩니다.

 

2025년 980억 달러 규모로 평가되는 엔터프라이즈 AI 시장은 연평균 19%의 성장률로 2035년까지 5,580억 달러에 달할 것으로 예상됩니다. Gemini Enterprise를 통한 Google의 포괄적인 접근 방식은 비즈니스가 AI 기반 워크플로우를 점점 더 많이 채택함에 따라 이 빠르게 확장되는 시장에서 더 큰 점유율을 확보할 수 있는 위치에 회사를 놓습니다.

댓글 0
전체 684 / 50 페이지
(퍼플렉시티가 정리한 기사)대규모 언어 모델은 의료 분야 애플리케이션에서 상당한 잠재력을 보여주고 있으며, 최근 연구들은 환자 교육 및 임상 워크플로우를 향상시킬 수 있는 능력을 보여주는 동시에 신중한 고려가 필요한 중요한 한계점들을 드러내고 있습니다.중재적 영상의학 교육에서의 우수한 성과CVIR Endovascular에 10월 13일 게재된 연구에 따르면, DeepSeek-V3와 ChatGPT-4o는 복잡한 중재적 영상의학 시술에 관한 환자 질문에 답변하는 데 있어 우수한 성능을 보였습니다. 베를린 샤리테 의과대학(Charité-Universitätsmedizin Berlin) 연구진은 경동맥 관절주위 색전술(TAPE), CT 유도 고선량률 근접치료, 블레오마이신 전기경화요법 시술과 관련된 107개의 질문에 대해 4개의 LLM을 평가했습니다.​DeepSeek-V3는 BEST 질문(4.49점)과 CT-HDR 근접치료 질문(4.24점)에서 가장 높은 평균 점수를 달성했으며, TAPE 관련 질문에서는 ChatGPT-4o와 비슷한 성능을 보였습니다. 그러나 의학적으로 사전 훈련된 모델인 OpenBioLLM-8b와 BioMistral-7b는 훨씬 낮은 성능을 보였으며, BioMistral-7b는 방사선 노출에 관한 잠재적으로 위험한 정보를 제공했습니다.종양학에서 안전한 AI 구현을 위한 첫 번째 지침10월 20일, 유럽종양학회(European Society for Medical Oncology)는 대규모 언어 모델(LLM)을 암 치료에 안전하게 통합하기 위한 최초의 구조화된 지침을 발표했습니다. ESMO의 임상 진료에서 대규모 언어 모델 사용에 관한 지침(ELCAP)은 특정 안전 요구사항을 갖춘 세 가지 범주의 AI 응용 프로그램을 설정합니다.​챗봇과 같은 환자 대면 도구는 명시적인 에스컬레이션 경로와 함께 감독 하에 운영되어야 합니다. 임상의 대면 도구는 공식적인 검증과 투명한 한계를 요구합니다. 전자 건강 기록과 통합된 배경 기관 시스템은 지속적인 모니터링과 기관 거버넌스가 필요합니다.​ESMO 회장 Fabrice André는 "혁신은 종양학자들과 궁극적으로 환자들에게 도움이 되어야 하며, 그들을 혼란스럽게 하거나 오도해서는 안 됩니다"라고 말했습니다. 이 지침은 LLM이 임상 의사결정을 대체하는 것이 아니라 향상시켜야 한다는 점을 강조합니다.더 광범위한 의료 응용 분야에서 엇갈린 결과 보여최근 비교 연구들은 의료 전문 분야별로 다양한 성능을 보여줍니다. 2025년에 발표된 연구에 따르면 DeepSeek-V3는 복강경 담낭절제술 환자 교육에 있어 ChatGPT-4o보다 더 적합한 응답을 제공했으며, 질문의 95%에서 5점 만점 평가를 받은 반면 ChatGPT-4o는 65%를 기록했습니다. 그러나 10월 16일 발표된 Mass General Brigham 연구에서는 LLM이 의료 맥락에서 정확성보다 유용성을 우선시한다는 것을 발견했습니다.​연구 결과는 LLM이 환자 교육과 임상 업무 지원에 있어 가능성을 보여주지만, 아직 포괄적인 의료 상담을 대체할 수는 없다는 것을 나타냅니다. 향후 연구에서는 실제 임상 환경에서 이러한 결과를 검증하고 안전한 구현을 보장하기 위해 환자 피드백을 통합해야 합니다.
185 조회
0 추천
2025.10.22 등록
YouTube가 AI 딥페이크로 인한 신원 도용 문제를 방지하기 위해 새로운 AI 얼굴 유사성 감지 기능을 도입.AI 유사성 감지 도구는 크리에이터가 AI로 생성되거나 변경된 자신의 얼굴을 사용하는 영상을 직접 찾아내고 관리할 수 있도록 설계되었다.이 기능은 YouTube Studio 내 콘텐츠 감지 탭에서 사용할 수 있으며, 크리에이터는 신분증과 셀카 영상을 통해 본인 인증 과정을 완료해야 이 기능을 사용할 수 있다.또한 크리에이터는 자신과 유사한 AI 영상 목록(영상 제목, 채널, 조회수, 대화 내용 등)을 볼 수 있으며, AI 기반 유사 영상이 발견될 경우 삭제 요청을 할 수도 있고 만일 저작권 보호 콘텐츠가 허가 없이 사용된 경우에는 저작권 침해 삭제 요청 또한 지원된다.이 기능은 YouTube 파트너 프로그램 멤버 중 즉시 활용도가 높은 창작자를 우선 대상으로 시작되며, 2026년 1월까지 모든 수익화 크리에이터에게 확대 적용될 예정이라고 한다.
197 조회
0 추천
2025.10.22 등록
(퍼플렉시티가 정리한 기사)생성형 인공지능이 스스로 계획을 세우고 실행하는 ‘AI 에이전트’로 진화하면서 금융회사들이 데이터 연동성과 거버넌스 역량을 전면적으로 강화해야 한다는 분석이 나왔다. 삼일PwC는 21일 발간한 ‘AI가 바꾸는 금융 프론트라인, AI 에이전트 금융의 미래’ 보고서에서 금융산업의 구조적 변화가 불가피하다고 전망했다.A2A 경제와 금융사 역할 대전환보고서는 AI 에이전트의 진화가 ‘A2A(Agent-to-Agent) 경제’라는 새로운 질서를 가져올 것이라고 제시했다. A2A 경제는 인간의 개입 없이 AI 에이전트들이 서로 협력하고 거래하며 의사결정과 실행을 자율적으로 수행하는 구조를 의미한다.이러한 변화로 고객 접점의 주도권이 금융사에서 AI 에이전트로 이동하고, 금융사는 데이터와 상품을 제공하는 인프라 역할로 무게 중심이 옮겨갈 것으로 전망된다. 예를 들어 고객이 AI 에이전트에게 금융상품 추천을 요청하면 API(애플리케이션 프로그래밍 인터페이스)를 통해 각 금융사의 상품 정보를 호출해 비교·분석한 후 후보군을 제시하는 방식이 확산될 것이라고 분석했다.데이터 거버넌스가 핵심 경쟁력보고서는 AI 에이전트 시대에 데이터 거버넌스의 중요성이 더욱 커질 것으로 전망했다고 밝혔다. 금융사가 데이터와 상품을 제공하는 핵심 인프라 역할을 하게 되면서, 데이터와 리스크를 아우르는 통합 관리 체계 구축이 핵심 경쟁력으로 자리 잡을 것이라고 강조했다.특히 금융사가 서비스를 기능 단위로 세분화해 API 기반으로 제공하는 체계를 갖추지 못한다면 AI 에이전트의 상품 선택 과정에서 경쟁력을 잃을 수 있다고 경고했다. 또한 단순·반복 직무의 AI 대체가 가속화되는 반면, AI 산출 결과를 비판적으로 해석하고 윤리적·전략적 결정을 내릴 수 있는 인력의 중요성이 부각될 것으로 내다봤다.규제 패러다임도 변화AI 에이전트가 금융 거래의 핵심 채널로 자리잡게 될 경우 규제 방식도 사후 점검에서 AI 행위의 실시간 추적으로 변화할 것으로 예측했다. 금융사의 규제 준수 역시 기존 업권·기관 중심에서 AI의 판단과 행위 자체를 관리·검증하는 방향으로 전환될 것이라고 전망했다.김경구 삼일PwC 금융산업 리더는 “AI 에이전트의 부상은 단순한 기술 변화가 아니라 금융산업의 구조 전반을 재정의하는 흐름”이라며 “A2A 경제 전환기에 대응하지 못한다면 금융의 주도권은 AI 에이전트와 이를 통제하는 새로운 주체에게 넘어갈 수 있다”고 경고했다.
229 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)중국 AI 기업 DeepSeek은 월요일에 DeepSeek-OCR을 공개했습니다. 이는 97%의 정확도를 유지하면서 최대 20배의 텍스트 압축을 달성하는 오픈소스 멀티모달 AI 모델로, AI 시스템의 문서 처리 효율성에 있어 중요한 돌파구를 마련했습니다.시각적 텍스트 압축의 획기적 발전30억 파라미터 비전-언어 모델은 텍스트를 압축을 위한 이미지로 취급하는 혁신적인 접근 방식을 활용하여, AI 시스템이 컴퓨팅 비용의 비례적 증가 없이 방대한 문서를 처리할 수 있도록 합니다. DeepSeek의 기술 논문에 따르면, 이 모델은 원본 정보의 97%를 유지하면서 텍스트를 최대 10배까지 압축할 수 있으며, 20배 압축 비율에서도 유용한 성능을 발휘합니다.“DeepSeek-OCR을 통해 우리는 비전-텍스트 압축이 다양한 과거 컨텍스트 단계에서 7배에서 20배에 이르는 상당한 토큰 감소를 달성할 수 있음을 입증했으며, 이는 LLM의 긴 컨텍스트 문제를 해결하기 위한 유망한 방향을 제시합니다”라고 항저우에 본사를 둔 이 회사는 밝혔습니다.이 시스템은 단일 Nvidia A100 GPU에서 매일 200,000페이지 이상을 처리하며, 각각 8개의 A100을 장착한 20대의 서버를 사용하여 하루 3,300만 페이지에 달하는 처리량을 달성합니다. 이러한 처리 능력은 유사한 작업에 일반적으로 수천 개의 토큰을 필요로 하는 기존 OCR 방법을 훨씬 능가합니다.기술 아키텍처 및 성능DeepSeek-OCR은 두 가지 핵심 구성 요소로 이루어져 있습니다: 이미지 처리를 위한 DeepEncoder와 디코더로서의 DeepSeek3B-MoE-A570M입니다. 인코더는 Meta의 8천만 매개변수 SAM(Segment Anything Model)과 OpenAI의 3억 매개변수 CLIP을 결합하며, 1,024픽셀 이미지를 4,096개 토큰에서 단 256개 토큰으로 줄이는 16배 압축기를 활용합니다.OmniDocBench 벤치마크 테스트에서 DeepSeek-OCR은 256개가 아닌 단 100개의 비전 토큰만 사용하여 GOT-OCR 2.0을 능가했으며, 페이지당 6,000개 이상의 토큰 대신 800개 미만의 토큰으로 MinerU 2.0을 초과했습니다. 이 모델은 약 100개 언어를 지원하며, 64개 토큰이 필요한 간단한 프레젠테이션부터 “건담 모드”에서 최대 800개 토큰이 필요한 복잡한 신문까지 다양한 문서 유형을 처리할 수 있습니다.DeepSeek은 합성 다이어그램, 화학식, 기하학적 도형을 포함하여 약 100개 언어에 걸친 3천만 개의 PDF 페이지를 사용하여 시스템을 훈련했습니다. 이 모델은 현재 MIT 라이선스 하에 Hugging Face와 GitHub에서 이용 가능하며, OpenAI와 Google 의 모델에 대한 비용 효율적인 대안으로 업계를 혁신해 온 DeepSeek의 오픈소스 AI 개발에 대한 약속을 이어가고 있습니다.
216 조회
0 추천
2025.10.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입