Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
945 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 644 / 120 페이지
(퍼플렉시티가 정리한 기사)마스터카드는 수요일, 연말 쇼핑 시즌을 앞두고 "에이전틱 커머스(agentic commerce)"를 가능케 하는 종합적인 인공지능(AI) 기반 결제 도구 제품군을 발표했습니다. 이 기능들은 AI 에이전트가 소비자와 기업을 대신해 거래를 완료할 수 있도록 해줍니다.이 금융 서비스 대기업은 자사의 확장된 에이전트 페이(Agent Pay) 프로그램이 연말까지 미국 내 모든 카드 소지자를 대상으로 제공될 예정이며, 이후 곧 글로벌 확장도 계획하고 있다고 밝혔습니다. 씨티와 U.S.뱅크 고객들이 이 AI 기반 결제 기능을 가장 먼저 이용하게 될 예정이며, 이커머스 플랫폼들도 이 기술 통합을 준비하고 있습니다.새로운 개발자 도구 및 산업 파트너십마스터카드는 AI 기반 거래 채택을 가속화하기 위해 설계된 네 가지 주요 이니셔티브를 중심으로 발표를 진행했습니다. 이 회사는 자사의 개발자 플랫폼에서 에이전트 툴킷을 출시했는데, 이를 통해 AI 어시스턴트가 Model Context Protocol 서버를 통해 마스터카드 API에 원활하게 접근할 수 있게 하여 Claude, Cursor, GitHub Copilot 등 다양한 플랫폼과의 통합을 지원합니다.Agent Sign-Up 기능은 AI 에이전트를 위한 간소화된 등록 절차를 제공하며, Insight Tokens는 SAP Concur 및 Agentic Consulting Services의 지원을 받아 AI 에이전트가 소비자 허가 데이터를 접근할 수 있는 프레임워크를 만듭니다. 이 도구들은 개발자가 AI 결제 기능을 보다 효율적으로 통합할 수 있도록 도와주어, 업계 보도에 따르면 구현 시간을 몇 주에서 몇 시간으로 단축할 수 있습니다.마스터카드는 Stripe, Alphabet의 Google, Ant International의 Antom 등 주요 기술 기업들과 협력하여 에이전트 결제 산업 표준을 확립하고 있습니다. 이 파트너십은 FIDO Alliance와 함께 상인 및 거래 정보를 확인하는 자격 검증 시스템 개발에 주력하고 있으며, AI 에이전트가 결제 기능을 갖게 됨에 따라 제기되는 보안 문제를 해결하는 데 중점을 두고 있습니다.강화된 보안 및 거래 제어회사는 동시에 주문형 의사결정(On-Demand Decisioning)을 도입하여 금융 기관이 맞춤화 가능한 규칙 엔진을 통해 거래 승인에 대한 실시간 제어 권한을 행사할 수 있도록 했습니다. 이 도구는 발급사가 승인 기준을 설정하고, 오탐지 거절을 줄이며, 고가치 고객을 위한 승인 우선순위를 부여할 수 있게 하며, 마스터카드의 RiskX 서밋(로마)에서 처음 공개되었습니다.마스터카드의 최고 제품 책임자인 요른 램버트(Jorn Lambert)는 "에코시스템 전반의 파트너들과 협력하여 에이전틱 커머스를 정의할 표준과 도구를 구축하고 있다"고 밝혔습니다. 이 이니셔티브는 인공지능 기반 에이전트가 최소한의 인간 개입으로도 복잡한 구매 업무를 안전하게 수행할 수 있게 하는 자동화된 디지털 거래 패러다임으로의 중요한 전환을 의미합니다.마스터카드 주식은 올해 들어 11% 상승했으며, 이는 S&P 100 지수의 12% 수익률에 약간 못 미치는 수치로, 회사가 변화하는 디지털 결제 시장에서 가치를 창출하기 위한 다양한 이니셔티브를 추진하고 있음을 보여줍니다.[퍼플렉시티에 추가 질문-답변]추가 질문: "이 기술은 어떻게 동작하는가"Mastercard의 에이전트 상거래(Agentic Commerce) 및 Agent Pay 기술은 AI 에이전트가 사용자의 결제 요청을 받아 직접 결제를 실행하는 자동화·보안 기반 시스템입니다.주요 동작 원리- AI 에이전트 인터페이스사용자가 챗봇이나 음성 비서 등에 요청(예: "운동화 사줘")을 하면, AI 에이전트가 사용자의 선호와 구매 조건을 파악하고, 다양한 온라인 쇼핑 플랫폼에서 상품을 자동 탐색·비교합니다.- 결제 자동화 및 토큰화선택된 상품·서비스에 대해 구매가 결정되면, AI 에이전트는 결제 요청을 마스터카드 네트워크로 전송합니다. 실제 카드 정보 대신 Agentic Token이라는 임시·암호화 토큰이 발급되어 결제가 처리되므로 개인 정보 노출 없이 안전하게 거래가 이루어집니다.- 에이전트 등록 및 검증모든 AI 에이전트는 사전 등록·신뢰 검증을 받아야 하며, 인증된 에이전트만이 결제 토큰을 요청할 수 있습니다. 사용자는 에이전트가 사용할 수 있는 한도(예: 최대 결제금액, 지정 상점 등)나 승인 조건까지 세밀하게 통제할 수 있습니다.- 실시간 인증 및 사기 모니터링결제 과정에서 추가 인증(생체인증, 패스키 등)을 통해 보안이 강화되어 있으며, Mastercard의 AI 기반 위험 감지 시스템이 실시간으로 거래의 이상 징후를 모니터링해 보안 위협과 사기를 예방합니다.거래 흐름 요약1. 사용자의 요청 → AI 에이전트가 상품 탐색·추천2. 구매 결정 → 에이전트가 결제 토큰 발급 요청3. Mastercard에서 토큰 발급 및 결제 승인4. 사용자 지정 조건(한도, 매장 등) 및 실시간 인증·보안 적용5. 거래 완료 후 기록과 데이터가 자동 축적되고, 필요시 사용자 최종 승인도 가능.핵심 기술- Mastercard Agentic Tokens: 실카드 정보 노출 없이 임시 결제 권한을 주는 보안 토큰.- AI 기반 사기 방지 시스템: 실시간 위험 감지로 결제 안전 강화.- 사용자·기관 맞춤형 제어: On-Demand Decisioning을 통해 거래 승인·거절 조건을 실시간 자동화.이 기술은 AI가 기존의 단순 추천에서 한 단계 더 나아가, 결제까지 자동으로 수행하며, 사용자와 기관 모두에게 강력한 제어권과 최신 보안 환경을 제공합니다.
1071 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)오픈AI가 10일 서울 광진구 파이팩토리 스튜디오에서 기자회견을 열고 한국 지사인 '오픈AI 코리아'의 공식 출범을 발표했다. 아시아에서 세 번째, 전 세계에서 열두 번째가 되는 오픈AI 코리아는 한국을 차세대 글로벌 AI 허브로 선택했다고 밝혔다.제이슨 권 오픈AI 최고전략책임자(CSO)는 이날 기자회견에서 "한국은 세계적 수준의 인프라, 혁신적인 기업, 빠른 디지털 도입 속도를 갖춘 AI 혁신의 최적지"라며 "구독자에게 있어서도 한국은 중요한 시장이기 때문에 데이터센터 설립을 고려하고 있다"고 말했다.한국 시장의 전략적 가치 입증오픈AI가 한국을 아시아 3번째 거점으로 선택한 배경에는 놀라운 성장 수치가 뒷받침되고 있다. 한국은 챗GPT 유료 구독자 수에서 미국에 이어 세계 2위를 차지하고 있으며, 국내 챗GPT 주간 활성 사용자(WAU)는 1년 전보다 4배 증가했다. 유료 구독자 규모도 전년 대비 3배 이상 늘어 아시아태평양 지역 최대 규모를 기록했다.API 활용 측면에서도 한국은 전 세계 10위권 내에 포함되어 있으며, 오픈AI의 글로벌 주간 활성 사용자는 7억 명을 넘어서고 있다. 2025년 5월 기준으로는 챗GPT의 국내 월간 활성 이용자 수가 1000만 명을 돌파한 바 있다.산업계·학계·정부와 전방위 협력오픈AI 코리아는 출범과 함께 다각적인 협력 네트워크 구축에 나선다. 11일에는 서울대학교와 업무협약(MOU)을 체결해 학계와의 연구 협력을 본격화할 예정이며, '오픈AI 포 컨트리즈(OpenAI for Countries)' 이니셔티브를 통해 한국 정부와의 협력도 강화해 나간다.이미 2월 카카오와 전략적 제휴를 맺은 후 챗GPT와 카카오 생태계 연동을 준비하고 있으며, 건설, 전자, 통신, 금융, 여행, 게임, 이커머스, 엔터테인먼트 등 다양한 산업 분야의 선도 기업들이 GPT-5 등 최첨단 AI 기술을 적극 도입하고 있다.스타트업 생태계 지원 확대스타트업 생태계 육성도 오픈AI 코리아의 핵심 과제다. 2월 국내 최초 개발자 워크숍인 빌더랩을 개최한 데 이어, 12일에는 파운더스 데이를 열어 스타트업, 개발자, 벤처캐피털(VC) 간 네트워킹의 장을 마련할 예정이다. 11월에는 개발자와 스타트업, AI 연구자들을 한자리에 모아 오픈AI의 최신 기술을 공유하는 '데브데이 익스체인지(DevDay Exchange)'를 국내에서 개최할 계획이다.제이슨 권 CSO는 지난달 25일 미국 워싱턴 DC에서 열린 한미 비즈니스 라운드 테이블에서 삼성전자 이재용 회장, SK그룹 최태원 회장, 네이버 최수연 대표 등과 만나 "한국과 장기적 투자 고려 중이기 때문에 이들 CEO들과 고민을 함께 나눴다"고 밝혔다.다만 한국 지사장 채용은 아직 진행 중이다. 제이슨 권 CSO는 "한국 지사장과 관련해서는 곧 말씀드릴 수 있을 것"이라고 언급했다.
913 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)마이크로소프트(Microsoft)는 Office 365 애플리케이션에 앤트로픽(Anthropic)의 인공지능 기술을 통합하고 있으며, 이는 오픈AI(OpenAI) 모델에만 의존하던 전략에서 벗어난 새로운 움직임입니다. 오늘 The Information에 보도된 바에 따르면, 이번 파트너십을 통해 두 회사의 기술이 마이크로소프트의 생산성 제품군 내에서 함께 작동할 예정이며, 개발자들은 앤트로픽의 최신 모델이 특정 자동화 작업에서 오픈AI를 능가할 수도 있다고 언급하고 있습니다.Anthropic 모델은 사무 작업에서 뛰어난 성과를 보입니다.Anthropic의 기술을 도입하기로 한 결정은 AI 기업의 최신 모델들, 특히 Claude Sonnet 4가 특정 Office 365 기능 자동화에서 우수한 성능을 보인 테스트 결과에 따른 것입니다. Microsoft의 생산성 앱용 AI 기능 개발에 참여한 개발자들은 Anthropic의 모델들이 특히 Excel에서의 재무 계산 실행 및 특정 지시 사항에 따른 PowerPoint 프레젠테이션 생성에서 뛰어남을 발견했습니다.이번 협력은 Microsoft가 Office 365의 AI 역량을 위해 이전까지 독점적으로 의존하던 OpenAI 기술에서 처음으로 의미 있는 전환을 시도하는 것입니다. 수년간 OpenAI의 모델이 Word, Excel, Outlook, PowerPoint 전반의 Copilot 기능을 구동해왔으나, 이제 회사는 AI 포트폴리오를 다각화하여 여러 공급업체를 포함시키고 있습니다.파트너십 갈등 속에서의 전략적 전환이 같은 상황은 마이크로소프트와 오픈AI 간의 관계에 대한 압력이 점점 커지고 있는 가운데 벌어지고 있습니다. 소프트웨어 거대 기업인 마이크로소프트는 2019년 이후 오픈AI에 130억 달러 이상을 투자했지만, 양사의 파트너십 계약은 2030년에 만료될 예정입니다. 최근 협상에서는 지분율, 수익 분배 방식, 독점적 권리 등에 초점이 맞춰졌으며, 오픈AI는 현재 20%인 마이크로소프트의 수익 지분을 줄이고자 하는 것으로 알려졌습니다.마이크로소프트는 자체 AI 모델인 MAI도 개발해왔으며, 이 모델들은 오픈AI와 Anthropic의 주요 모델과 비슷한 성능을 보이고 있습니다. 마이크로소프트는 8월에 MAI-Voice-1과 MAI-1-preview를 선보였는데, 이는 회사의 최초의 엔드투엔드 기반 모델로, 외부 AI 공급업체에 대한 의존도를 줄이려는 더 넓은 전략을 나타냅니다.AI 모델 포트폴리오 확장Anthropic의 통합은 Microsoft가 OpenAI를 넘어 인공지능 역량을 다양화하려는 광범위한 노력의 일부입니다. 이 회사는 Copilot 프레임워크 내에서 성능을 평가하기 위해 DeepSeek, Meta, xAI를 포함한 다양한 업체의 AI 모델을 테스트해 왔습니다. 이러한 다중 모델 접근법은 Microsoft가 다양한 비즈니스 분야에 맞춤형 솔루션을 제공하면서 단일 AI 공급업체에 대한 의존도를 줄일 수 있게 해줍니다.현재 Microsoft와 OpenAI의 파트너십은 OpenAI 모델을 자사 제품 및 클라우드 인프라에 통합할 독점 권한을 포함합니다. 하지만 최근 변경으로 인해 OpenAI의 Azure 독점권이 수정되어, Microsoft가 용량 요구를 충족하지 못할 경우 OpenAI가 다른 클라우드 공급자를 사용할 수 있는 '선매권(right of first refusal)' 모델로 전환되었습니다.Anthropic 기술의 Office 365 통합은 기업용 AI 환경이 변화하고 있음을 보여줍니다. 기업들은 점점 단일 공급업체 솔루션 대신, 유연성과 성능 최적화를 추구하고 있습니다. Microsoft와 Anthropic 모두 The Information의 보도 당시 파트너십 세부 사항에 대한 공식 입장을 내놓지 않았습니다.
994 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)Google은 Android, iOS, 웹 플랫폼 전반에서 Gemini AI 앱에 오디오 파일 업로드 기능을 추가하여 사용자들의 압도적인 수요에 응답했습니다. Google Labs 및 Gemini 부사장 Josh Woodward는 오디오 지원이 앱 출시 이후 사용자들이 요청한 "가장 많은 요청"이었다고 X에서 발표했습니다.이 기능을 통해 사용자는 MP3, WAV, M4A 등 일반적인 오디오 파일 형식을 앱의 업로드 인터페이스를 통해 직접 업로드할 수 있습니다. 무료 사용자는 하루 5번의 프롬프트로 총 10분 길이의 오디오를 처리할 수 있으며, Google AI Pro 또는 AI Ultra 플랜 구독자는 최대 3시간 분량의 오디오 업로드로 훨씬 더 많은 용량을 제공받습니다.멀티모달 AI 역량 확장이 오디오 기능은 사용자가 Gemini와 상호작용하는 방식을 변화시키며, 인터뷰를 기록하거나 음성 메모를 분석하고 강의 녹음을 검색 가능한 콘텐츠로 변환하는 등 새로운 사용 사례를 가능하게 합니다. 사용자는 이제 회의 녹음을 업로드하여 실행 항목이 포함된 요약을 요청하거나 대학 강의를 제출해 학습 가이드 생성을 요청할 수 있습니다.이번 업데이트는 Gemini를 수개월 전부터 오디오 업로드 기능을 지원해 온 OpenAI의 ChatGPT와 같은 경쟁업체들과 기능적 균형에 더 가까워지게 합니다. Android Police에 따르면, 올해 초 파일 업로드가 제공된 이후로 오디오 지원이 없었던 것은 "이상한 누락"이었다고 합니다.더 넓어진 제미니 생태계 업데이트오디오 기능과 함께, 구글은 AI 모드 검색 경험을 인도어, 인도네시아어, 일본어, 한국어, 브라질 포르투갈어 등 5개 새로운 언어로 확장했습니다. 이번 확장에서는 Gemini 2.5 기술의 맞춤형 버전을 활용하여 단순 번역을 넘어 문화적으로 적합한 답변을 제공합니다.구글은 또한 NotebookLM 연구 보조 도구를 80개 이상의 언어에서 사용자 맞춤형 보고서 형식을 지원하도록 업그레이드하여, 사용자가 업로드한 자료로부터 학습 가이드, 요약 문서, 블로그 글, 퀴즈 등을 생성할 수 있도록 했습니다. 이제 이 플랫폼은 사용자의 선호도에 따라 특정 구조, 스타일, 톤으로 보고서를 작성할 수 있습니다.오디오 업로드 기능은 빠르게 진화하는 인공지능 분야에서 멀티모달 기능의 중요성이 커지고 있는 가운데 구글이 자사의 AI 도구를 더욱 다양하고 경쟁력 있게 만들기 위한 지속적인 노력을 보여줍니다. 이러한 기능은 사용자 참여와 생산성 향상에 중요하게 작용합니다.
980 조회
0 추천
2025.09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입