Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
942 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 639 / 118 페이지
컬리가 인공지능(AI) 식단 관리 앱 루션’(Roution)을 공식 출시했다. 루션은 음식 사진·이름 입력을 통한 식단 기록과 개인 맞춤형 식단 추천 기능을 제공하며, 컬리 최초로 구글 생성형 AI를 핵심 로직에 적용했다. 이용자의 나이, 성별, 체중, 활동량, 알레르기, 목표 칼로리 등을 반영해 하루 권장 섭취량과 영양 비율을 고려한 맞춤형 식단을 설계한다. 앱은 컬리 상품과 연동돼 추천 식단을 바로 구매할 수 있고, 식단 관리 미션 완료 시 포인트를 적립해 할인 쿠폰·교환권으로 활용할 수 있다. 현재는 주로 **다이어트 목적**으로 쓰이고 있으며, 컬리 계정을 통해서만 가입 가능하다. 컬리는 앞으로 루션을 체중, 체지방, 혈당, 수면 등 주요 건강 지표를 통합 모니터링하는 맞춤형 건강 관리 플랫폼으로 확장할 계획이다.
856 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)Airbnb CEO 브라이언 체스키는 인공지능으로 인해 일자리를 잃은 근로자들에게 자사의 기업이 잠재적인 생명줄이 될 수 있다는 인상적인 비전을 제시하며, 플랫폼의 확장되는 서비스가 일자리 자동화에 대한 두려움이 커지는 시대의 피난처가 될 수 있다고 강조했습니다.화요일 샌프란시스코에서 열린 골드만삭스 Communacopia + Technology Conference에서 체스키는 환대 및 서비스 중심의 역할은 AI의 교란에 대해 탄력적으로 남을 것이라고 주장하며, 자신의 플랫폼이 자동화에 취약한 산업에서 근로자들을 흡수할 수 있음을 시사했습니다.인간적인 손길은 여전히 필수적입니다체스키의 낙관주의는 특정 경험에는 대체할 수 없는 인간적인 요소가 필요하다는 그의 신념에서 비롯된다. "저는 사람들이 보르도에 가서 와인 한 병을 마실 때, 그 경험이 AI로 이뤄지기를 원하지 않는다고 생각합니다,"라고 그는 설명했다. "그들이 코모 호수에 갈 때, 누군가가 문을 로봇이 열어주는 것을 원하지 않을 것이라고 생각해요".이러한 관점은 현재의 자동화 트렌드와는 크게 대조된다. 체스키는 자율주행 차량이 결국 인간 운전자를 없애게 될 것임을 인정하면서—"미래에는 인간이 운전하는 차량이 거의 없을 것 같아요"—향후 5~10년 동안은 환대 서비스(호스피탈리티)가 사람 중심으로 이루어질 것이라고 강조했다.최근 데이터는 라이드셰어 운전사들에 대한 그의 우려를 뒷받침한다. 2025년 9월 Gridwise의 보고서에 따르면, 로보택시가 활성화된 모든 시장에서 라이드셰어 운전자의 시간당 급여가 하락했으며, 샌프란시스코는 6.9%, 오스틴은 5.3%의 하락을 기록했다.에어비앤비의 확장하는 생태계이 회사는 단순한 임대 플랫폼에서 체스키가 말하는 '올인원 앱'으로 탈바꿈해왔으며, 개인 셰프, 마사지, 사진 촬영 등과 같은 서비스로 영역을 확장하고 있습니다. 이러한 다양화는 2025년 5월에 검증된 전문가들이 평균 10년 이상의 경력을 가진 Airbnb 서비스와 함께 시작되었습니다."만약 AI가 많은 일자리를 대체하게 된다면, 그 중 일부라도 우리 플랫폼에서 성장하고 확대될 수 있기를 바랍니다,"라고 체스키는 컨퍼런스에서 밝혔습니다.AI로 인한 일자리 대체 현실체스키의 비전은 인공지능(AI)으로 인한 일자리 상실 경고가 점점 커지는 상황에서 등장했다. Anthropic의 CEO 다리오 아모데이는 최근 AI가 향후 5년 내에 모든 초급 화이트칼라 일자리의 절반을 사라지게 할 수 있으며, 실업률이 10~20%에 이를 수 있다고 예측했다.'AI의 대부'로 불리는 제프리 힌턴 역시 "평범한 지적 노동"이 대체될 위험이 있다고 경고하면서, 배관과 같은 육체적 직업이 더 안전한 선택일 수 있음을 시사했다. 최근 자료에 따르면 2025년 첫 5개월 동안 미국 내에서 696,000건 이상의 일자리가 줄었는데, 이는 전년도 대비 80% 증가한 수치다.체스키의 비전에서의 과제는, 일자리를 잃은 지식 노동자들이 숙박 호스팅 역할에 필요한 창업 역량을 갖추었는지, 경제적 압박 상황에서 높은 실업률이 여행 수요에 영향을 끼칠 것인지에 있다. 그럼에도 그의 전략은 인간 중심의 서비스가 AI 중심의 직장 변화 물결 속에서 하나의 돌파구가 될 수 있음을 시사한다.
919 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.AI 불일치의 근본 원인 파악하기"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.기업용 AI를 위한 제안된 솔루션He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.실리콘밸리의 최신 인공지능 연구소Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.
1024 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)마스터카드는 수요일, 연말 쇼핑 시즌을 앞두고 "에이전틱 커머스(agentic commerce)"를 가능케 하는 종합적인 인공지능(AI) 기반 결제 도구 제품군을 발표했습니다. 이 기능들은 AI 에이전트가 소비자와 기업을 대신해 거래를 완료할 수 있도록 해줍니다.이 금융 서비스 대기업은 자사의 확장된 에이전트 페이(Agent Pay) 프로그램이 연말까지 미국 내 모든 카드 소지자를 대상으로 제공될 예정이며, 이후 곧 글로벌 확장도 계획하고 있다고 밝혔습니다. 씨티와 U.S.뱅크 고객들이 이 AI 기반 결제 기능을 가장 먼저 이용하게 될 예정이며, 이커머스 플랫폼들도 이 기술 통합을 준비하고 있습니다.새로운 개발자 도구 및 산업 파트너십마스터카드는 AI 기반 거래 채택을 가속화하기 위해 설계된 네 가지 주요 이니셔티브를 중심으로 발표를 진행했습니다. 이 회사는 자사의 개발자 플랫폼에서 에이전트 툴킷을 출시했는데, 이를 통해 AI 어시스턴트가 Model Context Protocol 서버를 통해 마스터카드 API에 원활하게 접근할 수 있게 하여 Claude, Cursor, GitHub Copilot 등 다양한 플랫폼과의 통합을 지원합니다.Agent Sign-Up 기능은 AI 에이전트를 위한 간소화된 등록 절차를 제공하며, Insight Tokens는 SAP Concur 및 Agentic Consulting Services의 지원을 받아 AI 에이전트가 소비자 허가 데이터를 접근할 수 있는 프레임워크를 만듭니다. 이 도구들은 개발자가 AI 결제 기능을 보다 효율적으로 통합할 수 있도록 도와주어, 업계 보도에 따르면 구현 시간을 몇 주에서 몇 시간으로 단축할 수 있습니다.마스터카드는 Stripe, Alphabet의 Google, Ant International의 Antom 등 주요 기술 기업들과 협력하여 에이전트 결제 산업 표준을 확립하고 있습니다. 이 파트너십은 FIDO Alliance와 함께 상인 및 거래 정보를 확인하는 자격 검증 시스템 개발에 주력하고 있으며, AI 에이전트가 결제 기능을 갖게 됨에 따라 제기되는 보안 문제를 해결하는 데 중점을 두고 있습니다.강화된 보안 및 거래 제어회사는 동시에 주문형 의사결정(On-Demand Decisioning)을 도입하여 금융 기관이 맞춤화 가능한 규칙 엔진을 통해 거래 승인에 대한 실시간 제어 권한을 행사할 수 있도록 했습니다. 이 도구는 발급사가 승인 기준을 설정하고, 오탐지 거절을 줄이며, 고가치 고객을 위한 승인 우선순위를 부여할 수 있게 하며, 마스터카드의 RiskX 서밋(로마)에서 처음 공개되었습니다.마스터카드의 최고 제품 책임자인 요른 램버트(Jorn Lambert)는 "에코시스템 전반의 파트너들과 협력하여 에이전틱 커머스를 정의할 표준과 도구를 구축하고 있다"고 밝혔습니다. 이 이니셔티브는 인공지능 기반 에이전트가 최소한의 인간 개입으로도 복잡한 구매 업무를 안전하게 수행할 수 있게 하는 자동화된 디지털 거래 패러다임으로의 중요한 전환을 의미합니다.마스터카드 주식은 올해 들어 11% 상승했으며, 이는 S&P 100 지수의 12% 수익률에 약간 못 미치는 수치로, 회사가 변화하는 디지털 결제 시장에서 가치를 창출하기 위한 다양한 이니셔티브를 추진하고 있음을 보여줍니다.[퍼플렉시티에 추가 질문-답변]추가 질문: "이 기술은 어떻게 동작하는가"Mastercard의 에이전트 상거래(Agentic Commerce) 및 Agent Pay 기술은 AI 에이전트가 사용자의 결제 요청을 받아 직접 결제를 실행하는 자동화·보안 기반 시스템입니다.주요 동작 원리- AI 에이전트 인터페이스사용자가 챗봇이나 음성 비서 등에 요청(예: "운동화 사줘")을 하면, AI 에이전트가 사용자의 선호와 구매 조건을 파악하고, 다양한 온라인 쇼핑 플랫폼에서 상품을 자동 탐색·비교합니다.- 결제 자동화 및 토큰화선택된 상품·서비스에 대해 구매가 결정되면, AI 에이전트는 결제 요청을 마스터카드 네트워크로 전송합니다. 실제 카드 정보 대신 Agentic Token이라는 임시·암호화 토큰이 발급되어 결제가 처리되므로 개인 정보 노출 없이 안전하게 거래가 이루어집니다.- 에이전트 등록 및 검증모든 AI 에이전트는 사전 등록·신뢰 검증을 받아야 하며, 인증된 에이전트만이 결제 토큰을 요청할 수 있습니다. 사용자는 에이전트가 사용할 수 있는 한도(예: 최대 결제금액, 지정 상점 등)나 승인 조건까지 세밀하게 통제할 수 있습니다.- 실시간 인증 및 사기 모니터링결제 과정에서 추가 인증(생체인증, 패스키 등)을 통해 보안이 강화되어 있으며, Mastercard의 AI 기반 위험 감지 시스템이 실시간으로 거래의 이상 징후를 모니터링해 보안 위협과 사기를 예방합니다.거래 흐름 요약1. 사용자의 요청 → AI 에이전트가 상품 탐색·추천2. 구매 결정 → 에이전트가 결제 토큰 발급 요청3. Mastercard에서 토큰 발급 및 결제 승인4. 사용자 지정 조건(한도, 매장 등) 및 실시간 인증·보안 적용5. 거래 완료 후 기록과 데이터가 자동 축적되고, 필요시 사용자 최종 승인도 가능.핵심 기술- Mastercard Agentic Tokens: 실카드 정보 노출 없이 임시 결제 권한을 주는 보안 토큰.- AI 기반 사기 방지 시스템: 실시간 위험 감지로 결제 안전 강화.- 사용자·기관 맞춤형 제어: On-Demand Decisioning을 통해 거래 승인·거절 조건을 실시간 자동화.이 기술은 AI가 기존의 단순 추천에서 한 단계 더 나아가, 결제까지 자동으로 수행하며, 사용자와 기관 모두에게 강력한 제어권과 최신 보안 환경을 제공합니다.
1066 조회
0 추천
2025.09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입