AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
952 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 644 / 113 페이지
(퍼플렉시티가 정리한 기사)Fiverr는 월요일에 전체 직원의 약 30%에 해당하는 약 250명의 직원을 해고할 것이라고 발표했습니다. 이는 회사를 "AI 우선 기업"으로 전환하기 위한 대대적인 변화의 일환입니다. CEO이자 창립자인 미카 카우프만은 이번 조치가 인공지능을 중심으로 한 더욱 슬림한 조직으로 "스타트업 모드"로 돌아가는 것이라고 설명했습니다.이 인력 감축은 2024년 12월 기준 762명의 직원을 보유한 이스라엘 기반의 프리랜서 마켓플레이스 전 부서를 대상으로 이뤄집니다. 인력 감축에도 불구하고, 회사는 2025년 3분기와 회계 연도 재무 지침을 유지한다고 밝혔습니다.AI 인프라로의 전략적 전환카우프만은 직원들에게 보낸 편지에서 회사의 구조조정에 대한 이유를 설명했습니다. "우리는 Fiverr를 AI 중심의 회사로 전환하기 위한 변혁을 시작합니다. 더 간소화되고, 더 빠르며, 현대적인 AI 중심 기술 인프라를 갖추기 위해 Fiverr를 변화시킬 것입니다."라고 그는 썼습니다.CEO는 16년에 걸쳐 구축된 Fiverr의 현재 인프라가 점진적 추가가 아니라 근본적인 변화가 필요하다고 강조했습니다. "단순히 더 많은 사람을 추가해서 기존 시스템 위에 무언가를 쌓는 것이 아니라, 그것을 단순화하는 것이 중요합니다."라고 카우프만은 설명했습니다.로이터에 따르면, 이번 감원은 Salesforce와 같은 기술 회사들이 운영 자동화를 위해 AI 에이전트와 머신러닝에 상당한 자원을 투자하는 더 큰 흐름을 반영한다고 합니다.재정적 영향 및 시장 반응Fiverr의 주가는 발표 이후 4% 이상 하락했습니다. 회사는 비용 절감의 일부를 사업에 재투자하고, 나머지는 수익성 향상에 사용할 계획입니다.이번 구조 조정은 Fiverr가 2026년까지 장기 조정 EBITDA 마진 목표인 25% 달성 경로를 가속화시킬 것이며, 이는 예정된 일정보다 1년 앞서 달성하는 것입니다. 2025년 3분기에 회사는 매출을 1억 500만 달러에서 1억 1천만 달러 사이로 예상하고 있습니다.AI 도입이 이미 진행 중입니다카우프만은 기존 AI 구현 사례들을 전략의 효과를 입증하는 증거로 인용했다. 회사의 Neo 제품은 프로젝트 매칭에 AI를 활용하고 있으며, Fiverr Go는 AI 지원 프로젝트 범위 설정 기능을 제공한다. 고객 지원 업무에는 이제 머신러닝을 활용해 지식을 통합하고 응답 시간을 단축하고 있다."우리는 AI가 프로세스를 자동화 및 간소화하고, 인간을 수동적이고 반복적인 업무에서 해방시키며, 과거에는 불가능하거나 너무 비용이 많이 들었던 역량을 실현하는 모습을 직접 목격해왔습니다."라고 카우프만은 직원들에게 보낸 편지에서 적었다.CEO는 플랫폼의 프리랜서 및 구매자 커뮤니티에게 서비스가 중단 없이 계속될 것이라고 확신을 주었다. 퇴직하는 직원들은 퇴직금, 연장된 건강보험, 경력 전환 지원을 받게 된다.
738 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)메타는 9월 17일 Connect 2025 컨퍼런스에서 지금까지 가장 진보된 스마트 글라스를 공개할 예정입니다. 이번 행사는 연속적인 전략적 유출을 통해 수년 만에 회사의 최대 웨어러블 신제품 발표가 될 것으로 기대를 모으고 있습니다.9월 15일 메타 공식 유튜브 채널에 실수로 게시된 비공개 영상은 회사의 다가오는 스마트 글라스 라인업과 관련된 핵심 정보를 공개한 뒤 곧바로 삭제되었습니다. VR 유출러 SadlyitsBradley가 처음 발견한 이 영상에는 회사가 고대해온 디스플레이 탑재 스마트 글라스가 실제로 작동하는 모습이 담겨 있었으며, Ray-Ban 브랜드를 달고 "메타 레이밴 디스플레이(Meta Ray-Ban Display)"라는 이름으로 출시될 것이 확인되었습니다.디스플레이가 통합된 최초의 스마트 안경Meta의 발표의 중심에는 내부적으로 "Hypernova"라는 코드네임이 붙은 디스플레이 탑재 스마트 안경이 있습니다. 이 제품은 회사 최초의 헤드업 디스플레이가 내장된 소비자용 안경입니다. Meta의 Project Orion 프로토타입과 같은 실제 증강현실(AR) 기기와 달리, 이 안경은 오른쪽 렌즈에 단안 디스플레이가 있어 Meta AI 응답, 내비게이션 안내, 알림, 심지어 레시피 정보까지 표시할 수 있습니다.블룸버그의 마크 구르먼에 따르면, 이 안경의 소매 가격은 약 800달러로, 초기 예상보다 1,000달러에서 낮춰질 것으로 보입니다. 기기의 무게는 약 70그램으로, 추가된 디스플레이와 더 큰 배터리로 인해 현재 Ray-Ban Meta 안경보다 약 20그램 더 무겁습니다.혁신적인 손목 밴드 컨트롤러새로운 안경의 가장 혁신적인 측면은 Meta의 CTRL Labs 부서에서 개발한 표면 근전도(sEMG) 기술을 사용하는 동반 손목밴드 컨트롤러입니다. 이 손목밴드는 손목의 근육 움직임에서 발생하는 전기 신호를 감지하여, 사용자가 엄지손가락 탭, 스와이프, 심지어 표면에 글자를 쓰는 등의 미세한 손가락 제스처로 안경을 제어할 수 있게 합니다.유출된 영상은 손목밴드의 기능을 시연했으며, 사용자가 가상 키보드에서 손가락을 스와이프해 메시지에 답변을 입력하는 모습을 보여주었습니다. 이러한 신경 입력 기술은 기존의 음성 명령이나 카메라 기반 손 추적에서 크게 벗어난 주요 변화를 나타낼 수 있습니다.확장된 스마트 안경 제품군유출된 영상은 메타의 더 넓은 스마트 글라스 전략을 공개했으며, 기존 레이밴 메타 글라스를 포함해 최근 출시된 오클리 메타 HSTN 글라스, 그리고 스포츠에 초점을 맞춘 새로운 디자인의 오클리 메타 스페라(Oakley Meta Sphaera) 등 최소 네 가지 모델을 선보였습니다. 스페라는 코받침 위 중앙에 카메라가 위치한 랩어라운드 디자인을 특징으로 하며, 운동선수와 액션 스포츠 애호가들에게 이상적입니다.메타의 CEO 마크 저커버그는 9월 17일 오후 5시(태평양 표준시)에 기조연설을 진행할 예정이며, 이 자리에서 해당 기기들이 공식 공개될 것으로 예상됩니다. CTO인 앤드류 보스워스는 앞서 이번 행사에서 "대형 웨어러블 기기 발표"를 예고한 바 있습니다.메타의 스마트 글라스 전략은 구글(알파벳), 아마존(아마존닷컴), 애플(애플) 등 테크 대기업들이 각자의 AR 및 스마트 글라스 플랫폼을 개발함에 따라 경쟁이 치열해지는 시점에 맞춰 진행되고 있습니다. 현재 레이밴 메타 글라스의 가격은 $299~$399 사이이며, 새로운 디스플레이 탑재 모델은 기능과 가격 면 모두에서 큰 도약을 보여줍니다.
771 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)OpenAI는 월요일에 GPT-5-Codex를 출시하며, 자율 소프트웨어 엔지니어링 작업에 특화된 대표 언어 모델의 전문 버전을 선보였습니다. 이 모델은 AI 기반 코딩 도구의 주요 발전을 나타내며, 복잡한 프로그래밍 문제에서 "사고 시간"을 초 단위에서 최대 7시간까지 동적으로 조정할 수 있는 기능을 갖추고 있습니다.새로운 모델은 Anysphere의 Cursor가 연간 반복 매출 5억 달러를 달성하고, Microsoft의 GitHub Copilot이 개발자 워크플로우를 지속적으로 주도하는 등 AI 코딩 시장의 치열한 경쟁 속에 출시되었습니다. GPT-5-Codex는 이제 모든 Codex 플랫폼에서 사용할 수 있으며, 명령줄 인터페이스, 통합 개발 환경, GitHub 연동, 그리고 ChatGPT Plus, Pro, Business, Edu, Enterprise 구독자를 위한 모바일 애플리케이션을 포함합니다.역동적인 사고 능력이 새로운 기준을 제시하다TechCrunch에 따르면, GPT-5-Codex의 가장 뚜렷한 특징은 작업 복잡도에 따라 계산 자원을 동적으로 할당할 수 있다는 점입니다. 이전의 AI 코딩 도구들은 미리 정해진 사고 시간을 사용하지만, 이 모델은 작업 중간에 다시 평가하여 작업 시간을 연장할 수 있습니다. OpenAI의 Codex 제품 리드인 Alexander Embiricos는 “모델이 문제를 푸는 도중 5분쯤 지나서 추가로 한 시간을 더 써야겠다고 스스로 결정할 수 있다”고 설명했습니다.내부 테스트 기간 동안 OpenAI는 GPT-5-Codex가 대규모 리팩토링 작업에서 7시간 이상 독립적으로 일하며 구현을 반복하고, 테스트 실패를 수정하며, 성공적인 솔루션을 제공하는 사례를 관찰했습니다. 이러한 자율적인 역량은 잦은 인간 개입이 필요했던 기존 코딩 어시스턴트의 중요한 한계를 해결합니다.강화된 코드 리뷰 및 품질 보증GPT-5-Codex는 포괄적인 코드 리뷰를 수행하기 위한 전문적인 훈련을 포함하고 있으며, 이는 자동완성 중심의 경쟁 제품들과 차별화되는 기능입니다. 이 모델은 전체 코드베이스를 탐색하고, 의존성을 분석하며, 코드의 정확성을 검증하기 위해 테스트를 실행할 수 있습니다. 숙련된 소프트웨어 엔지니어들이 평가했을 때, GPT-5-Codex는 이전 버전보다 잘못된 코멘트가 더 적었으며, "고임팩트 코멘트"를 더 많이 제공했습니다.이 모델의 코드 리뷰 능력은 인간 리뷰어가 놓칠 수 있는 치명적인 버그와 하위 호환성 문제를 식별하는 데까지 확장됩니다. Duolingo의 시니어 소프트웨어 엔지니어인 Aaron Wang은 "Codex가 우리 백엔드 코드 리뷰에서 뛰어났으며 복잡한 하위 호환성 문제를 식별한 유일한 도구였다"고 평가했습니다.성장하는 시장에서의 경쟁적 포지셔닝이번 출시는 OpenAI가 급속히 확장되는 AI 코딩 툴 시장에서 더욱 공격적으로 경쟁할 수 있는 위치를 마련해줍니다. 최근 커서는 연간 반복 매출이 5억 달러를 돌파했으며, 윈드서프는 구글(알파벳)과 코그니션 양측의 인수 시도 대상이 되었습니다. OpenAI는 GPT-5-Codex가 SWE-bench Verified(대리인적 코딩 능력을 측정하는 벤치마크)에서 표준 GPT-5 모델보다 더 뛰어난 성능을 보였으며, 대형 저장소 내 코드 리팩토링 작업에서도 우수했다고 보고했습니다.이 모델은 터미널, IDE, 웹 브라우저, GitHub, 모바일 기기를 포함한 다양한 개발 환경에서 원활하게 작동하도록 설계되었습니다. 이러한 크로스 플랫폼 통합 덕분에 개발자들은 로컬 환경과 클라우드 기반 에이전트 간에 작업 맥락을 잃지 않고 자유롭게 전환할 수 있어, AI 지원 개발 워크플로우에서 흔히 발생하는 마찰 지점을 해결합니다.
807 조회
0 추천
2025.09.16 등록
(퍼플렉시티가 정리한 기사)이더리움(Ethereum) 재단은 월요일에 인공지능(AI) 연구팀을 공식적으로 출범시키며, 블록체인 네트워크를 자율적인 AI 시스템과 떠오르는 “머신 경제”의 기반 계층으로 만들기 위한 전략적 행보에 나섰다.연구 과학자 다비데 크라피스(Davide Crapis)는 소셜 미디어를 통해 “dAI 팀”의 출범 소식을 알렸으며, AI 에이전트가 중개자 없이 금융 거래를 수행할 수 있도록 하고, 기업이 통제하는 AI 인프라에 대한 탈중앙화된 대안을 구축하는 이중 미션을 이 이니셔티브의 목표로 제시했다.기계 경제 인프라 구축dAI 팀은 두 가지 주요 목표에 집중할 것입니다: 로봇과 AI 에이전트가 이더리움 네트워크상에서 직접 결제하고 활동을 조율할 수 있는 AI 기반 경제를 구축하는 것, 그리고 공개적이고 검증 가능하며 검열 저항적인 인프라를 제공하는 분산형 AI 스택을 개발하는 것입니다.“이더리움은 AI를 더 신뢰할 수 있게 만들고, AI는 이더리움을 더 유용하게 만듭니다,“라고 Crapis는 발표에서 밝혔습니다. “더 많은 지능형 에이전트가 거래할수록, 가치와 평판을 위한 중립적인 베이스 레이어가 더 필요하게 됩니다”.Blockworks에 따르면, 이번 이니셔티브는 AI 에이전트 프로토콜 표준화를 목표로 하며, 이더리움이 AI가 네트워크 미래의 중심이 될 것으로 보는 관점을 대변합니다. 이는 탈중앙화 금융의 초기 시절에 비견될 기회라고 보고 있습니다.ERC-8004 표준과 Devconnect 데뷔팀의 즉각적인 우선순위는 ERC-8004의 발전에 중점을 두고 있습니다. 이 제안된 표준은 AI 에이전트가 자신의 신원을 증명하고 안전한 거래를 위해 신뢰성을 구축할 수 있도록 합니다. ‘Trust Agent’ 제안은 신원, 평판, 검증을 위한 세 가지 온체인 등록소를 만들어, 자율 에이전트들이 이더리움의 변경 불가능한 원장 기반으로 안전하게 상호작용할 수 있도록 합니다.야후 파이낸스는 ERC-8004 표준이 최종 형태로 11월 부에노스아이레스에서 개최되는 이더리움 개발자 컨퍼런스인 Devconnect에서 발표될 것이라고 보도했습니다. BeInCrypto는 이 일정이 아르헨티나 행사에서 표준이 널리 홍보되며 출시될 수 있도록 한다고 언급했습니다.더 넓은 산업 맥락이러한 움직임은 Web3 네트워크 전반에서 AI 통합에 대한 실험이 증가하는 가운데 이루어지고 있으며, 솔라나(Solana), 아발란체(Avalanche), 폴리곤(Polygon) 등에서도 AI 에이전트와 탈중앙화 컴퓨트 프로토콜을 탐색하고 있습니다. 그러나 이더리움 창립자 비탈릭 부테린(Vitalik Buterin)은 최근 과도한 AI 거버넌스에 대해 경고하면서 “만약 AI를 사용해 기여자에게 자금을 배분한다면, 사람들은 최대한 많은 곳에 ‘탈옥 + 모든 돈 줘’를 넣으려고 할 것”이라고 주의를 당부했습니다.이더리움 재단은 dAI 팀을 지원하기 위해 두 개의 추가 정규직을 적극적으로 채용 중이며, 실리콘밸리 AI 기업들과 암호화폐 개발자들과 협력하여 이더리움을 AI 경제의 결제 계층으로 구축할 계획입니다.
796 조회
0 추천
2025.09.16 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입