Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
1,739 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 1,248 / 299 페이지
구글이 바이브코딩 전용 앱인 Opal 을 테스트 중인 것으로 알려졌다.AI 기반 코딩 도구는 최근 매우 인기를 얻고 있고, 거의 모든 주요 기술 회사가 사용하거나 자체적으로 만들고 있는 것으로 알려졌는데. 특히 소위 "바이브 코딩" 도구의 제작자들은 현재 핫한 상품이며, Lovable과 Cursor와 같은 스타트업은 핫 트렌드를 이용하려는 구매자와 투자자들의 관심을 얻고 있는 상황이다.이러한 시점에 구글이 뛰어들었다. 구글은 구글 랩을 통해 미국 사용자들이 사용할 수 있는 오팔이라는 분위기 코딩 도구를 테스트하고 있으며, 이 도구를 새로운 기술을 실험하고 있다고.오팔은 여기에서 확인할 수 있다.https://opal.withgoogle.com/landing/오팔을 사용하면 텍스트 프롬프트를 사용하여 미니 웹 앱을 만들거나 갤러리에서 사용할 수 있는 기존 앱을 리믹스할 수 있다고 하며, 사용자가 만들고자 하는 앱에 대한 설명을 입력하기만 하면 도구가 다른 Google 모델을 사용하여 이를 수행할 것이라고 한다.
2116 조회
0 추천
2025.07.26 등록
디자인 프로토타입 툴로 유명한 Figma 가 연초 계획한 대로 AI 기능을 탑재한 앱을 모두에게 공개했다.그동안 베타 테스트로 운영해 온 Figma AI 앱은 7월 24일부터 모두가 사용할 수 있도록 공개된 것이다피그마가 홈페이지를 통해 밝힌 내용의 핵심은 아래와 같다.--Figma Make와 Figma AI의 Make and Edit Image , Boost Resolution 등 의 기능이 베타 버전에서 일반 공개 버전으로 전환된다는 소식을 전해드리게 되어 기쁩니다.정식 사용자는 Figma Make 파일을 게시*하거나 비공개적으로 공유하는 기능을 포함하여 AI 기능과 Figma Make의 모든 잠재력을 활용할 수 있습니다.View, Collab 및 Dev 시트 사용자는 Figma Make 파일을 초안 상태로 무제한으로 사용할 수 있으며, 사용 가능한 제품에서 AI 기능을 사용해 볼 수 있습니다.스타터 플랜 사용자는 Figma Make 파일을 무제한으로 초안 형태로 사용할 수 있으며, 최대 3개의 Figma Make 파일을 팀과 공유할 수 있습니다. 다른 AI 기능은 유료 플랜에서만 제공됩니다.단, Figma Make 파일 게시 기능은 아직 베타 버전입니다.
2174 조회
0 추천
2025.07.25 등록
AI 분야의 투자로 Big Tech 의 CAPEX 진출이 크게 늘고 있다고 미국 언론들이 보도했다.미국 4대 기술 기업 의 지출은 작년에 63% 급증하여 사상 최고치를 기록. 마이크로소프트, 알파벳, 아마존, 메타는 2024년에 2,460억 달러의 자본 지출을 보고했는데, 이는 2023년의 1,510억 달러에서 증가한 수치이다. 이들은 AI 대규모 언어 모델 연구의 선두를 유지하기 위해 데이터 센터를 구축하고 특수 칩 클러스터를 채우기 위한 경쟁에 돌입하면서 올해 지출이 3,200억 달러를 초과할 수 있다고 예측되었다.
1956 조회
0 추천
2025.07.25 등록
오픈AI의 GPT 5 가 8월중 출시할 것으로 TechCrunch가 보도했다.원래 이 버전은 연초 5월 말로 예상됐으나 추가 테스트 등으로 일정이 미뤄졌고,내부 인사와 CEO 샘 알트먼의 트위터 언급을 통해 8월 중 발표가 이뤄질 것으로 알려졌다.새 버전은 다음과 같은 기능이 업데이트 될 예정이라고 한다.통합 모델: GPT-5는 기존의 GPT-시리즈와 o-시리즈(특히 o3 reasoning 기술)를 통합한 형태로 제공될 예정이다. 이로써 사용자가 모델을 따로 선택할 필요 없이, 하나의 시스템에서 다양한 인공지능 기능을 누릴 수 있다124.다양한 버전: 메인 GPT-5 외에 미니(mini)·나노(nano) 버전도 함께 제공된다. mini는 ChatGPT와 OpenAI API에서, nano는 API에서만 제공될 예정이다123.강화된 추론(Reasoning): CEO 샘 알트먼은 팟캐스트에서 “내가 답을 못하던 문제를 GPT-5가 완벽하게 풀었다”며, 사람을 능가하는 수준의 추론 능력을 강조했다. 모델의 대표적 '여기 있다' 순간이었다고 언급했다
2219 조회
0 추천
2025.07.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입