Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
1,357 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 1,117 / 245 페이지
(퍼플렉시티가 정리한 기사)Google DeepMind는 중력파 천문학에 중대한 전환점을 가져올 수 있는 인공지능 시스템을 개발했습니다. 9월 3일 과학 저널 Science에 게재된 이 혁신적인 AI 기술은 Deep Loop Shaping이라 불리며, 기존 방법에 비해 레이저 간섭계 중력파 관측소(LIGO)에서 불필요한 잡음을 30~100배까지 줄일 수 있음을 입증했습니다.Google DeepMind와 Caltech 및 이탈리아 그란사소 과학연구소 연구자들의 협업은 중력파 신호를 가릴 수 있는 LIGO의 40킬로그램짜리 거울의 미세한 진동을 제어하는 것에 집중했습니다. 이런 진동은 종종 먼 바다의 파도와 지진 활동에 의해 발생하며, 오랫동안 우주적 사건을 감지하는 관측소의 민감도에 한계를 주는 요인이었습니다.혁신적인 소음 제어 기술딥 루프 셰이핑(Deep Loop Shaping)은 강화 학습을 사용하여 AI 알고리즘이 LIGO의 거울을 더 잘 안정화하는 방법을 익히도록 합니다. “우리가 훈련 데이터를 제공했고, 구글 딥마인드가 시뮬레이션을 실행했습니다. 기본적으로, 그들은 수십 개의 시뮬레이션된 LIGO들을 병렬로 실행하고 있었습니다,”라고 캘리포니아 공과대학교(칼텍) 물리학 교수이자 논문 공동 저자인 라나 아디카리(Rana Adhikari)가 설명했습니다. 이 시스템은 노이즈 캔슬링 헤드폰의 고급 버전처럼 작동하지만, 기존 제어 시스템이 진동을 보상할 때 자체적인 “쉬익” 소음을 발생시키는 근본적인 문제를 해결합니다.이번 AI 혁신은 특히 10~30 헤르츠(Hz) 주파수 범위의 노이즈를 목표로 하며, 이는 더 거대한 블랙홀 합병을 탐지하고, 합병 과정 초기에 포착하는 데 매우 중요합니다. 이 주파수 대역은 유명한 중력파 “챠이프(chirp)”가 고주파로 올라가기 전에 시작되는 지점입니다.블랙홀 탐지의 새로운 지평을 열다향상된 감도 덕분에 LIGO는 이전에는 감지할 수 없었던 새로운 유형의 블랙홀, 즉 항성질량 블랙홀과 초대질량 블랙홀 사이의 간극을 잇는 중간질량 블랙홀까지 탐지할 수 있게 될 것으로 보입니다. 캘리포니아 공과대학교(칼텍)의 중력파 연구 과학자인 크리스토퍼 비프는 이 기술을 "지상 기반 탐지기가 할 수 있는 일에 대한 우리의 인식을 바꿔주는 도구"라고 설명했습니다.LIGO는 현재 네 번째 관측 기간 동안 이미 200건이 넘는 블랙홀 병합을 탐지했으며, 현재는 거의 3일에 한 번씩 블랙홀 병합을 식별하고 있습니다. 2025년 7월, 지금까지 가장 질량이 큰 블랙홀 병합을 탐지한 것은 관측소의 역량이 한층 강화되고 있음을 보여줍니다.구글 딥마인드의 주저자인 요나스 부흘리는 딥 루프 셰이핑(Deep Loop Shaping)을 "혁명적이다. 왜냐하면 LIGO에서 가장 불안정하고 가장 어려운 피드백 루프의 노이즈 수준을 줄일 수 있기 때문"이라고 평가했습니다. 이 AI 시스템은 LIGO에서 1시간 동안 개념 증명 시험이 이뤄졌으며, 연구진은 더욱 긴 시간 테스트와 LIGO 시스템 전반에 걸친 폭넓은 적용을 계획하고 있습니다.이 기술은 중력파 탐지 외에도 다양한 분야에 적용될 수 있습니다. 구글 딥마인드 연구원들에 따르면, 딥 루프 셰이핑은 "진동 억제, 소음 제거, 그리고 항공우주, 로봇공학, 구조공학 등에서 중요한 매우 동적이거나 불안정한 시스템"에 활용될 수 있습니다.
1364 조회
0 추천
2025.09.05 등록
SWITCHBOT이 IFA2025에서 귀여운 AI 로봇 반려동물 'Kata friends' 을 소개했다.귀엽고 털복숭이한 로봇들은 카메라와 내장형 대형 언어 모델(LLM)을 탑재해 자연어 명령을 이해하고물체 인식이 가능하며, 저지연(on-device low-latency)으로 항상 사용자의 곁에 있어주는동반자 역할을 목표로 한다. Noa와 Niko라는 이름의 이 로봇들은 주로 반려용으로 설계되었다고Kata friends는 가족 구성원을 인식하고, 몸짓과 감정에 반응하며, 행복, 슬픔, 심지어 질투 같은 감정도 표현한다.시간이 지남에 따라 사용자의 일상과 기억을 학습해 진화하는 존재가 된다고 SwitchBot은 설명한다.심지어 이 로봇들이 질투를 느낄 수 있다는 점은 다소 신기하고 신선한 개념이라고 체험을 한 GIZMODO 기자는 소개한다.로봇들은 작은 바퀴를 가지고 있어 스스로 움직일 수 있으며, 이것이 더 많은 상호작용과 자유로운 행동을 가능하게 한다.그러나 아직 출시 일정이나 가격 정보는 공개되지 않았다. 따라서 현재로선 정확히 언제 만나볼 수 있을지는 미지수이지만,SwitchBot은 과거에 혁신적인 로봇 제품들을 실제로 출시한 전력이 있어 기대를 모은다
1363 조회
1 추천
2025.09.05 등록
워너 브라더스 디스커버리(Warner Bros. Discovery)가 AI 이미지 생성 플랫폼 미드저니(Midjourney)를 상대로 저작권 침해 소송을 제기했다고 헐리우드리포터가 보도했다. 소송은 미드저니가 워너 브라더스의 캐릭터들을 무단으로 복제해 이미지와 비디오를 생성, 이를 이용자들에게 제공하며 불법적으로 수익을 창출하고 있다고 주장한다. 미드저니는 배트맨, 슈퍼맨, 벅스 버니, 스쿠비 두 등 워너 브라더스의 저작권 캐릭터들을 포함한 다양한 콘텐츠를 무단으로 사용했다는 혐의를 받고 있다워너 브라더스는 미드저니가 저작권자의 허가나 승인 없이 워너 브라더스의 지적 재산권을 상업적으로 이용하며 "법 위에 군림한다"고 비판했다. 특히 미드저니가 저작권 보호를 위한 안전장치를 고의적으로 제공하지 않았으며, 최근에는 영상 생성 모델에서 저작권 침해를 방지하려던 조치를 철회했다고 소송에서 지적했다. 이러한 행위는 저작권 침해가 명백하며, 이로 인해 워너 브라더스가 엄청난 경제적 손실을 입었다고 강조한다.이번 소송은 앞서 디즈니와 유니버설이 미드저니를 상대로 제기한 저작권 소송과 맥락을 같이 한다. 이들 스튜디오는 미드저니가 자체 AI 시스템 훈련에 영화 및 TV 프로그램 등 자사 저작물을 무단으로 활용했다고 주장하며, "무한한 불법 복제물을 생성하는 가상 자판기"라고 비판했다. 워너 브라더스 또한 자사 콘텐츠와 창작자들을 보호하기 위해 이번 법적 대응에 나섰다소송 문서에는 미드저니가 배트맨과 같은 특정 캐릭터 이름을 명시하지 않아도 저작권 침해 이미지와 영상을 생성할 수 있다고 적시돼 있다. 예를 들어 "클래식 만화 슈퍼히어로 배틀"과 같은 일반적인 문구를 사용해도 워너 브라더스 캐릭터들이 복제된 이미지가 만들어질 수 있다고 한다. 따라서 미드저니가 저작권 침해의 범위와 심각성을 인지하면서도 이를 고의적으로 방치하고 있다는 점이 강조된다.워너 브라더스는 이번 소송을 통해 저작권 침해에 따른 손해 배상과 미드저니의 저작권 침해 행위 중단을 요구하고 있으며, 미드저니가 적절한 저작권 보호 조치를 도입할 때까지 AI 이미지 생성 서비스 제한을 요청하고 있다. 현재까지 미드저니 측은 이 소송에 대한 공식 입장을 밝히지 않았다
1370 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사입니다)구글의 최신 업데이트에서 돋보이는 기능은 Gemini 2.5 Flash Image로, 개발 코드명인 "Nano Banana"로 잘 알려져 있습니다. 구글 개발자 블로그에 따르면, 이 모델은 사용자가 간단한 텍스트 프롬프트만으로 이미지를 편집할 수 있게 하며, 인물의 일관성과 얼굴 세부 사항을 유지할 수 있습니다. 이 도구를 통해 여러 이미지를 혼합하거나, 배경을 변경하고, 옷을 수정하며, 심지어 연예인과 직접 만난 적 없이 셀피를 만들 수도 있습니다.TechCrunch에 따르면, "이 모델은 LMArena에서 'nano-banana'라는 익명 가명을 사용하여 사용자들에게 공개되었고, 곧 최첨단 이미지 편집기로 인정받게 되었습니다." 소셜 미디어 이용자들은 해당 도구의 사실적인 편집 능력을 극찬했으며, 한 튜토리얼에서는 자연스러운 결과로 셀피를 변화시키는 방법을 보여주었습니다.
1394 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입