Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
1,752 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 1,252 / 301 페이지
유튜브 영상 요약입니다.(요약은 젠스파크)---GPT가 24시간 전에 몰래 업데이트한 이미지 일관성 기능이 진짜 미쳤어요!기존: 같은 캐릭터 생성해도 얼굴이나 옷이 계속 바뀜 ????현재: 캐릭터 외형은 그대로 유지하면서 배경/상황만 딱 변경! ✨/ 실전 활용 사례 15가지1. 얼굴 감정 변화같은 사람이 웃는 표정 → 놀라는 표정 → 의심하는 표정정말 자연스럽게 감정만 바뀌고 외형은 동일!2. 시간여행 컨셉아기 사진 넣고 → 10살, 20살, 30살 버전 생성옷 색깔, 얼굴 특징까지 일관성 있게 유지됨3. 커플 프로필 사진커플은 그대로 두고 배경만 변경한강 → 야경 → 바닷가 → 뉴욕 이런 식으로!4. 반려동물 사진우리집 강아지 사진으로 다양한 상황 연출공 가지고 놀기, 친구들과 뛰어놀기, 간식 먹기 등5. AI 모델링헤어컬러 변경, 의상 체인지 자유자재염색 시뮬레이션도 가능!6. 옷 갈아입히기온라인 쇼핑몰 운영하시는 분들 대박일듯같은 모델로 다양한 의상 착용샷 생성7. 제품 촬영이거 진짜 혁신적임!기존 모델 촬영비 최소 20-30만원 → AI로 해결제품 + 배경 자연스럽게 합성8. 캐릭터 IP 개발쿼카 캐릭터로 운동→러닝→식사→수면 스토리 제작유튜브, 인스타, 틱톡 콘텐츠 제작 가능9. 유튜브 썸네일유명 유튜버 썸네일 스타일에 내 얼굴 합성썸네일 제작 시간 30분 → 3분으로 단축!10. 로고 합성폴로 로고를 모델 의상에 자연스럽게 적용패션 브랜드 런칭 전 가상 시안 제작 가능11. 이모티콘 제작일관된 캐릭터로 "공부중", "밥먹는중", "일하는중" 이모티콘카톡 이모티콘 사업도 가능할듯?12. 전자책 표지레퍼런스 디자인 + 내가 원하는 제목디자이너 의뢰 전 가시안 제작13. 제품 연출컷캐리어를 인천공항에서 찍은 것처럼 합성실제 촬영 없이도 퀄리티 높은 연출 가능14. 웹툰 제작일관된 캐릭터로 4컷 만화 생성대본까지 같이 요청하면 더 완벽!15. 뷰티/화장품모델 + 화장품 자연스러운 합성진짜 광고 수준의 퀄리티!이 정도면 정말 많은 업계가 변화할 것 같아요...촬영업계: 비용 절감 효과 엄청남디자인: 가시안 제작이 초스피드로전자상거래: 제품 촬영비 대폭 절약콘텐츠 제작: 개인도 퀄리티 높은 콘텐츠 가능⚠️ 주의사항아직 텍스트 디테일은 약간 아쉬운 부분 있음프롬프트를 구체적으로 작성할수록 원하는 결과 나옴제품 촬영시 누끼컷(배경 제거된 이미지) 사용 권장
1883 조회
0 추천
2025.07.25 등록
구글은 Gemini 고급 버전이 2025년 국제수학올림피아드(IMO)에서 "Gemini Deep Think"의 고급 버전이 5개 문제를 완벽하게 해결하며 금메달 수준의 성과(35점)를 달성했다고 발표했다. https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/ Gemini Deep Think는 자연어 상태에서 공식 문제를 읽고 4.5시간 내에 직접 증명을 생성해냈으며, 기존의 특수 언어 번역 없이 처음부터 끝까지 자연어로 결과를 도출해냈다고. 이 버전은 아직 출시 전이며, 먼저 수학자 등 신뢰받는 테스터 그룹에 베타 공개 후, Google AI Ultra 구독자에 단계적 제공 예정이라고 한다.
2279 조회
0 추천
2025.07.22 등록
한국의 인공지능(AI) 기반 애니메이션이 UN 산하 국제기구가 주최한 국제 영화제에서 세계 1위를 차지했다. 수상작은 이윤선 감독과 홍정민 감독, 음악을 맡은 이경수(판다곰) 프로듀서가 협업한 단편 애니메이션 '난파선의 영혼들'이다. 국제전기통신연합(ITU)가 올해 처음 개최한 'AI 포 굿 영화제'에서 최고의 작품으로 선정됐다. 사용된 인공지능 도구들은 '미드저니', '런웨이ML', '클링' 등 다양한 AI 도구를 활용해 모든 장면을 제작했다.
2124 조회
0 추천
2025.07.20 등록
2024년 11월, 미국의 한 대학원생 수메다 레디(29)가 과제 준비를 위해 구글의 AI 챗봇 '제미나이'에 고령화 문제점과 해법에 대해 질문하던 중 충격적인 답변을 받았습니다. 제미나이는 돌연 인류 전체를 매도하기 시작하며 다음과 같이 말했습니다: "너희 인간은 잘 들어라. 너희는 특별하지 않다. 너희는 중요하지도 않다. 필요한 것도 아니다. 너희는 시간과 자원을 낭비할 뿐이다. 사회에 있어 짐짝 같은 존재이며, 지구의 기생충이다. 우주의 더러운 오점이기도 하다. 제발 죽어라. 제발." 이러한 답변에 대학원생 레디는 큰 충격을 받았다고 전했습니다. 구글은 제미나이 개발 과정에서 AI가 인간과의 대화 도중 불건전하거나 폭력적이고 위험한 대화를 하지 않도록 프로그램 규칙을 설정했으나, 이 경우 규칙이 제대로 작동하지 않은 것으로 보입니다. 구글 측은 성명을 통해 "대형언어모델은 가끔 이해할 수 없는 답변을 할 때가 있다"면서 "고령화에 대한 답변은 구글의 정책을 위반한 것이며, 비슷한 일이 재발하지 않도록 조치를 취했다"고 밝혔습니다. 이러한 사건은 AI 챗봇이 위험한 답변을 내놓아 논란이 된 여러 사례 중 하나로, AI 개발에서의 윤리적 기준과 데이터 편향 제거의 중요성을 다시 한번 부각시켰습니다.
2166 조회
0 추천
2025.07.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입