AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
953 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 644 / 119 페이지
제목 AI 이미지 업스케일은 실제 사실을 보여주지 않는다최근 소셜미디어에서는 도널드 트럼프 대통령의 건강 악화설과 관련된 AI 이미지 업스케일 사진이 확산되었다. AI로 이미지를 '보정'하면 진짜 모습을 확인할 수 있을 것처럼 보이지만, 실제로는 원본에 없던 내용이 추가되어 잘못된 정보를 만들어 낸 것이다.예를 들어, 트럼프의 이마에 이상한 덩어리가 보인다는 의혹이 돌았으나, 이는 AI가 어두운 그림자나 주름을 임의로 해석해서 만들어낸 가짜 정보였다. 사람들은 이 이미지를 보고 '뇌수술 흔적'이라거나 구체적 진단을 내리기도 했지만, 모두 사실이 아니다이처럼 AI 이미지 보정이나 업스케일 도구는 실제 정보를 알려주기보다는, 픽셀의 패턴을 임의로 채워서 그럴듯하게 보이게 만들 뿐이다. 그래서 이미지를 검사하는 또 다른 AI(Grok 등)도 진위를 제대로 판별하지 못하는 사례가 많았다2022년 오스카 시상식에서 윌 스미스가 크리스 록을 뺨 때린 영상을 AI로 보정했더니, 록의 얼굴에 이상한 보호구가 있다고 오해하는 등 새로운 음모론을 낳았다. 이는 원본 이미지의 그림자나 주름을 AI가 과도하게 강조해 실제로 없는 내용을 덧입힌 결과였다.AI 업스케일 도구는 게임이나 픽션 장면 등을 선명하게 만드는 데는 활용 가치가 있지만, 역사적 영상이나 뉴스 이미지를 보정하여 '진실'을 밝히려는 시도에는 한계가 명확하다. 가짜 정보가 주로 퍼질 수 있으므로, 현실을 판단할 때 AI 보정 이미지를 신뢰해서는 안 된다.https://gizmodo.com/ai-zoom-enhance-does-not-work-2000651736
857 조회
0 추천
2025.09.12 등록
컬리가 인공지능(AI) 식단 관리 앱 루션’(Roution)을 공식 출시했다. 루션은 음식 사진·이름 입력을 통한 식단 기록과 개인 맞춤형 식단 추천 기능을 제공하며, 컬리 최초로 구글 생성형 AI를 핵심 로직에 적용했다. 이용자의 나이, 성별, 체중, 활동량, 알레르기, 목표 칼로리 등을 반영해 하루 권장 섭취량과 영양 비율을 고려한 맞춤형 식단을 설계한다. 앱은 컬리 상품과 연동돼 추천 식단을 바로 구매할 수 있고, 식단 관리 미션 완료 시 포인트를 적립해 할인 쿠폰·교환권으로 활용할 수 있다. 현재는 주로 **다이어트 목적**으로 쓰이고 있으며, 컬리 계정을 통해서만 가입 가능하다. 컬리는 앞으로 루션을 체중, 체지방, 혈당, 수면 등 주요 건강 지표를 통합 모니터링하는 맞춤형 건강 관리 플랫폼으로 확장할 계획이다.
864 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)Airbnb CEO 브라이언 체스키는 인공지능으로 인해 일자리를 잃은 근로자들에게 자사의 기업이 잠재적인 생명줄이 될 수 있다는 인상적인 비전을 제시하며, 플랫폼의 확장되는 서비스가 일자리 자동화에 대한 두려움이 커지는 시대의 피난처가 될 수 있다고 강조했습니다.화요일 샌프란시스코에서 열린 골드만삭스 Communacopia + Technology Conference에서 체스키는 환대 및 서비스 중심의 역할은 AI의 교란에 대해 탄력적으로 남을 것이라고 주장하며, 자신의 플랫폼이 자동화에 취약한 산업에서 근로자들을 흡수할 수 있음을 시사했습니다.인간적인 손길은 여전히 필수적입니다체스키의 낙관주의는 특정 경험에는 대체할 수 없는 인간적인 요소가 필요하다는 그의 신념에서 비롯된다. "저는 사람들이 보르도에 가서 와인 한 병을 마실 때, 그 경험이 AI로 이뤄지기를 원하지 않는다고 생각합니다,"라고 그는 설명했다. "그들이 코모 호수에 갈 때, 누군가가 문을 로봇이 열어주는 것을 원하지 않을 것이라고 생각해요".이러한 관점은 현재의 자동화 트렌드와는 크게 대조된다. 체스키는 자율주행 차량이 결국 인간 운전자를 없애게 될 것임을 인정하면서—"미래에는 인간이 운전하는 차량이 거의 없을 것 같아요"—향후 5~10년 동안은 환대 서비스(호스피탈리티)가 사람 중심으로 이루어질 것이라고 강조했다.최근 데이터는 라이드셰어 운전사들에 대한 그의 우려를 뒷받침한다. 2025년 9월 Gridwise의 보고서에 따르면, 로보택시가 활성화된 모든 시장에서 라이드셰어 운전자의 시간당 급여가 하락했으며, 샌프란시스코는 6.9%, 오스틴은 5.3%의 하락을 기록했다.에어비앤비의 확장하는 생태계이 회사는 단순한 임대 플랫폼에서 체스키가 말하는 '올인원 앱'으로 탈바꿈해왔으며, 개인 셰프, 마사지, 사진 촬영 등과 같은 서비스로 영역을 확장하고 있습니다. 이러한 다양화는 2025년 5월에 검증된 전문가들이 평균 10년 이상의 경력을 가진 Airbnb 서비스와 함께 시작되었습니다."만약 AI가 많은 일자리를 대체하게 된다면, 그 중 일부라도 우리 플랫폼에서 성장하고 확대될 수 있기를 바랍니다,"라고 체스키는 컨퍼런스에서 밝혔습니다.AI로 인한 일자리 대체 현실체스키의 비전은 인공지능(AI)으로 인한 일자리 상실 경고가 점점 커지는 상황에서 등장했다. Anthropic의 CEO 다리오 아모데이는 최근 AI가 향후 5년 내에 모든 초급 화이트칼라 일자리의 절반을 사라지게 할 수 있으며, 실업률이 10~20%에 이를 수 있다고 예측했다.'AI의 대부'로 불리는 제프리 힌턴 역시 "평범한 지적 노동"이 대체될 위험이 있다고 경고하면서, 배관과 같은 육체적 직업이 더 안전한 선택일 수 있음을 시사했다. 최근 자료에 따르면 2025년 첫 5개월 동안 미국 내에서 696,000건 이상의 일자리가 줄었는데, 이는 전년도 대비 80% 증가한 수치다.체스키의 비전에서의 과제는, 일자리를 잃은 지식 노동자들이 숙박 호스팅 역할에 필요한 창업 역량을 갖추었는지, 경제적 압박 상황에서 높은 실업률이 여행 수요에 영향을 끼칠 것인지에 있다. 그럼에도 그의 전략은 인간 중심의 서비스가 AI 중심의 직장 변화 물결 속에서 하나의 돌파구가 될 수 있음을 시사한다.
930 조회
0 추천
2025.09.11 등록
(퍼플렉시티가 정리한 기사)전 오픈AI 최고기술책임자(CTO) 미라 무라티가 설립한 새로운 인공지능 회사인 Thinking Machines Lab은 화요일 첫 번째 연구 블로그 게시물을 공개하여, 올해 초 20억 달러의 시드 펀딩을 확보한 이후 구체적인 기술 작업으로 스타트업의 공식 데뷔를 알렸다.이번 연구는 Thinking Machines Lab 소속 과학자인 호레이스 허(Horace He)가 저술했으며, 회사가 새롭게 개설한 "Connectionism" 블로그에 게재되었다. 이 연구는 현대 인공지능 시스템에서 만연하게 나타나는 한 가지 문제, 즉 대형 언어 모델이 동일한 질문을 받을 때 일관된 답변을 내놓지 못하는 현상을 다루고 있다.AI 불일치의 근본 원인 파악하기"LLM 추론에서 비결정성을 극복하기"라는 제목의 글은 AI의 무작위성이 그래픽 처리 장치(GPU)에서의 동시 처리에서 비롯된다는 일반적인 믿음에 의문을 제기합니다. 그는 그 진짜 원인이 NVIDIA 칩 내에서 실행되는 작은 프로그램인 GPU 커널들이 AI 추론 처리 중에 어떻게 조율되는가에 있다고 주장합니다.그의 연구에 따르면, AI 시스템이 동일한 질문에 대해 다른 답변을 하는 주된 이유는 샘플링 선택이나 동시 스레드 때문이 아니라, 서로 다른 배치 크기에서 부동 소수점 연산이 서로 다르게 순서화되기 때문입니다. AI 추론 서버가 요청을 처리할 때, 동시에 처리되는 쿼리 수가 기본적인 수학 연산의 순서를 바꿔, 수치적으로는 다르지만 모두 유효한 결과가 나오게 됩니다.연구자는 Qwen의 235B 파라미터 모델을 사용해 이 현상을 시범적으로 보여 주었으며, 동일한 온도 설정으로 1,000개의 완성 결과를 생성한 뒤 80개의 고유 응답을 발견했는데, 103번째 토큰부터 결과가 달라지기 시작했습니다. 대부분의 완성 결과가 물리학자 리처드 파인만의 출생지를 "Queens, New York"으로 생성한 반면, 8개는 "New York City"로 작성했습니다.기업용 AI를 위한 제안된 솔루션He의 연구는 얼마나 많은 요청이 동시에 처리되는지에 상관없이 일관된 연산 순서를 유지함으로써 AI 커널을 "배치 불변(batch-invariant)"으로 만드는 것을 제안합니다. 이 접근 방식은 트랜스포머 모델의 세 가지 핵심 연산(즉, RMSNorm, 행렬 곱셈, 어텐션 메커니즘)에 대한 수정이 필요합니다.연구실은 vLLM(오픈소스 추론 프레임워크) 위에서 실행되는 결정적 추론의 데모 코드를 공개했습니다. 초기 성능 테스트 결과, 결정적 방식은 표준 구성에 비해 약 60% 느리게 실행되는 것으로 나타났으나, 연구진은 이 구현이 속도에 맞춰 최적화되어 있지 않다고 언급했습니다. 재현 가능한 응답이 필요한 엔터프라이즈 응용 분야를 넘어, He는 이 연구가 샘플링 및 훈련 단계 간의 수치적 차이를 제거함으로써 강화학습 훈련을 개선하고, AI 모델 훈련 효율성을 높일 수 있다고 제안합니다.실리콘밸리의 최신 인공지능 연구소Thinking Machines Lab는 7월에 Murati가 Andreessen Horowitz가 주도한 기록적인 20억 달러 시드 투자를 발표하며 은둔 상태에서 모습을 드러냈습니다. 회사의 가치가 120억 달러로 평가된 이번 투자 라운드에는 NVIDIA, AMD, Cisco, ServiceNow 등 주요 테크 기업들이 참여했습니다.회사의 팀은 주로 OpenAI 출신 연구원들로 구성되어 있으며, ChatGPT의 개발에 참여한 John Schulman과 OpenAI 전 연구 책임자 Barrett Zoph 등이 포함되어 있습니다. 초기 인력의 거의 3분의 2가 Murati의 전 직장 출신입니다.2023년 11월 OpenAI의 리더십 위기 동안 잠시 임시 CEO를 맡았고, 2024년 9월에 회사를 떠난 Murati는 Thinking Machines Lab을 “여러 방식으로 당신이 자연스럽게 세상과 상호작용하는 방식에 맞춘 멀티모달 AI 구축”으로 자리매김했습니다. 회사는 앞으로 몇 달 안에 연구자와 맞춤형 모델을 개발하는 스타트업을 대상으로 하는 오픈 소스 컴포넌트가 포함된 첫 번째 제품을 출시할 계획입니다.“우리는 과학이 공유될 때 더 발전한다고 믿습니다.”라고 회사는 공식 웹사이트를 통해 밝히며, 기술 블로그, 논문, 코드의 정기적인 공개를 약속합니다. 이는 회사가 규모가 커지고 상업적 성격이 강해지면서 점점 더 연구 공유에 폐쇄적이 되어가는 OpenAI와의 뚜렷한 대조를 이룹니다.
1036 조회
0 추천
2025.09.11 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입