Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
884 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 570 / 107 페이지
(퍼플렉시티가 정리한 기사)국민 메신저 카카오톡에 오픈AI의 생성형 인공지능 챗GPT가 탑재될 예정이다. 카카오는 메신저 앱 이탈 없이 채팅 탭에서 직접 챗GPT를 사용할 수 있도록 하는 기능을 개발하고 있으며, 이는 지난 2월 시작된 카카오와 오픈AI 간 전략적 제휴의 첫 결과물이 될 전망이다카카오톡 채팅 탭에 챗GPT 아이콘 탑재업계 관계자들에 따르면, 카카오는 카카오톡의 채팅 탭에 챗GPT 아이콘을 탑재하는 방식으로 서비스를 구현할 계획이다. 이용자가 별도 앱을 실행하지 않고도 카카오톡 내에서 특정 버튼을 클릭해 즉시 챗GPT와 대화할 수 있게 된다. 카카오는 또한 카카오톡 채팅방의 '샵(#) 검색' 기능에서도 챗GPT를 활용할 수 있는 방안을 검토 중인 것으로 알려졌다.정신아 카카오 대표는 지난 8월 2분기 실적발표에서 "그동안 AI 서비스 경험이 없던 이용자도 친구와 채팅 중 챗GPT 검색 결과를 공유받거나 하루에도 수십 번 접속하는 핵심 지면에서 챗GPT와 마주하면 자연스럽게 관심을 가질 것"이라고 설명했다.9월 23일 '이프 카카오'에서 공식 발표카카오는 오는 9월 23일부터 25일까지 경기도 용인 카카오 AI 캠퍼스에서 개최되는 연례 개발자 컨퍼런스 '이프 카카오25'에서 오픈AI와의 협업 결과물을 처음 공개할 예정이다. 컨퍼런스 첫날 정신아 대표가 카카오톡 개편과 신규 AI 서비스, 오픈AI 공동 프로덕트를 발표할 계획이다.정 대표는 "이프 카카오에서 오픈AI와 협업한 실제 제품 형상을 공개할 예정"이라며 "늦어도 다음 실적 발표 전에는 모두가 제품을 사용할 수 있을 것"이라고 예고했다. 이에 따라 카카오톡의 챗GPT 탑재는 빠르면 11월 전에 이용자들이 사용할 수 있을 것으로 전망된다.오픈AI 한국 법인 설립과 시너지이번 협업은 오픈AI의 한국 진출과도 맞물려 있다. 오픈AI는 지난 5월 한국 법인 설립을 공식 발표했으며, 오는 10일 한국 사무소 공식 출범을 앞두고 있다. 오픈AI 한국 법인은 서울 강남구 테헤란로에 설치되며, 전 세계 12번째, 아시아에서는 세 번째 거점이다.한국은 챗GPT 유료 구독자 수 기준으로 미국에 이어 전 세계 2위를 기록하고 있으며, 국내 월간 활성 이용자가 2000만 명을 넘어서는 등 오픈AI에게 중요한 시장으로 평가받고 있다. 카카오의 월간 활성 이용자는 4930만 명에 달해, 오픈AI는 이번 협력을 통해 한국 시장에서의 영향력을 크게 확대할 수 있을 것으로 기대한다.카카오 관계자는 "오픈AI와의 협업 프로젝트의 구체적인 형상 일부를 이번 이프카카오에서 공개할 예정"이라며 "구체적인 내용은 아직 확인해주기 어렵다"고 밝혔다.
912 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사)워싱턴 주립대학교 연구진은 숨겨진 과일을 드러내기 위해 새로운 공기 분사 시스템을 사용하는 AI 기반 로봇 딸기 수확기를 개발하여, 200억 달러 규모의 도전적인 딸기 시장에서 농업 자동화의 중요한 돌파구를 마련했습니다.이 로봇은 7월에 Computers and Electronics in Agriculture에 게재된 연구에서 자세히 소개되었으며, 기계적인 잎 조작 대신 공기 흐름을 활용한 로봇 딸기 수확의 최초 야외 현장 규모 시연을 보여줍니다. 이 시스템은 인공지능 비전 기술과 부드러운 실리콘 그립퍼, 그리고 관을 통해 일정한 공기 흐름을 불어넣어 잎을 부드럽게 옆으로 옮기는 팬을 결합합니다.혁신으로 노동력 부족 해결하기딸기 산업이 심각한 노동력 부족에 직면하면서 비용이 증가하고 수확이 제한될 수 있다는 점에서 이 혁신이 등장했습니다. Technology Networks에 따르면, 200억 달러 규모의 딸기 시장은 앞으로 10년 동안 연평균 6% 성장할 것으로 예상되어 자동화 솔루션이 점점 더 중요해지고 있습니다.연구 팀은 WSU에서 박사 학위를 마친 후 덴마크의 오르후스 대학교에 합류한 Zixuan He가 이끌었으며, WSU에서 근무하다 현재는 코넬 대학교에 있는 Manoj Karkee, 그리고 WSU의 정밀 및 자동화 농업 시스템 센터의 전임 교수이자 전임 이사인 Qin Zhang도 포함되어 있습니다.기술적 성과 및 결과실험실 및 현장 실험 결과, 수확기는 평균적으로 80%의 정확도로 딸기를 올바르게 감지했으며, 딸기가 숨겨져 있는지를 93%의 정확도로 분류했습니다. 공기 시스템은 효율성에 있어 매우 중요한 역할을 했습니다. 팬이 없을 때 로봇은 익은 과일의 58%를 수확했지만, 팬 시스템을 사용할 경우 수확률이 74%로 향상되었습니다.이 로봇은 색상과 깊이 이미지를 모두 포착하는 3D 카메라 시스템을 사용합니다. "과일의 특성 정보를 깊이 정보와 맞춘 후 머신러닝 모델을 활용해 딸기를 찾아내고, 그 위치를 파악할 수 있습니다," 라고 그는 설명했습니다.상업적 실현 가능성의 도전과제유망한 결과에도 불구하고, 상업적 배치를 위해서는 여전히 과제가 남아 있습니다. 현재 이 시스템은 팬 시스템을 사용하여 딸기를 식별하고 수확하는 데 평균 20초가 걸리며, 현장에서의 실용성을 위해서는 속도 개선이 필요함을 나타냅니다.그는 이러한 기술이 가까운 미래에 인간 노동자를 완전히 대체할 가능성은 낮다고 언급했습니다. "지금으로서는 수작업을 완전히 대체하지는 못하지만, 현장에 충분한 인력이 없을 때 매우 유망한 보조 수단이 될 수 있습니다,"라고 그는 말했습니다.팬 시스템 기술은 딸기뿐만 아니라, 포도와 같이 가려짐 문제를 겪는 다른 농작물에도 적용되어 그 농업적 활용 범위를 확장시킬 수 있을 가능성이 있습니다.
933 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사)OpenAI는 2026년 중반까지 AI 기반 채용 플랫폼을 출시할 계획을 발표하며, 핵심 ChatGPT 제품을 넘어 사업을 확장함에 따라 회사가 LinkedIn과 직접 경쟁하게 될 것이라고 밝혔습니다. 또한 회사는 OpenAI 아카데미를 통해 종합적인 AI 인증 프로그램을 공개했고, 소매업계 대기업 Walmart 등과 협력하여 2030년까지 1천만 명의 미국인을 인증하겠다는 야심찬 목표를 제시했습니다.링크드인에 도전하는 구인 플랫폼2026년 중반에 출시될 것으로 예상되는 OpenAI 채용 플랫폼은 인공지능을 활용해 AI 관련 기술을 보유한 구직자와 채용 기업을 연결할 예정입니다. OpenAI 애플리케이션 부문 CEO인 피지 시모(Fidji Simo)는 이 플랫폼이 "기업이 원하는 것과 구직자가 제공할 수 있는 것 사이에서 완벽한 매치를 AI로 찾아낸다"고 밝혔습니다.이 플랫폼은 Reid Hoffman이 공동 창업한 링크드인(LinkedIn)에 대한 두드러진 도전장을 내밀고 있습니다. Reid Hoffman은 OpenAI의 초기 투자자이자 2023년 3월까지 이사회 멤버로 활동했습니다. Hoffman은 그의 AI 투자 활동(Greylock Partners와 Inflection AI 설립)을 통한 이해충돌을 피하기 위해 이사회에서 물러났습니다.이 채용 플랫폼은 AI 인재를 찾는 소규모 기업과 지방 정부를 위한 전용 트랙도 포함할 예정입니다. 텍사스 비즈니스 협회는 이 플랫폼을 활용해 수천 명의 텍사스 고용주들이 운영을 현대화할 수 있도록 도울 구직자를 연결할 계획입니다.인증 프로그램이 주요 파트너들과 함께 시작됩니다OpenAI는 기존에 200만 명 이상의 학습자를 지원한 OpenAI Academy를 넘어, 2025년 말 인증 프로그램을 시범 도입할 계획입니다. 해당 인증은 기업 내 기본적인 AI 활용부터 고급 프롬프트 엔지니어링까지 다양한 수준의 AI 이해도를 다룰 예정입니다.세계 최대의 민간 고용주인 월마트는 이번 인증 프로그램의 주요 출시 파트너입니다. 월마트 미국 CEO인 John Furner는 “월마트에서는 소매의 미래가 기술만으로 정의되지 않을 것임을, 기술을 어떻게 활용하는지 아는 사람들이 미래를 정의할 것임을 알고 있습니다.”라고 밝혔습니다.해당 인증 프로그램을 통해 사용자는 ChatGPT의 학습 모드에서 직접 인증을 준비할 수 있으며, 기업은 이를 사내 교육 프로그램에 통합할 수 있습니다. OpenAI는 AI 활용 능력 확대를 위한 백악관 이니셔티브에 부응해, 2030년까지 1천만 명의 미국인에게 인증을 제공하겠다고 약속했습니다.AI로 인한 혼란 우려 대응이 발표는 AI가 고용에 미치는 영향에 대한 우려가 커지는 가운데 나왔다. 앤트로픽의 CEO 다리오 아모데이는 AI가 2030년까지 초급 사무직의 최대 50%를 없앨 수 있다고 언급했다. 시모는 자신의 블로그 포스트에서 이러한 혼란을 인정하며, 오픈AI가 "그 혼란을 완전히 없앨 수는 없지만," 사람들이 AI에 능통해지고 고용주와 연결될 수 있도록 도울 수 있다고 밝혔다.이러한 이니셔티브는 인스타카트에서 합류한 시모의 지휘 아래 오픈AI의 전반적인 확장과도 맞물려 있다. CEO 샘 알트만은 시모가 ChatGPT를 넘어 브라우저나 소셜 미디어 앱을 포함한 다양한 애플리케이션을 감독할 것이라고 말했다. 최근 이 회사는 애플리케이션 팀을 지원하기 위해 제품 분석 회사 Statsig를 11억 달러에 인수했다.이 프로그램들은 오픈AI가 AI 인재 확보를 위한 치열한 경쟁에 직면한 가운데 시작된다. CEO 샘 알트만은 이전에 메타가 연구원들을 유인하기 위해 막대한 서명 보너스를 제공했다고 비판한 바 있다. 오픈AI는 2024년 약 37억 달러의 수익에도 불구하고 50억 달러의 상당한 손실을 낼 것으로 추산되는 등, 큰 적자를 내며 운영을 이어가고 있다.
973 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사)스위스는 자국 최초의 완전 오픈소스 다국어 대형 언어 모델인 Apertus를 공개하며, 프라이버시를 중시하고 투명성과 규제 준수를 위해 구축된 대안을 통해 알프스 국가가 미국과 중국의 AI 지배에 도전하는 입지를 다졌습니다. 9월 2일 발표는 전 세계 AI 경쟁에서 중요한 이정표로, 스위스가 독립적인 AI 인프라를 추구하는 세계적 움직임에 동참했음을 의미합니다.Apertus는 스위스 로잔연방공과대학교(EPFL), 취리히연방공과대학교(ETH Zurich), 그리고 스위스국립슈퍼컴퓨팅센터(CSCS) 간의 협력을 통해 개발되었으며, 자체 개발 과정 전체를 대중에게 공개함으로써 ChatGPT나 Claude와 같은 독점 시스템과 차별화됩니다. 모델의 이름은 라틴어 '오픈(open)'에서 유래했으며, 구조, 학습 데이터, 모델 가중치, 그리고 중간 체크포인트까지 투명성을 강조하는 의지를 반영합니다.기술 사양 및 다국어 중심Apertus는 두 가지 버전—80억 매개변수와 700억 매개변수—로 제공되며, 1,000개 이상의 언어에서 15조 개의 토큰으로 학습되었습니다. 특히, 학습 데이터의 40%는 비영어권 언어로, 소외된 언어인 스위스 독일어와 스위스의 4대 공용어 중 하나인 로만슈어 등이 포함되어 있습니다. 이러한 다국어 접근 방식은 보통 영어 콘텐츠에 우선순위를 두는 주요 상업용 모델과 Apertus를 차별화시키는 요소입니다.이 모델은 루가노에 위치한 알프스 슈퍼컴퓨터에서 1천만 시간 이상의 GPU를 사용하여, 탄소 중립 전기로 학습되었습니다. 독점 대안들과 달리 Apertus는 연구자와 기관이 자체 서버로 모델을 다운로드하여 데이터에 대한 통제권을 유지할 수 있게 해주며, 이는 개인정보 보호를 중시하는 기관에 중요한 고려 사항입니다.프라이버시 우선 설계 및 규제 준수스위스 연구진은 Apertus가 스위스 데이터 보호법과 유럽연합 AI 법의 요구사항을 충족하도록 처음부터 설계되었다고 강조했다. 학습 데이터는 공개적으로 이용 가능한 데이터만 사용하며, 웹사이트의 기계 판독 opt-out 요청을 존중하고 개인정보를 제거할 수 있도록 필터링된다. 이러한 접근 방식은 다른 AI 시스템에서 문제가 되었던 저작권 침해와 무단 데이터 스크래핑에 대한 우려를 해소한다."신뢰할 수 있고 자주적이며 포용적인 AI 모델이 어떻게 개발될 수 있는지에 대한 청사진을 제공하는 것이 우리의 목표입니다."라고 EPFL의 머신 러닝 교수이자 Swiss AI Initiative의 운영위원회 위원인 Martin Jaggi가 말했다. 투명성에 대한 강조는 대중의 신뢰를 고취하고 AI 기술의 잠재적 위험에 대한 우려를 해소하려는 목적이다.업계 반응 및 경쟁스위스 은행업계는 아페르투스(Apertus)에 대해 신중한 낙관론을 나타냈으며, 스위스 은행가 협회는 특히 엄격한 데이터 보호 및 은행 비밀 준수 요건을 감안할 때 금융 산업에 "장기적으로 큰 잠재력"이 있다고 평가했습니다. 하지만 UBS와 같은 주요 스위스 금융기관들은 이미 다른 플랫폼을 활용하여 AI 솔루션을 도입하고 있습니다. 예를 들어, UBS는 최근 마이크로소프트와 협력하여 자사 자산관리 업무에 Azure AI 서비스와 OpenAI 기술을 도입했습니다.AI 플랫폼 허깅페이스(Hugging Face) 연구 책임자인 레안드로 폰 베라(Leandro von Werra)는 아페르투스를 "지금까지 가장 야심찬 오픈소스 모델 중 하나"라고 평했으며, 그 규모와 연산 요구사항으로 볼 때 "오픈 모델에서 확실히 새로운 이정표"라고 평가했습니다. 이 모델은 허깅페이스와 스위스콤(Swisscom)의 독립적인 스위스 AI 플랫폼 등 다양한 채널을 통해 제공됩니다.기술적 성취에도 불구하고 아페르투스는 상당한 상업적 도전에 직면해 있습니다. 스위스 산업 그룹 스위스멤(Swissmem)은 자국 내 LLM이 유럽 데이터 규제 준수를 통해 현지 기업에 더 적합할 수 있지만, "경험상 모든 요구에 부합하는 단일 솔루션은 없다"고 인정했으며, 일부 기업들은 국제 대안을 계속 사용할 가능성이 높다고 덧붙였습니다.이 출시는 개발자들이 모델의 기능을 테스트하고 향후 개선을 위한 피드백을 제공하는 스위스 AI 위크 해커톤(Swiss AI Weeks hackathons)과 시기적으로 맞물려 진행되고 있습니다. 연구진은 프로젝트의 핵심 원칙인 투명성과 공공 접근성을 유지하면서, 의료, 법률, 기후 과학, 교육 등 특화 분야별 버전을 개발할 계획입니다.
988 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입