Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 09.07 13:55
72 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 182 / 12 페이지
(퍼플렉시티가 정리한 기사입니다)구글의 최신 업데이트에서 돋보이는 기능은 Gemini 2.5 Flash Image로, 개발 코드명인 "Nano Banana"로 잘 알려져 있습니다. 구글 개발자 블로그에 따르면, 이 모델은 사용자가 간단한 텍스트 프롬프트만으로 이미지를 편집할 수 있게 하며, 인물의 일관성과 얼굴 세부 사항을 유지할 수 있습니다. 이 도구를 통해 여러 이미지를 혼합하거나, 배경을 변경하고, 옷을 수정하며, 심지어 연예인과 직접 만난 적 없이 셀피를 만들 수도 있습니다.TechCrunch에 따르면, "이 모델은 LMArena에서 'nano-banana'라는 익명 가명을 사용하여 사용자들에게 공개되었고, 곧 최첨단 이미지 편집기로 인정받게 되었습니다." 소셜 미디어 이용자들은 해당 도구의 사실적인 편집 능력을 극찬했으며, 한 튜토리얼에서는 자연스러운 결과로 셀피를 변화시키는 방법을 보여주었습니다.
113 조회
0 추천
09.05 등록
(퍼플렉시티에서 정리한 기사입니다.)알리바바는 경쟁이 치열한 AI 하드웨어 시장에 진출하며 신용카드 크기의 디바이스인 딩톡 A1 보이스 레코더를 출시했습니다. 이 제품은 미국 기반의 Plaud와 같은 기존 업체에 직접적으로 도전장을 내미는 제품으로, 8월 말 딩톡의 10주년 행사에서 공개되었고 9월 2일에 공식 출시되었습니다. 이번 출시로 중국의 기술 대기업인 알리바바가 처음으로 물리적 AI 하드웨어 시장에 본격적으로 진입하게 되었습니다.딩톡 A1은 499위안(약 70달러)과 799위안(약 112달러)의 두 가지 모델로 출시되었으며, 이는 플로드(Plaud)에서 새롭게 출시한 노트 프로(Note Pro)의 179달러에 비해 훨씬 저렴한 가격입니다. 이러한 공격적인 가격 전략은 중국의 제조 비용 우위, 특히 세계 전자제품의 약 90%를 생산하는 선전(Shenzhen)과 같은 전자 생산 허브에서 비롯된 것입니다.컨설팅 업체 런투(Runto)에 따르면, 중국의 AI 하드웨어 시장은 2025년 1.1조 위안(1,530억 달러) 규모에 이를 것으로 전망되며, 2030년에는 2.5조 위안으로 두 배 이상 성장할 것으로 예상됩니다. 이러한 빠른 성장세는 정부의 정책적 지원, 기술 자립에 대한 중국의 강한 의지, 그리고 전통 산업 전반에서의 AI의 광범위한 도입에 힘입은 것입니다.DingTalk A1은 알리바바의 Tongyi AI 연구소와의 협력을 통해 개발된 첨단 기술을 도입했습니다. 이 기기의 음성 전사 시스템은 1억 시간 이상의 오디오 콘텐츠로 훈련되어 100개 이상의 언어와 30개 중국 방언을 실시간으로 번역할 수 있습니다.2025년 3월, 스타트업 HHO를 창업한 뒤 플랫폼으로 복귀한 DingTalk의 CEO 첸항은 출시 행사에서 이 기기의 전문적인 기능을 강조했습니다. A1에는 6개의 마이크로 이루어진 배열과 골전도 기술이 탑재되어 있어, 8미터의 초장거리 오디오 픽업과 45시간 연속 녹음을 지원합니다. 3.8mm의 얇은 두께와 자석 부착 방식은 스마트폰이나 기타 표면에 쉽게 부착할 수 있을 만큼 휴대성을 높여줍니다.이 기기는 초기 물량이 매진되며 AI 통합 하드웨어에 대한 강한 소비자 수요를 알렸습니다. 이번 출시로 인해 이미 Mobvoi의 TicNote 녹음기와 같은 중국 경쟁업체뿐만 아니라 Plaud를 넘어선 국제 업체들까지 포함된 시장의 경쟁이 더욱 치열해지고 있습니다.업계 분석가들은 알리바바의 하드웨어 진출의 전략적 중요성에 주목합니다. Runto의 Liu Chuang은 예상되는 시장 성장과 함께 “복수의 플레이어가 공존하며 빠른 제품 사이클, 기능 경쟁, 그리고 AI 하드웨어 생태계의 혁신을 이끌 것으로 예상된다”고 밝혔습니다.딩톡 A1의 출시는 알리바바가 경영진이 역사적 성장 기회로 규정한 더 큰 AI 전략을 뒷받침하고 있습니다. 1분기 실적이 기대에 미치지 못했음에도 불구하고, 분석가들은 생성형 AI와 클라우드 인프라에서의 경쟁 우위 등 내재된 강점을 꼽았습니다. AI 하드웨어 진출은 독자적인 AI 칩과 오픈소스 프로젝트에 3년간 530억 달러를 투자한다는 알리바바의 계획과 부합하며, 이는 미국 공급 업체에 대한 의존도를 줄이고 지역 AI 생태계를 육성하는 데 목적이 있습니다.
123 조회
0 추천
09.05 등록
2025년 9월 3일, OpenAI의 ChatGPT가 전세계적으로 약 2시간 동안 서비스 장애를 겪었습니다. 이번 장애는 사용자들이 ChatGPT에 질문을 입력해도 응답이 표시되지 않는 문제로 시작되어, 수백만 명의 사용자가 접속 불가 상태에 빠졌습니다.OpenAI 공식 상태 페이지에 따르면 장애는 로그인, 웹, 모바일 앱, WhatsApp 연동, 음성 모드, 이미지 생성, 파일 업로드 등 총 23개 주요 구성 요소에 영향을 미쳤습니다. 회사는 "ChatGPT가 응답을 표시하지 않는 문제를 조사 중"이라고 발표하며, 근본 원인을 파악한 후 해결 작업에 착수했다고 밝혔습니다.이번 장애로 학업과 업무, 개인 프로젝트가 중단된 사용자들이 소셜미디어와 Downdetector에 대량의 불만을 제기했습니다. 일부 사용자들은 평소 ChatGPT에 의존하던 작업을 수동으로 처리해야 하는 상황에 직면했으며, "ChatGPT 없이는 일을 어떻게 해야 할지 모르겠다"는 반응을 보이기도 했습니다.흥미롭게도 이 같은 전세계적 AI 서비스 장애 사태는 한국 언론에서는 전혀 보도되지 않았습니다. 조선일보, 중앙일보, 한겨레 등 주요 언론사는 물론 네이버 뉴스에서도 관련 기사를 찾아볼 수 없었습니다. 이는 국내 언론이 해외 IT 서비스의 일시적 장애를 크게 다루지 않는 경향이나, 다른 국내 뉴스의 우선순위, 또는 한국 사용자들에게 미친 영향이 상대적으로 적었을 가능성을 시사합니다.장애 발생 당시 사용자들은 Google Gemini, Microsoft Copilot, Perplexity AI 등 대체 서비스로 이동했으며, OpenAI는 최근 몇 달간 반복되는 서비스 중단으로 인해 플랫폼 안정성에 대한 우려가 제기되고 있다고 보도되었습니다.
145 조회
0 추천
09.04 등록
SK AX는 4일 신한은행 생성형 인공지능(AI) 플랫폼 구축 사업에 착수했다고 밝혔다.SK AX가 생성형 AI를 기반으로 금융 조직에서 일하는 방식을 근본적으로 바꾸는 ‘금융 AX’혁신에 나선다. SK AX(사장 윤풍영, skax.co.kr)는 4일, ‘신한은행 생성형 AI플랫폼 구축 사업’에 착수했다고 밝혔다.이번 사업은 신한은행 전 직원이 손쉽게 AI를 활용할 수 있는 실질적인 업무 환경을 구현해,조직 전반에 걸쳐 일하는 방식을 AI중심으로 전환하는 데 목적이 있다. 단순히 일부 업무 자동화에 그치지 않고,금융 조직 전체 일하는 방식을 AI중심으로 재편하는 과정이다.예컨대 보고서 작성,고객 데이터 분석,내부 의사결정 지원 등 다양한 업무에서 생성형 AI가 실질적인 도구로 자리잡도록 지원한다.이번 사업 핵심은 SK텔레콤과 공동 개발한 기업용 AI플랫폼 ‘에이닷엑스(A.X)플랫폼’도입이다. 에이닷엑스 플랫폼은 다양한 사전 구축 AI모델을 업무 목적에 맞게 빠르게 최적화할 수 있는 ‘파인튜닝(Fine-tuning)’기능과,별도 개발 지식 없이 AI기능을 블록처럼 조립해 직접 서비스로 완성할 수 있는 ‘노코드 빌더’를 함께 제공한다. 이를 통해 신한은행 직원 누구나 본인 업무에 맞는 AI를 쉽게 만들고,직접 활용할 수 있는 실행 환경을 갖추게 된다.
129 조회
0 추천
09.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입