Loading...

AI 뉴스

AI가 비디오에서 사회적 단서를 읽는 능력에서 인간과 대등

페이지 정보

작성자 xtalfi
작성일 2025.09.07 13:55
1,301 조회
0 추천
0 비추천

본문

99fb057b7ae0e41651d797c6708c91995P0F.jpg

(퍼플렉시티가 정리한 기사)

 

핀란드 투르쿠 대학교의 획기적인 연구에 따르면, 인공지능은 인간의 사회적 상호작용을 해석하는 데 있어 새로운 이정표에 도달했으며, 이미지와 비디오에서 복잡한 사회적 행동을 평가하는 정확도 면에서 인간 평가자와 맞먹는 수준에 이르렀다.

이 연구는 9월 4일 Imaging Neuroscience 학술지에 게재되었으며, AI가 미묘한 사회적 신호를 이해하는 능력에 대해 지금까지 가장 포괄적인 평가를 제공한다. 투르쿠 PET 센터의 연구진은 ChatGPT와 GPT-4V를 138개의 다양한 사회적 특성에 걸쳐 시험했으며, AI의 평가를 2,000명 이상의 인간 참가자들의 평가와 비교했다.

투르쿠 대학교의 박사후 연구원인 세베리 산타비르타(Severi Santavirta)는 "ChatGPT의 사회 특성 평가가 평균적으로 한 명의 참가자보다 더 일관적이었기 때문에, AI의 평가 결과는 한 사람이 내린 판단보다 오히려 더 신뢰할 수 있다"고 말했다. 이 AI는 얼굴 표정과 몸짓부터 협력과 적대감 같은 복잡한 상호작용 역학에 이르기까지 다양한 사회적 특성을 파악하는 데 놀라운 일관성을 보였다.

 

신경 수준의 검증이 AI의 사회적 지능을 확인하다

핀란드 연구팀은 행동 비교를 넘어, AI의 사회적 지각이 인간의 뇌 활동 패턴과 일치하는지를 조사했습니다. 97명의 참가자가 사회적으로 풍부한 영상 클립을 시청하는 동안 기능적 MRI 데이터를 이용해 연구진은 GPT-4V의 평가가 인간 주석과 거의 동일한 뇌 활성화 지도를 생성한다는 사실을 발견했습니다.

AI와 인간이 생성한 뇌 지도 간의 상관관계는 0.95에 이르렀으며, 여기에는 상측두고랑, 측두두정접합부, 방추상회 등 핵심적인 사회 지각 네트워크가 포함되었습니다. 이러한 신경학적 검증은 AI 모델이 인간이 사회 정보를 처리할 때 사용하는 것과 유사한 표상 구조에 접근하고 있을 가능성을 시사합니다.

연구의 방법론에는 할리우드 영화에서 추출된 468장의 정적 이미지와 234개의 짧은 영상 장면을 분석하는 것이 포함됐으며, AI 시스템은 "웃기"나 "누군가를 만지기" 같은 구체적 행동부터 "지배적", "공감적"과 같은 추상적 특성까지 평가했습니다. AI와 인간 평가 간의 상관관계는 이미지와 영상 모두에서 0.79에 달해, 개별 인간 참가자 간에서 보이는 신뢰도에 근접한 수준이었습니다.

 

산업 전반에 걸친 혁신적인 응용

연구 결과는 여러 분야에서 현실 세계의 응용 가능성을 크게 열어줍니다. 의료 분야에서는 AI가 지속적인 비디오 분석을 통해 환자의 건강 상태를 모니터링하고, 스트레스 신호나 행동 변화를 감지하여 의료상의 문제를 확인할 수도 있습니다. 이러한 기술은 피로 없이 24시간 작동할 수 있기 때문에 환자 모니터링 시스템에서 특히 가치가 큽니다.

또한, 보안 응용 분야는 또 다른 중요한 기회를 제공합니다. AI 시스템은 잠재적으로 감시 영상에서 의심스러운 행동을 식별하거나 갈등을 예측할 수 있습니다. 이 기술은 비디오 통화에서 감정적 신호를 분석하여 고객 서비스를 강화하고, 기업이 고객의 요구와 반응을 더 잘 이해하는 데에도 사용할 수 있습니다.

산타비르타에 따르면, 효율성 향상은 상당하다고 합니다. "인간 평가를 수집하는 데 2,000명 이상의 참가자와 총 10,000시간 이상의 작업 시간이 필요했지만, ChatGPT는 동일한 평가를 단 몇 시간 만에 산출했습니다".

 

제한사항 및 향후 고려사항

이러한 발전에도 불구하고, 연구는 중요한 한계점을 드러냈습니다. AI가 개별 인간 평가자들과는 비슷한 수준을 보였지만, 집단적 인간 판단이 여전히 AI 평가보다 더 정확했습니다. 또한, AI와 인간 평가자들 간의 일관성이 약하게 나타난 사회적 특징들도 있었는데, 특히 ‘누군가를 괴롭히는 행동’과 같은 복잡한 행동이나 ‘평온함을 느끼는’ 등 감정 상태에서 그러했습니다.

연구는 또한 현재의 AI 모델들이 인간의 사회적 인식에 존재하는 세밀한 요소 중 일부를 아직 포착하지 못한다는 점을 강조했습니다. 그럼에도 불구하고, AI는 수십 년간 사회 심리학에서 인정받아 온 사회적 이해의 주요 차원들은 성공적으로 반영했습니다.

AI 기술이 계속 발전함에 따라, 최근 공개된 GPT-5와 같은 모델들이 더 향상된 기능을 약속하고 있습니다. 이러한 변화 속에서 인간의 사회적 행동을 이해하고 해석하는 능력은 인간과 AI 간의 상호작용 시스템을 한층 정교하게 만들 수 있는 중요한 단계로, 행동 연구와 산업 전반에 걸친 사회적 모니터링 방식을 변화시킬 수 있을 것입니다.

댓글 0
전체 1,021 / 32 페이지
(퍼플렉시티가정리한기사)AI챗봇'클로드(Claude)'운영사앤트로픽이12일(현지시간)미국내AI인프라에500억달러(약73조원)를투자한다고발표했다.텍사스주와뉴욕주에맞춤형데이터센터를건설하며,첫시설은2026년가동을목표로한다.​앤트로픽은AI클라우드플랫폼플루이드스택(Fluidstack)과협력해데이터센터를구축할예정이다.플루이드스택은이미메타,미드저니,미스트랄등에대규모그래픽처리장치(GPU)클러스터를공급하고있다.​일자리창출과트럼프정책부응이번투자로약800개의정규직일자리와2,400개이상의건설일자리가창출될것으로전망된다.정규직의평균급여는약14만4,000달러에달할것으로예상된다.​앤트로픽은이번계획이"미국의AI리더십을유지하고미국내기술인프라를강화하기위한도널드트럼프행정부의AI실행계획목표달성에기여할것"이라고강조했다.다리오아모데이최고경영자(CEO)는"과학발견을가속화하고이전에는불가능했던방식으로복잡한문제를돕는AI에점점더가까워지고있다"며"이런잠재력을실현하려면개발을지속지원할수있는인프라가필요하다"고말했다.​빅테크AI인프라투자경쟁앤트로픽의투자는빅테크기업들의미국내AI인프라투자경쟁이가속화되는가운데나왔다.오픈AI는소프트뱅크,오라클과함께5,000억달러규모의'스타게이트'프로젝트를통해미국전역에데이터센터를건설하고있다.메타는6,000억달러이상을2028년까지미국AI기술,인프라,인력확장에투자할계획이다.​아마존은앤트로픽에총80억달러를투자했으며,현재그지분가치는138억달러로평가된다.앤트로픽은현재30만개이상의기업고객을확보하고있으며,10만달러이상의연간매출을대표하는대형고객수는지난1년간거의7배증가했다.
26 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)OpenAI는오늘GPT-5.1을출시하며,ChatGPT를더욱대화적이고지능적으로만들고사용자에게성격에대한전례없는제어권을제공하는것을목표로하는두가지업그레이드된모델을선보였습니다.​11월12일부터유료구독자들에게배포되기시작한이번업데이트는GPT-5.1Instant와GPT-5.1Thinking을제공하며,두모델모두8월에출시된초기GPT-5를괴롭혔던사용자불만을해결하기위해설계되었습니다.OpenAI는GPT-5.1Instant가"기본적으로더따뜻하고더대화적"이라고밝혔으며,초기테스터들은이모델이"명확하고유용함을유지하면서도재미있는면으로종종사람들을놀라게한다"고언급했습니다.​이번출시는OpenAI의GPT-5출시가광범위한반발을일으킨지3개월만에이루어졌습니다.당시사용자들은모델의"더차가운"어조와GPT-4o와같은사랑받던레거시모델의갑작스러운제거를비판했습니다.OpenAICEO샘알트먼은당시GPT-4o를중단한것이"실수였다"고인정하며,회사가특정모델에대한사용자들의"감정적애착"을과소평가했다고시인했습니다.​적응적추론과더나은성능GPT-5.1Instant는적응형추론기능을도입하여모델이어려운질문에대해"답변하기전에생각할지"여부를스스로결정할수있도록합니다.OpenAI에따르면,이로인해AIME2025및Codeforces를비롯한수학및코딩벤치마크에서상당한향상이이루어졌습니다.또한,모델의지시사항준수능력도향상되었습니다.OpenAI에서제공한예시에서,정확히여섯단어로답하라는요청에GPT-5.1은정확히따르지만GPT-5는동일한테스트에서실패했습니다.​GPT-5.1의사고과정은작업의복잡성에따라처리시간을조정하며,어려운문제에는더많은시간을투자하고,더단순한질문에는더빠르게응답합니다.이제모델은"전문용어와정의되지않은용어를줄여"더명확한설명을제공하여기술업무에더욱접근하기쉬워졌습니다.​확장된개인화옵션모델업그레이드와함께OpenAI는6가지새로운성격프리셋을도입했습니다:Default,Professional,Friendly,Candid,Quirky,Efficient가기존의Nerdy및Cynical옵션에추가되었습니다.OpenAI의애플리케이션CEO인FidjiSimo는"많은사용자들이GPT-5.1이IQ와EQ를통합하는데뛰어나다는것을발견할것으로믿지만,단일기본설정으로는모든사람의선호도를수용할수없습니다"라고말했습니다.​사용자는응답간결성,따뜻함,이모지빈도를포함한세부제어기능도조정할수있습니다.OpenAI는ChatGPT가대화중에톤조정을능동적으로제안할수있는기능을테스트하고있습니다.​출시는Pro,Plus,Go,Business플랜의유료사용자부터시작되며,무료사용자는며칠내에액세스권한을얻게됩니다.두모델모두이번주후반에API를통해제공되며,GPT-5.1Instant는gpt-5.1-chat-latest로액세스할수있습니다.레거시GPT-5모델은3개월동안계속사용할수있으며,이는사전경고없이모델을폐기했던OpenAI의이전접근방식에서벗어난변화를나타냅니다.
27 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)테슬라코리아가12일공식엑스(X,옛트위터)계정을통해완전자율주행(FSD·FullSelf-Driving)감독형서비스를한국에곧출시한다고밝혔다.테슬라가한국내FSD서비스출시계획을공식적으로밝힌것은이번이처음이다.​테슬라코리아는"FSD감독형,다음목적지:한국,곧출시(ComingSoon)"라는게시물과함께서울도심에서FSD로자율주행하는영상을공개했다.영상에는운전자가핸들에서손을떼거나가볍게올려둔채로차량이스스로차선을변경하고주차하는모습이담겼다.​아시아주요시장중최초도입테슬라의FSD는현재미국,캐나다,멕시코,중국,호주,뉴질랜드에서서비스중이다.한국은중국에이어아시아주요국가로는두번째FSD도입국이될전망이다.최근일본에서도FSD시험주행이시작됐다.​감독형FSD는차량이가속,제동,핸들링등운전결정의대부분을독자적으로수행하지만,운전자는항상전방을주시하고비상상황에서개입할준비가돼있어야한다.테슬라코리아는영상에서"감독형FSD는완전한자율주행기능이아니며모든장애물,도로,교통상황을완벽히인식하지못할수있어운전자는항상주의를유지하고즉시제어할준비가되어있어야한다"고밝혔다.​정부규제와안전성논란국토교통부는지난해부터테슬라FSD도입에대해"특별히제한을두지않겠다"는입장을밝혀왔다.올해3월에는"테슬라가자기인증제도를활용해국내에서완전자율주행기능을적용할수있다"고밝히며제도적문턱을낮췄다.​한편미국도로교통안전국(NHTSA)은지난10월부터약290만대의테슬라FSD차량을대상으로신호위반,역주행등교통법규위반의혹에대한전면조사를진행중이다.테슬라측은FSD가53억마일주행중55건의위반을기록해미국평균운전자대비200배이상안전하다고주장하고있다.​테슬라코리아는FSD옵션가격을904만원으로책정했다.기존테슬라차량중FSD용'하드웨어3.0'이상을탑재한모델은소프트웨어업그레이드를통해이용할수있다.테슬라는올해1~10월국내에서4만7962대를판매해BMW,메르세데스-벤츠에이어수입차브랜드3위를차지하고있다.
25 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)DeductiveAI는화요일750만달러의시드펀딩을받으며스텔스모드에서벗어났으며,소프트웨어엔지니어링의가장고질적인문제중하나에대한솔루션을제시했습니다.엔지니어들이새로운제품을구축하는대신버그를찾는데거의절반의시간을소비하는문제입니다.Databricks와ThoughtSpot출신의베테랑들이설립한이마운틴뷰스타트업은게임AI시스템을구동하는것과유사한강화학습기술을사용하여몇시간이아닌몇분만에프로덕션장애를진단하는AI에이전트를배포합니다.​이번펀딩라운드는CRV가주도했으며,DatabricksVentures,ThomvestVentures,PrimeSet이참여했습니다.회사는실제사고로부터학습하여장애를자동으로감지하고,근본원인을진단하며,엔지니어가소프트웨어문제를해결하도록돕는"AISRE에이전트"를도입하고있습니다.이기능은사고해결시간을최대90퍼센트까지단축할수있다고회사는밝혔습니다.​AI가더많은코드를생성하면서증가하는문제를목표로삼다이러한시기는소프트웨어개발에서증가하는긴장감을반영합니다.AI코딩어시스턴트가엔지니어들이그어느때보다빠르게코드를작성할수있도록지원하는동안,연구에따르면개발자들은시간의30~50%를디버깅에소비하며,AI생성코드가확산되면서이수치는증가하기만했습니다.Harness의2025년보고서에따르면개발자의67%가AI생성코드를디버깅하는데더많은시간을할애하고있습니다.​DeductiveAI의공동창업자이자CEO인RakeshKothari는VentureBeat와의인터뷰에서"우리는세계적수준의엔지니어들이구축하는대신시간의절반을디버깅에소비하는것을목격했습니다"라고말했습니다."그리고바이브코딩이전례없는속도로새로운코드를생성함에따라,이문제는더욱악화될것입니다."​이회사는이미여러주목할만한고객사에서실제영향력을입증했습니다.DoorDash의광고플랫폼은Deductive를사고대응프로토콜에통합했으며,DoorDash의엔지니어링수석이사인ShahroozAnsari에따르면이시스템이최근몇달동안약100건의프로덕션사고에대한근본원인을식별했으며,이는연간1,000시간이상의생산성절감과수백만달러상당의수익영향으로환산된다고합니다.위치인텔리전스기업Foursquare에서Deductive는ApacheSpark작업실패를진단하는데필요한시간을90%단축하여수시간또는며칠에서10분미만으로줄였으며,연간275,000달러이상의비용절감효과를가져왔습니다.​기술작동방식Deductive의기술적접근방식은Datadog이나NewRelic과같은기존옵저버빌리티플랫폼에추가되는AI기능들과차별화됩니다.이시스템은코드베이스,로그,메트릭,트레이스,내부문서간의관계를매핑하는'지식그래프'를구축합니다.인시던트가발생하면여러AI에이전트가함께협력하여가설을생성하고,이를실시간시스템증거와대조하며,근본원인에수렴합니다—숙련된사이트신뢰성엔지니어가조사하는방식을모방하지만훨씬짧은시간에작업을완료합니다.​플랫폼은기존인프라와읽기전용API를통해옵저버빌리티플랫폼,코드저장소,인시던트관리도구,커뮤니케이션시스템에연결됩니다.강화학습을활용하여지속적으로개선하며,각인시던트에서어떤조사액션이정확한진단으로이어졌는지학습합니다.​공동창립자이자CTO인SameerAgarwal은UCBerkeley에서BlinkDB라는근사쿼리처리프레임워크를개발하며박사학위를받았고,ApacheSpark를구축한초창기Databricks엔지니어중한명이었습니다.Kothari는ThoughtSpot의초기엔지니어로,분산쿼리처리와대규모시스템최적화에집중하는팀을리드했습니다.​"현대인프라의복잡성과상호의존성으로인해장애나인시던트의근본원인을조사하는일은마치건초더미에서바늘을찾는것같습니다.단,그건초더미는축구장크기이고,백만개의다른바늘로만들어졌으며,끊임없이재배열되며불타고있습니다,"라고Agarwal은성명에서밝혔습니다.​기술적으로는프로덕션환경에서바로수정작업을자동화할수있지만,현재회사는엔지니어가검증하고구현할수있도록구체적솔루션을추천하며사람의개입을유지하고있습니다.회사는데이터볼륨이아니라조사된인시던트수를기준으로가격을산정하며,클라우드호스팅과셀프호스팅배포옵션을모두제공합니다.
26 조회
0 추천
11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입