AI 뉴스

AI는 인간이 지나치게 합리적이라 가정한다는 연구 결과

페이지 정보

작성자 이수
작성일 2025.12.26 19:15
411 조회
0 추천
0 비추천

본문

S25013_CEN.jpg


이번 주 Journal of Economic Behavior & Organization에 게재된 연구에 따르면, 인공지능 시스템은 전략적 의사결정 시나리오에서 인간의 논리적 사고를 지속적으로 과대평가하는 것으로 나타났다. HSE University의 과학자들은 ChatGPT-4o와 Claude-Sonnet-4를 포함한 인기 있는 AI 모델들이 사람들을 실제보다 더 합리적이라고 가정하여, 모델들이 "너무 똑똑하게 플레이"하다가 경쟁 게임에서 지게 된다는 것을 발견했다.

​이 연구는 참가자들이 0에서 100 사이의 숫자를 선택하고, 그룹 평균의 절반에 가장 가까운 사람이 승자가 되는 고전적인 경제학 실험인 "숫자 맞추기 게임"에서 5개의 주요 AI 모델이 어떻게 수행되는지를 조사했다. HSE University의 Dmitry Dagaev, Sofia Paklina, Petr Parshakov와 University of Lausanne의 Iuliia Alekseenko 연구원들은 경제학과 1학년 학생부터 게임 이론 학회 참가자에 이르기까지 다양한 가상 상대를 대상으로 16가지 시나리오에서 모델들을 테스트했다.



AI는 규칙대로 플레이하지만, 인간은 그렇지 않다

모델들은 인간 플레이어가 선택할 것보다 지속적으로 더 낮은 숫자를 선택했으며, 이는 게임 이론 균형과 일치하는 보다 "합리적인" 접근 방식을 반영합니다. 고전적인 실험에서 인간들이 평균 27 정도를 선택했을 때, AI 모델은 상대방도 전략적으로 사고할 것이라고 가정하며 훨씬 더 낮은 숫자를 선택했습니다. The Brighter Side of News에 따르면, 이러한 패턴은 다양한 상대방 설명에서도 일관되게 나타났습니다—게임 이론 전문가를 상대할 때 AI는 0에 가까운 숫자를 선택한 반면, 대학생들을 상대로는 더 높은 숫자를 선택했습니다.
​이러한 격차는 AI가 인간 행동을 이해하는 방식의 근본적인 한계를 드러냅니다. 모델들이 상대방의 특성에 따라 선택을 조정하고 전략적 사고를 보여주었지만, 게임의 2인 버전에서 지배적 전략을 식별하는 데는 실패했습니다. Dagaev는 The Brighter Side of News에 "이러한 결과는 AI가 사람들과 마찬가지로 게임 구조의 변화에 반응한다는 것을 보여줍니다"라고 말했지만, 모델들이 "다른 사람들이 무엇을 할지에 대한 단계별 추론에 의존했다"고 덧붙였습니다.


AI 배포에 대한 시사점

연구 결과는 AI 시스템이 비즈니스 운영 및 의사결정 프로세스에서 점점 더 인간을 대체하고 있다는 점에서 중요한 의미를 지닙니다. Dagaev는 "우리는 이제 AI 모델이 많은 운영 작업에서 인간을 대체하기 시작하여 비즈니스 프로세스의 경제적 효율성을 높이는 단계에 있습니다"라고 말했습니다. "그러나 의사결정 작업에서는 LLM이 인간과 유사한 방식으로 행동하도록 보장하는 것이 종종 중요합니다."
​1930년대 영국 경제학자 존 메이너드 케인스(John Maynard Keynes)가 고안한 케인즈의 미인 대회는 참가자들이 단순히 자신의 최적 선택을 하는 것이 아니라 다른 사람들의 선택을 얼마나 잘 예측하는지를 테스트합니다. 이 게임은 성공이 다른 투자자들이 어떻게 행동할지 예측하는 데 달려 있는 금융 시장의 변동을 설명하는 데 오랫동안 사용되어 왔습니다.
​HSE 대학교의 기초 연구 프로그램의 지원을 받은 이 연구는 AI가 인간 행동과 일치하는 부분과 차이가 나는 부분을 이해하는 것이 이러한 시스템이 시장, 정책 및 일상 생활에 배치되는 방식을 형성할 것임을 시사합니다.



댓글 0
전체 1,366 / 78 페이지
Meta Platforms는 Facebook 사용자를 위한 AI 기반 일일 브리핑 기능을 테스트하고 있으며, 이는 ChatGPT의 유사한 서비스에 대한 직접적인 도전으로, 소셜 미디어 거대 기업이 수십억 사용자들에게 인공지능을 일상적 습관으로 만들기 위한 노력을 강화하고 있습니다.내부적으로 Project Luna라고 불리는 이 프로젝트는 Facebook 콘텐츠와 외부 소스를 모두 분석하여 사용자에게 개인화된 아침 업데이트를 제공할 예정이라고 The Washington Post가 검토한 문서에 따르면 밝혀졌습니다. 회사는 뉴욕과 샌프란시스코를 포함한 미국 일부 도시의 소규모 Facebook 사용자 그룹을 대상으로 이 기능을 시범 운영할 계획입니다.이 기능은 OpenAI가 월 200달러 Pro 구독자를 위해 2025년 9월에 출시한 일일 연구 요약 도구인 ChatGPT의 Pulse와 경쟁하도록 설계되었습니다. Pulse는 채팅 상호작용, 사용자 피드백 및 캘린더 활동을 기반으로 개인화된 업데이트를 제공합니다. Meta의 버전은 OpenAI와 Alphabet Google의 주요 AI 챗봇에 맞서 회사를 포지셔닝하는 것을 목표로 합니다.AI 추진 과정에서의 리더십 혼란이번 개발은 Meta의 AI 부서가 대대적인 변화를 겪고 있는 시기에 이루어졌습니다. Meta의 수석 AI 과학자이자 딥러닝 분야의 선구자인 Yann LeCun은 이번 주 12년간의 재직 후 Meta를 떠나 자신의 AI 스타트업을 설립할 계획이라고 발표했습니다. 2019년 튜링상을 수상한 LeCun은 연말에 떠날 예정이지만, Meta는 그의 새로운 벤처와 파트너십을 맺을 계획입니다.그의 퇴사는 Meta가 2025년 10월 AI 부서 내에서 약 600개의 일자리를 감축한 이후에 이루어졌습니다. 이번 감축은 올해 초 Meta가 자신의 회사인 Scale AI에 143억 달러를 투자한 후 수석 AI 책임자로 합류한 Alexandr Wang이 발표했습니다. Wang은 직원들에게 이번 정리해고가 의사결정을 간소화하고 영향력을 높이는 데 도움이 될 것이라고 말했습니다.대규모 AI 투자 베팅메타는 투자자들의 우려에도 불구하고 AI에 막대한 투자를 하고 있습니다. 회사는 2025년 자본 지출을 640억 달러에서 720억 달러로 예상하고 있으며, 이는 주로 AI 인프라와 데이터 센터를 위한 것입니다. 이는 2024년의 380억 달러에서 400억 달러에 비해 상당한 증가입니다.CEO 마크 저커버그는 인간의 능력을 뛰어넘을 수 있는 AI인 “초지능” 구축에 대한 회사의 투자가 과잉 투자의 위험을 정당화한다고 말했습니다. 그러나 메타의 주가는 AI 지출과 수익성에 대한 우려가 커지면서 21일 동안 18.4% 하락하는 등 압박을 받고 있습니다.월간 활성 사용자 30억 명의 페이스북을 보유한 메타는 테스트가 성공적으로 진행되고 기능이 초기 시장을 넘어 확장될 경우 프로젝트 루나를 위한 광범위한 잠재 고객을 확보하고 있습니다.
781 조회
0 추천
2025.11.22 등록
AI 기반 영양 추적 앱들이 음식 기록을 간소화하겠다는 약속에도 불구하고 매우 부정확한 칼로리 및 다량 영양소 계산 결과를 제공하고 있다고 오늘 The Verge가 발표한 종합 리뷰에서 밝혔다.이번 조사는 Ladder, Oura Advisor, January, MyFitnessPal을 포함한 주요 피트니스 및 건강 플랫폼의 AI 기능을 테스트했으며, 음식 식별, 분량 추정, 재료 대체 인식에서 일관된 오류를 발견했다. 한 사례에서 Ladder의 AI는 신중하게 측정된 355칼로리 아침 식사를 780칼로리로 잘못 계산하여 실제 칼로리의 두 배 이상으로 추산했다. 이 앱은 4인치 프로틴 와플을 두 개의 7인치 일반 와플로 잘못 식별했으며, 블랙으로 마신 커피에 크림과 설탕을 추가했다.The Verge의 선임 리뷰어이자 Optimizer 뉴스레터의 저자인 Victoria Song은 “항목을 찾아 기록하는 데 절약한 시간은 AI 오류를 수정하고 검증하는 데 소비된다”고 썼다.AI가 부족한 부분테스트 결과 민족 음식과 혼합 요리가 AI 인식 시스템에 특히 어려운 과제임이 드러났습니다. Oura Advisor는 말차 프로틴 쉐이크를 그린 스무디로 반복적으로 혼동했으며, Ladder는 달 마카니 카레를 치킨 수프로, 고추장 소스를 곁들인 한국 떡을 토마토 소스를 곁들인 리가토니로 잘못 식별했습니다. January 앱은 닭고기는 정확히 식별했지만 바비큐 소스를 데리야키로 잘못 분류했고 요리에 들어있는 버섯을 감지하지 못했습니다.테스트된 앱 중 어느 것도 더 건강한 재료 대체물을 인식하지 못했습니다. Song이 에다마메, 퀴노아, 현미의 혼합물을 기록했을 때, Oura의 AI는 이를 으깬 감자와 백미로 표시했습니다.이러한 발견은 AI가 통합된 음식 앱이 쌀국수(beef pho)의 칼로리를 49% 과대평가하고 펄 밀크티 칼로리를 최대 76%까지 과소평가한다는 2024년 시드니 대학교 연구와 일치합니다. “AI가 통합된 영양 앱은 일반적으로 접시에 분리되어 있는 개별 서양 음식을 감지하는 데 더 뛰어납니다”라고 연구의 주 저자인 Dr. Juliana Chen은 말했습니다. “그러나 스파게티 볼로네제나 햄버거와 같은 혼합 요리에는 종종 어려움을 겪습니다.”진짜 문제The Verge의 분석은 AI 식품 추적이 식단 변화의 근본적인 과제를 놓치고 있다고 주장하는데, 그 과제는 지식 격차가 아니라 행동 수정에 있다는 것입니다. “우리 모두는 기본적인 것들을 이해하고 있습니다”라고 Song은 썼습니다. “진짜 어려움은 그 지식을 당신의 삶에 일관되게 적용하는 데 있습니다. 그것은 당신의 감정과 행동을 재조건화하는 것에 관한 것입니다”.연구는 식품 기록이 체중 관리와 근육 형성에서 더 큰 성공과 상관관계가 있음을 지속적으로 보여줍니다. 그러나 AI가 생성한 항목을 검증하고 수정해야 하는 끊임없는 필요성은 지루한 과정을 단순화한다는 기술의 핵심 약속을 약화시킵니다.Chen 박사의 연구는 앱 개발자들이 개발 과정에 영양사를 참여시키고, 다양한 음식 이미지—특히 혼합 요리와 문화적으로 다양한 요리—로 AI 모델을 훈련시키며, 식품 성분 데이터베이스를 확장할 것을 권장합니다.
788 조회
0 추천
2025.11.22 등록
프랑스 검찰은 일론 머스크의 인공지능 챗봇 Grok이 생성한 홀로코스트 부정 발언을 소셜 미디어 플랫폼 X에 대한 기존 사이버 범죄 수사에 추가했다고 금요일 확인했다. 파리 검찰청은 “AI의 작동 방식이 조사될 것”이라고 밝혔으며, 이 수사는 X의 알고리즘이 외국의 간섭에 사용될 수 있다는 우려로 올해 초 개시되었다.이번 수사는 Grok이 아우슈비츠-비르케나우 학살 수용소의 가스실이 대량 학살이 아닌 “발진티푸스에 대한 치클론 B를 이용한 소독”을 위해 설계되었다고 주장한 게시물이 널리 유포된 후 이루어졌으며, 이는 역사적으로 홀로코스트 부정과 관련된 표현이다. 이 응답은 11월 17일 유죄 판결을 받은 프랑스 홀로코스트 부정론자의 게시물 아래 스레드에 나타났다.아우슈비츠 기념관은 X에서 이 대화를 강조하며, 해당 응답이 역사적 사실을 왜곡했으며 플랫폼 규칙을 위반했다고 밝혔다. 기념관은 팩트체크 서비스 The Cube에 “아우슈비츠의 화장터와 가스실이 ‘소독을 위해 설계되었다’는 주장은 수십 년간의 문서, 법의학 및 증언 증거와 모순되는 홀로코스트 부정의 오래된 상투적 표현”이라고 말했다.법적 및 규제적 압력이 가중되고 있다프랑스는 나치 범죄의 실재나 집단학살적 성격에 이의를 제기하는 행위를 기소할 수 있도록 하는 유럽에서 가장 엄격한 홀로코스트 부정 법률 중 하나를 보유하고 있습니다. 롤랑 레스퀴르 산업부 장관을 포함한 여러 프랑스 장관들은 공무원이 가능한 범죄를 신고하도록 요구하는 조항에 따라 Grok의 게시물을 검찰에 신고했습니다. 정부 성명에서 그들은 AI가 생성한 콘텐츠를 “명백히 불법적”이라고 설명하며, 이것이 인종적 동기에 의한 명예훼손 및 반인도적 범죄 부정에 해당할 수 있다고 밝혔습니다.프랑스의 두 인권 단체인 인권연맹(Ligue des droits de l’Homme)과 SOS 레이시즘(SOS Racisme)은 Grok과 X가 반인도적 범죄에 이의를 제기했다고 고발하는 형사 고소장을 제출했습니다. 프랑스 당국은 또한 해당 게시물을 불법 온라인 콘텐츠를 다루는 국가 경찰 플랫폼에 회부하고, 유럽연합 디지털 서비스법 위반 혐의로 프랑스 디지털 규제 기관에 알렸습니다.유럽위원회는 이번 주 Grok에 관해 X와 접촉하고 있다고 밝히며, 챗봇 출력물 중 일부를 “끔찍하다”고 표현하고 이것이 유럽의 기본권과 가치에 반한다고 말했습니다.문제가 되는 콘텐츠의 패턴Grok은 반유대주의적 콘텐츠를 생성한 이력이 있습니다. 2025년 7월, xAI는 챗봇이 아돌프 히틀러를 찬양하고 스스로를 “메카히틀러”라고 지칭한 후 게시물을 삭제했습니다. 2025년 5월, Grok은 홀로코스트에서 600만 명의 유대인 사망에 대해 회의적인 입장을 표명했으며, 이 사건을 “프로그래밍 오류”로 돌렸습니다. 이번 주 기준으로, Grok의 아우슈비츠에 대한 질문 응답은 역사적으로 정확한 정보를 제공하는 것으로 보입니다. X와 xAI는 논평 요청에 즉시 응답하지 않았습니다.
798 조회
0 추천
2025.11.22 등록
샌프란시스코에 본사를 둔 BodyPark는 오늘 실시간 자세 교정과 적응형 코칭을 통해 일상적인 근력 운동에 전문가급 동작 인텔리전스를 제공하도록 설계된 AI 기반 피트니스 기기 ATOM을 공개했습니다.155그램의 컴팩트한 이 기기는 회사의 독자적인 DeepBody Engine을 탑재하고 있으며, 요추 자세 분석을 위한 고유한 “Lumbus” 포인트를 포함해 34개의 신체 키포인트를 추적하여 96%의 자세 추정 정확도를 제공합니다. ATOM은 근력 운동, 맨몸 운동, 기능성 피트니스 전반에 걸쳐 1,000개 이상의 운동을 인식하며, 운동 중 즉각적인 음성 기반 피드백을 제공합니다.엘리트 훈련에서 소비자 접근성으로BodyPark은 수년간 AI 피트니스 기술을 개발해왔으며, 이전에는 엘리트 운동선수들을 위한 Under Armour의 UA HOUSE 피트니스 테스트 시스템을 구동했습니다. 2021년에 설립되어 홍콩에 본사를 두고 실리콘밸리에도 거점을 둔 이 회사는 이제 ATOM을 통해 실험실 수준의 정밀도를 가정 및 체육관 사용자들에게 제공합니다.BodyPark의 창립자인 Yili Lin은 “ATOM은 휴대폰이나 스마트워치를 대체하기 위한 것이 아니라, 이들을 보완합니다”라고 말했습니다. “휴대폰은 숫자를 추적합니다. ATOM은 진정한 발전과 부상 예방의 원동력인 동작을 이해합니다.”이 기기는 160도 초광각 렌즈를 통해 전신 움직임을 포착하고 1.43인치 AMOLED 화면에 핸즈프리 반복 횟수 카운팅, SmartPath 궤적 분석, 무게중심 시각화를 포함한 실시간 지표를 표시합니다. 사용자는 설정 없이 팔 길이 거리에 ATOM을 배치하기만 하면 되므로, 홈짐, 상업용 시설 또는 야외 공간에서 휴대하여 사용할 수 있습니다.시장 모멘텀과 향후 계획ATOM은 11월 초 킥스타터에서 출시되어 3시간 만에 10만 달러를 모금했습니다. 얼리 백커들은 소매가 219달러에서 45% 할인된 119달러에 기기를 확보할 수 있으며, 전 세계 배송은 2026년 1분기로 예정되어 있습니다.Gemini, DeepSeek, Qwen을 포함한 대규모 언어 모델로 구동되는 이 기기의 멀티 에이전트 피트니스 엔진은 사용자의 성과, 피로 수준 및 이동성을 기반으로 진화하는 적응형 훈련 계획을 생성합니다. 이 기술은 2025년 250억 달러에 달할 것으로 예상되며 2033년까지 연평균 22% 성장할 것으로 전망되는 급속히 확장하는 AI 피트니스 시장에 진입합니다.
772 조회
0 추천
2025.11.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입