Loading...

AI 뉴스

AI는 인간이 지나치게 합리적이라 가정한다는 연구 결과

페이지 정보

작성자 이수
작성일 2025.12.26 19:15
426 조회
0 추천
0 비추천

본문

S25013_CEN.jpg


이번 주 Journal of Economic Behavior & Organization에 게재된 연구에 따르면, 인공지능 시스템은 전략적 의사결정 시나리오에서 인간의 논리적 사고를 지속적으로 과대평가하는 것으로 나타났다. HSE University의 과학자들은 ChatGPT-4o와 Claude-Sonnet-4를 포함한 인기 있는 AI 모델들이 사람들을 실제보다 더 합리적이라고 가정하여, 모델들이 "너무 똑똑하게 플레이"하다가 경쟁 게임에서 지게 된다는 것을 발견했다.

​이 연구는 참가자들이 0에서 100 사이의 숫자를 선택하고, 그룹 평균의 절반에 가장 가까운 사람이 승자가 되는 고전적인 경제학 실험인 "숫자 맞추기 게임"에서 5개의 주요 AI 모델이 어떻게 수행되는지를 조사했다. HSE University의 Dmitry Dagaev, Sofia Paklina, Petr Parshakov와 University of Lausanne의 Iuliia Alekseenko 연구원들은 경제학과 1학년 학생부터 게임 이론 학회 참가자에 이르기까지 다양한 가상 상대를 대상으로 16가지 시나리오에서 모델들을 테스트했다.



AI는 규칙대로 플레이하지만, 인간은 그렇지 않다

모델들은 인간 플레이어가 선택할 것보다 지속적으로 더 낮은 숫자를 선택했으며, 이는 게임 이론 균형과 일치하는 보다 "합리적인" 접근 방식을 반영합니다. 고전적인 실험에서 인간들이 평균 27 정도를 선택했을 때, AI 모델은 상대방도 전략적으로 사고할 것이라고 가정하며 훨씬 더 낮은 숫자를 선택했습니다. The Brighter Side of News에 따르면, 이러한 패턴은 다양한 상대방 설명에서도 일관되게 나타났습니다—게임 이론 전문가를 상대할 때 AI는 0에 가까운 숫자를 선택한 반면, 대학생들을 상대로는 더 높은 숫자를 선택했습니다.
​이러한 격차는 AI가 인간 행동을 이해하는 방식의 근본적인 한계를 드러냅니다. 모델들이 상대방의 특성에 따라 선택을 조정하고 전략적 사고를 보여주었지만, 게임의 2인 버전에서 지배적 전략을 식별하는 데는 실패했습니다. Dagaev는 The Brighter Side of News에 "이러한 결과는 AI가 사람들과 마찬가지로 게임 구조의 변화에 반응한다는 것을 보여줍니다"라고 말했지만, 모델들이 "다른 사람들이 무엇을 할지에 대한 단계별 추론에 의존했다"고 덧붙였습니다.


AI 배포에 대한 시사점

연구 결과는 AI 시스템이 비즈니스 운영 및 의사결정 프로세스에서 점점 더 인간을 대체하고 있다는 점에서 중요한 의미를 지닙니다. Dagaev는 "우리는 이제 AI 모델이 많은 운영 작업에서 인간을 대체하기 시작하여 비즈니스 프로세스의 경제적 효율성을 높이는 단계에 있습니다"라고 말했습니다. "그러나 의사결정 작업에서는 LLM이 인간과 유사한 방식으로 행동하도록 보장하는 것이 종종 중요합니다."
​1930년대 영국 경제학자 존 메이너드 케인스(John Maynard Keynes)가 고안한 케인즈의 미인 대회는 참가자들이 단순히 자신의 최적 선택을 하는 것이 아니라 다른 사람들의 선택을 얼마나 잘 예측하는지를 테스트합니다. 이 게임은 성공이 다른 투자자들이 어떻게 행동할지 예측하는 데 달려 있는 금융 시장의 변동을 설명하는 데 오랫동안 사용되어 왔습니다.
​HSE 대학교의 기초 연구 프로그램의 지원을 받은 이 연구는 AI가 인간 행동과 일치하는 부분과 차이가 나는 부분을 이해하는 것이 이러한 시스템이 시장, 정책 및 일상 생활에 배치되는 방식을 형성할 것임을 시사합니다.



댓글 0
전체 1,366 / 84 페이지
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
840 조회
0 추천
2025.11.21 등록
Google은사용자가"이것이AI로생성된것인가요?"라고질문하여이미지가GoogleAI도구에의해생성되었거나수정되었는지확인할수있는기능을Gemini앱에추가하고있으며,향후에는이검증기능을동영상,오디오,그리고Google검색으로확대할계획입니다.​이기능은현재Google의독점적인보이지않는워터마킹기술인SynthID에기반하고있지만,앞으로는업계표준인C2PA(콘텐츠출처및진위연합)자격증명을지원하게되어,OpenAI의Sora를포함한더다양한AI도구에서생성된콘텐츠도탐지할수있습니다.​TikTok도이번주에AI생성콘텐츠에C2PA워터마킹을도입하겠다고발표했으나,이러한탐지시스템의보다광범위한활용은소셜미디어플랫폼이수동사용자검증이아니라자동플래그기능을개발하는데달려있습니다.
859 조회
0 추천
2025.11.21 등록
음성AI스타트업Wispr은3천만달러규모의시리즈A투자를확보한지불과5개월만에NotableCapital이주도한2,500만달러를추가로유치하여총투자금을8,100만달러로늘렸으며,이는받아쓰기앱WisprFlow가전월대비40%의성장을경험하고있다고TechCrunch가보도했다.​회사는사용자들이3개월사용후앱을통해자신의문자의50%이상을작성한다고보고하며,WisprFlow는270개의Fortune500기업에도달했고125개기업이엔터프라이즈고객으로계약했으며,OpenAI의Whisper의27%및Apple의네이티브전사기능의47%와비교하여10%의오류율을달성했다.​Wispr은투자자HansTung이"워크플로우자동화를시작할수있는음성주도운영체제"라고부르는것으로받아쓰기를넘어진화하는것을목표로하며,YC지원Willow와Aqua,Superwhisper등을포함한경쟁이치열한시장에서경쟁하고있으며,음성인식기술시장은2034년까지500억달러를초과할것으로예상된다.
867 조회
0 추천
2025.11.21 등록
Google은목요일새로운Gemini3Pro모델을기반으로구축된업그레이드된AI이미지생성도구인NanoBananaPro를출시하여,전문편집소프트웨어의경쟁자로자리매김할수있는향상된기능을제공합니다.​이번출시는화요일에공개된Gemini3Pro에이어나온것으로,8월에단4일만에1,300만명의신규사용자를유치하며입소문을탄원래NanoBanana모델의주요한계점을해결했습니다.업데이트된도구는이제2K및4K이미지해상도,16:9를포함한다양한화면비율을지원하며,최대5명의인물에대한캐릭터일관성을유지하거나14개의서로다른이미지를혼합할수있습니다.​추론능력이사용자경험을변화시킵니다Gemini2.5Flash로구동되었던이전버전과달리,NanoBananaPro는이미지를생성하기전에복잡한데이터를해석하기위해Gemini3Pro의추론능력을활용합니다."인포그래픽제작에탁월합니다.슬라이드프레젠테이션을생성할수있으며,캐릭터일관성을유지하면서최대14개의서로다른이미지또는5개의다른캐릭터를관리할수있습니다"라고GoogleLabs및Gemini의부사장인JoshWoodward가CNBC에말했습니다.​이모델은운동루틴,코드스니펫,데이터세트를분석하여시각화를생성할수있으며,단순한텍스트-이미지생성을넘어섭니다.AndroidAuthority의테스트에따르면,이도구는이제후속편집요청을효과적으로처리하는반면,원래버전은"마치디지털머리를벽에부딪히는것처럼동일한편집을반복했습니다".​OpenAI에대한전략적압박이번출시는11월12일GPT-5.1을발표한OpenAI와의경쟁이심화되는가운데이루어졌습니다.Google의Gemini앱은현재월활성사용자6억5천만명을보유하고있어,ChatGPT의주간사용자7억~8억명과의격차를좁히고있습니다.​NanoBananaPro는Gemini앱에서제한된무료할당량으로제공되며,사용자가할당량을모두소진하면원래모델로되돌아갑니다.유료구독자인GoogleAIPlus,Pro,Ultra사용자는더높은할당량을받으며,Ultra구독자는Flow비디오도구에서도액세스할수있고가시적워터마크가면제됩니다.이도구는NotebookLM,GoogleSlides,GoogleVids및GeminiAPI에도배포되고있습니다.​모든이미지에는검증목적으로Google의비가시적SynthID워터마크가포함되며,무료및Pro등급사용자에게는가시적인Gemini스파클워터마크가표시됩니다.
856 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입