AI 뉴스

ChatGPT, 수학 문제에 인간 힉생과 유사한 학습 오류

페이지 정보

작성자 xtalfi
작성일 2025.09.18 17:22
1,237 조회
0 추천
0 비추천

본문

c77d71f9a76b7d4fde02a9371da0d3edIGNe.png

(퍼플렉시티가 정리한 기사)

인공지능 연구자들은 ChatGPT가 고대 그리스의 2,400년 된 수학 퍼즐에 도전했을 때, 인간과 매우 유사한 학습 행동을 보였음을 발견했습니다. ChatGPT는 창의적으로 해결책을 제시하고, 학생들이 익숙하지 않은 문제를 접근할 때 보이는 오류를 그대로 드러냈습니다.


이 실험은 케임브리지 대학교의 나다브 마르코 박사와 안드레아스 스타일리아니데스 교수가 진행했으며, 기원전 385년경 플라톤의 유명한 “정사각형의 두 배 만들기” 문제를 되살렸습니다. 이는 수학 교육에서 가장 오래된 실험 중 하나로 여겨집니다. 원래의 대화에서는 소크라테스가 수학을 모르는 소년을 이끌어, 정사각형의 넓이를 두 배로 만드는 방법이 단순히 한 변의 길이를 두 배로 늘리는 것이 아니라, 원래 정사각형의 대각선과 같은 길이의 새로운 변을 만들어야 한다는 사실을 발견하게 합니다.


AI가 예상치 못한 길을 선택하다


연구자들이 이 고전적인 기하학 문제를 ChatGPT-4에 제시했을 때, 그들은 챗봇이 방대한 훈련 데이터에서 잘 알려진 소크라테스식 해법을 그대로 반복할 것이라고 예상했습니다. 그러나 ChatGPT는 그들을 놀라게 하며 대수적인 방식으로 접근했는데, 이는 플라톤 시대에는 알려지지 않았던 방법이었습니다. AI는 연구자들이 실망을 표했음에도 완강하게 대수적인 방법을 고수하다가, “우아하고 정확한” 답을 원한다고 말했을 때에만 기하학적인 해법으로 바꿨습니다.


Marco는 ChatGPT의 행동을 “학습자 같은” 것으로 특징지으면서, 이 AI가 단순히 암기된 정보를 반환하기보다는 “자체적으로 가설과 해법을 만들어내는 것처럼 보였다”고 언급했습니다. 플라톤의 작업에 대해 직접 묻자, ChatGPT는 고전적인 해법에 대해 완벽히 알고 있음을 보여주었으며, 이는 정보를 몰라서가 아니라 스스로 접근 방식을 적극적으로 선택한 것으로 보였습니다.


즉흥성과 실수


연구자들은 ChatGPT의 추론 능력을 더욱 시험하기 위해 변형된 질문을 도입했습니다. 직사각형의 비율을 유지하면서 면적을 두 배로 늘리라는 질문에 대해, AI는 대각선을 사용할 수 없기 때문에 기하학적으로는 해법이 존재하지 않는다고 잘못 주장했습니다. 하지만 대체 기하학적 방법들이 실제로 존재합니다. 마르코는 이러한 잘못된 주장이 ChatGPT의 지식 기반에서 나올 확률이 “거의 없을 것”이라며, AI가 이전 대화를 바탕으로 즉흥적으로 답변한 것임을 시사했습니다.


이러한 행동을 바탕으로 연구자들은 은유적으로 “챗의 근접 발달 영역”을 제안했습니다. 이는 학습자가 독립적으로 알고 있는 것과 지도를 받을 때 달성할 수 있는 것 사이의 격차를 나타내는 교육 개념과 비슷합니다. 이 연구는 International Journal of Mathematical Education in Science and Technology에 게재되었으며, 이 발견이 수학 교육에서 학생들이 AI와 상호작용하는 방식을 변화시킬 수 있다고 제안합니다.


“이런 능력들이야말로 학생들이 반드시 익혀야 하는 핵심 기술입니다. 하지만 ‘이 문제를 함께 탐구해 보자’와 같은 프롬프트를 사용해야 하지, ‘정답을 알려줘’라고만 해서는 안 됩니다,“라고 마르코는 설명했습니다.

댓글 0
전체 1,144 / 50 페이지
(퍼플렉시티가정리한기사)ElonMusk의인공지능회사xAI가차세대Grok5AI모델의출시를2026년1분기로연기했다고보도되었습니다.이번지연은Musk가이전에이모델이"압도적으로훌륭할것"이며2025년말이전에출시될것이라고약속했던것에서크게변경된것입니다.​​이번발표는xAI가비즈니스관행을둘러싼법적문제와논란에직면하고있는가운데나왔습니다.목요일,텍사스연방판사는Musk의XCorp과xAI가제기한반독점소송을기각하려는Apple과OpenAI의시도를기각했습니다.2025년8월에제기된이소송은두회사가iPhone및기타기기의AppleIntelligence기능에ChatGPT를독점적으로통합함으로써AI시장을지배하기위해공모했다고주장합니다.​법적분쟁과모금논란미국연방지방법원판사마크피트먼(MarkPittman)은애플과OpenAI의기각신청을기각하여소송이진행되도록허용했습니다.이소송은애플의OpenAI와의파트너십이경쟁을감소시키고AI부문에서소비자선택권을제한한다고주장하며수십억달러의손해배상을청구하고있습니다.애플은OpenAI와의계약이독점적이지않으며,향후다른AI서비스를통합할계획이라고밝혔습니다.​한편,xAI는시리즈E펀딩라운드에서150억달러를유치했다는보도를부인했습니다.CNBC는11월12일이회사가해당자금을확보했으며,9월에2,000억달러로평가받은100억달러라운드에50억달러를추가했다고보도했습니다.머스크는X에서이보도가"거짓"이라고밝혔으며,xAI는언론문의에"레거시미디어의거짓말(LegacyMediaLies)"이라는자동메시지로응답했습니다.​진행중인논란이회사는멤피스데이터센터운영에대한비판에계속직면하고있으며,이곳에서Colossus슈퍼컴퓨터에전력을공급하기위해천연가스연소터빈을사용해왔습니다.NAACP를포함한환경단체들은시설인근의주로흑인거주지역의대기오염문제에대해법적조치를취하겠다고위협했습니다.또한,Wikipedia의AI기반대안인xAI의Grokipedia는기사에서음모론과부정확한정보를조장한다는이유로정밀조사를받았습니다.​주주들은최근xAI에회사자금을투자하는제안에대해투표했지만,반대보다찬성이더많았음에도불구하고이안건은통과에필요한충분한지지를얻지못했습니다.
72 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)오스틴에본사를둔LakeFusion은DatabricksLakehouse를위해구축된AI네이티브마스터데이터관리플랫폼을발전시키기위해CarbideVentures가주도하는시드펀딩을확보했다고이번주회사발표를통해밝혔습니다.이번펀딩은통합되고고품질의데이터가분석및인공지능이니셔티브에중요한헬스케어,금융서비스,부동산부문으로의회사확장을지원할예정입니다.​마스터데이터관리에대한AI네이티브접근방식VikasPunna가설립한LakeFusion은기업들이AI를대규모로배포하기위해경쟁하면서직면하는증가하는과제를해결합니다.이플랫폼은인공지능과자동화를마스터데이터관리프로세스에직접내장하여,조직이환자,의료제공자,자산및제품을포함한여러도메인에걸쳐분산된데이터를Databricks생태계내에서통합할수있도록합니다.​Punna는성명에서"레거시MDM플랫폼은오늘날의AI중심세계를위해구축되지않았습니다"라고말했습니다."우리플랫폼은엔터프라이즈데이터에지능성,확장성및단순성을제공하여조직이Lakehouse의잠재력을완전히발휘할수있도록돕습니다."​최근시장분석에따르면,AI데이터관리시장이2024년364억9천만달러에서2025년447억1천만달러로확대되는등급속한성장을경험하면서이번자금조달이이루어졌습니다.업계분석가들은마스터데이터관리가변화를겪고있으며,조직들이AI중심이고클라우드우선이며현대적인데이터생태계와긴밀하게통합된플랫폼을찾고있다고지적합니다.​전략적투자와시장기회CarbideVentures의파트너인PankajTibrewal은이번투자가기업들이점점더AI에의존함에따라신뢰할수있는데이터에대한현대적접근방식에대한수요증가를반영한다고말했다."기업들이AI를활용하기위해경쟁하면서마스터데이터관리가점점더중요해지고있습니다"라고Tibrewal은말했다."동시에AI는MDM자체가수행되는방식을변화시키고있습니다—더빠르고,더스마트하며,대규모로말이죠."​LakeFusion의플랫폼은대규모언어모델과벡터검색을활용하여엔티티해결—중복레코드를식별하고통합된"골든레코드"로통합—을기존규칙기반시스템보다더높은정확도로수행한다.회사는2025년1월Databricks와의파트너십을발표하여DatabricksDataIntelligencePlatform에MDM기능을통합했다.
78 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)OpenAI는목요일인공지능이생물학적위협을만드는무기로전용되는것을방지하는데중점을둔스타트업인RedQueenBio에1,500만달러규모의시드라운드를주도할것이라고발표했으며,이는ChatGPT제작사의한달도안되는기간내두번째주요생물안보투자를의미한다.mRNA치료제회사인HelixNano에서분사한샌프란시스코소재이회사는잠재적인생물무기위협과같은속도로진화하는AI기반방어시스템개발을목표로하고있다.RedQueenBio는공동창립자HannuRajaniemi에따르면,생물학적시스템의취약점을식별하고대응책을설계하기위해컴퓨터모델과실험실테스트를결합할예정이다.​"생물학적역량이우리가예상했던것보다빠르게발전하고있다는것이명백했습니다"라고Rajaniemi는Reuters에말했다."우리는방어책개발을시작해야한다고느꼈습니다".​OpenAI의안전포트폴리오확장이번투자는OpenAI가지난10월뉴욕에본사를둔생물보안소프트웨어회사Valthos에3천만달러를투자한것에이어이루어졌다.OpenAI의최고전략책임자인JasonKwon은회사가유사한위험을다루는추가스타트업을지원하는데열려있다고말했다."우리는전체생태계의전반적인회복력을높이고싶습니다"라고Kwon은Reuters에말했다."위험완화를다룰수있는가장좋은방법중하나는더많은기술입니다".​이번펀딩라운드에는CerberusVentures,FiftyYears,HalcyonFutures도참여했다.거래의일환으로OpenAICEOSamAltman과이사회멤버NicoleSeligman은HelixNano에대한이전투자로인해RedQueenBio의주식을받게되지만,두사람모두이번거래승인에는참여하지않았다.OpenAI의최고컴플라이언스책임자와이해관계가없는이사회구성원들이이번투자를검토하고승인했다.​AI기반위협에맞서는경쟁레드퀸바이오는루이스캐럴의「거울나라의앨리스」에서이름을따왔으며,이는생물학적위협과방어역량간의끊임없는진화적경쟁을의미합니다.이스타트업의창립자들은오픈AI와의협업중최첨단AI모델들이놀라운생물학적창의성을보여주었으며,이는혁신적인치료법개발에활용될수있는가능성을갖는동시에,더어두운잠재력도내포하고있음을관찰했습니다.​안전전문가들은약물개발을가속화할수있는AI시스템이동시에악의적인행위자들이위험한병원체를설계하는장벽을낮출수있다고경고합니다.최근연구에서는합성단백질스크리닝과정에서의취약점이드러났고,여러AI연구소에서생물무기개발정보를제공할위험임계점에다다른모델들에대해우려를표명하고있습니다.​레드퀸바이오는선진AI모델,실험실자동화,강화학습을활용하여AI기반생물학적위협을맵핑하고미리의료대책을개발할계획입니다.이회사는퍼블릭베네핏코퍼레이션구조로설립되었으며,모든AI연구소,바이오제약회사,정부와협력할것을약속합니다.
81 조회
0 추천
11.15 등록
(퍼플렉시티가정리한기사)인공지능(AI)이심혈관임상시험에서임상사건을전문의수준의정확도로성공적으로판정함으로써,신약개발의비용과복잡성을줄일수있는잠재적전환점을맞고있습니다.연구진은이번주시카고에서열린2025년미국심장협회(AmericanHeartAssociation)연례학술대회에서,AI모델이인간임상사건위원회와동등하게심근경색,뇌졸중,심혈관사망을판별할수있음을발표했습니다.​이번돌파구의중심에는대형언어모델(LargeLanguageModels)과자연어처리(NaturalLanguageProcessing)를활용한두가지첨단AI시스템이있습니다.Auto-MACE모델은PARADISE-MI임상시험에참가한5,661명을대상으로심혈관사망에대해97%,심근경색89%,뇌졸중88%의임상사건위원회와의일치도를보였습니다.한편,심부전자연어처리(HeartFailureNaturalLanguageProcessing)모델은글로벌DELIVER임상시험에서임상의와83%의전체일치도,특히심부전입원판별에서87%의일치도를기록했습니다.​비용이많이드는프로세스간소화임상사건판정은임상시험중특정의료사건이실제로발생했는지확인하는과정으로,일반적으로전문의사패널이의료기록을수작업으로검토해야합니다.이노동집약적인과정은주요비용발생원인으로작용하며,심혈관약물의규제승인임상시험참가자1인당비용이$35,000을초과하기도합니다.​"AI가사람이직접검토해야하는사례의양을줄임으로써,판정비용과일정지연의주요원인을줄일수있습니다."라고브리검여성병원(PabloM.Marti-Castellote외연구진)이그들의JACC논문에서밝혔습니다.Auto-MACE모델은사망사례의69%와잠재적뇌졸중의81%를자신있게판정했으며,불확실한사례에대해서만인간의검토가필요했습니다.​업계영향화이자,존슨앤드존슨,노바티스등제약사들은개발기간과비용감소의수혜를받을것으로보입니다.IQVIA와같은계약연구기관들은이미AI솔루션을도입하고있으며,한설문조사에따르면타당성평가에소요되는시간이90%까지줄었다고합니다.​최근업계분석에따르면,임상시험에AI를통합하면시험당최대70%의비용절감과80%의기간단축이가능하다고합니다.2030년까지AI가임상시험의60~70%에통합될것으로예상되며,이는제약업계에연간200~300억달러의비용절감효과를가져올수있습니다.​마이크로소프트와IBM등테크기업들은임상시험관리를위한AI-서비스형플랫폼개발에유리한위치에있습니다.심혈관연구재단의알렉산드라포프마는Auto-MACE의결과를"환상적"이라며,이는"AI를임상시험의일부로공식적으로도입하는과정의중요한단계"라고평가했습니다.
77 조회
0 추천
11.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입