AI 뉴스

AI는 인간의 글쓰기를 완전히 재현할 수 없다는 연구 결과

페이지 정보

작성자 이수
작성일 2025.12.21 17:33
350 조회
0 추천
0 비추천

본문

8f3d75518a616862e3ced4197e28b7c9_1766305953_2608.jpeg
 

이번 주에 발표된 획기적인 연구에 따르면, 기술이 빠르게 발전하고 있음에도 불구하고 ChatGPT와 같은 인공지능 시스템은 인간의 글쓰기를 완전히 모방할 수 없는 것으로 드러났다. 인지 능력에 대한 AI의 영향에 대한 우려가 커지는 가운데 발표된 이 연구는, AI가 생성한 산문이 인간 작가와 구별되는 고유한 “스타일 지문(stylistic fingerprint)”을 지니고 있음을 보여준다.

유니버시티 칼리지 코크의 제임스 오설리번(Dr. James O’Sullivan)이 이끄는 이번 연구는, 전통적으로 필자 식별에 사용되던 계산 기반 방법인 문체 통계 분석(literary stylometry)을 인간과 AI의 창작 글쓰기를 체계적으로 비교하는 데 처음으로 적용한 사례다. 수백 편의 단편소설을 분석한 결과, 연구진은 AI가 매끄럽고 유창한 문장을 생성하긴 하지만, 매우 좁고 균질한 패턴을 따른다는 사실을 발견했다. 이에 반해 인간 작가들은 개인적 목소리, 창작 의도, 개별적 경험에 의해 형성된 훨씬 더 넓은 문체적 스펙트럼을 보여준다.

오설리번은 “ChatGPT가 인간처럼 들리려고 할 때조차 그 글에는 여전히 탐지 가능한 지문이 남아 있으며, 이는 컴퓨터와 사람이 아직은 완전히 같은 스타일로 글을 쓰지 않는다는 점을 시사한다”고 말했다. 네이처(Nature)의 『Humanities and Social Sciences Communications』에 실린 이번 연구 결과에 따르면, GPT-3.5, GPT-4, Llama 70B를 포함한 AI 시스템이 생성한 텍스트는 균질한 패턴을 반영하는 촘촘한 군집으로 모이는 반면, 인간이 쓴 텍스트는 훨씬 더 큰 변이와 개성을 드러낸다.


인지 영향에 대한 우려 증가

스타일로메트리 연구 결과는 AI가 인간 인지에 미치는 영향에 대한 우려스러운 연구들과 함께 제시되고 있다. 매사추세츠 공과대학교(MIT)가 6월에 발표한 한 연구는 54명의 참가자를 대상으로, 에세이를 작성할 때 ChatGPT, 구글 검색, 혹은 어떠한 도움 없이 쓰도록 나누어 살펴보았다. 뇌 스캔 결과, ChatGPT를 사용한 참가자들은 신경 연결성이 가장 약하게 나타났고, 자신이 쓴 글을 기억하는 데 어려움을 겪었다. ChatGPT 사용자 중 83%가 자신의 에세이를 정확히 인용하지 못한 반면, 독립적으로 작성한 그룹에서는 그 비율이 11%에 불과했다.

MIT 연구진은 이 현상을 “인지 부채(cognitive debt)“라고 명명하며, 단기적인 편의를 위해 미래의 인지 능력을 선(先)차입하는 것이라고 설명했다. 뇌만 활용한(도구를 사용하지 않은) 그룹은 창의성, 기억력, 의미 처리와 연관된 주파수 대역에서 가장 강한 신경 네트워크를 보여주었다.

카네기멜론대학교와 마이크로소프트의 별도 연구에서는 319명의 지식 노동자를 대상으로 설문을 진행한 결과, AI 능력에 대한 신뢰도가 높을수록 비판적 사고 노력은 감소하는 경향이 있다는 사실을 밝혀냈다. 이 연구는 실제 AI 보조 과제 936건을 분석했으며, 생성형 AI가 효율성을 높여 주는 동시에 비판적 개입을 약화시키고 독립적인 문제 해결 능력을 떨어뜨릴 수 있다고 결론지었다.


학생들의 우려가 고조되다

옥스퍼드 대학 출판부(Oxford University Press)가 13-18세 영국 학생 2,000명을 대상으로 실시한 설문조사에 따르면, 80%가 학업에 AI를 정기적으로 사용하지만, 62%는 AI가 자신의 기술 개발에 부정적인 영향을 미친다고 생각하는 것으로 나타났다. 학생 4명 중 1명은 AI가 “스스로 과제를 수행하지 않고도 답을 찾는 것을 너무 쉽게 만든다”고 답했으며, 12%는 AI가 창의적 사고를 제한한다고 보고했다.

광범위한 도입에도 불구하고, 학생들은 지침을 요구하고 있다. 옥스퍼드 보고서의 공동 저자인 에리카 갈레아(Erika Galea)는 “오늘날의 학생들은 기계와 함께 사고하기 시작하고 있습니다. 아이디어를 처리하는 데 유창함과 속도를 얻고 있지만, 때때로 멈추고, 질문하고, 독립적으로 사고하는 것에서 오는 깊이를 잃고 있습니다”라고 말했다.

댓글 0
전체 1,366 / 5 페이지
Executive Summary• 구글이 일부 의료 관련 검색어에 대한 AI 오버뷰 기능을 비활성화함• 가디언 조사에서 췌장암 환자에게 '위험한' 잘못된 식이요법 조언 제공 사실 확인• 간 기능 검사 관련 허위 정보로 심각한 간 질환 환자가 건강하다고 오인할 수 있는 문제 발생• 구글은 대부분의 정보가 정확하다고 주장하나, 문제 있는 결과에 대해서는 개선 조치 진행 중Background구글의 AI 오버뷰 기능은 2024년 출시 이후 지속적인 논란에 휩싸여 왔다. 피자에 접착제를 넣으라는 조언, 돌을 먹으라는 권고 등 황당한 오류가 알려지면서 여러 건의 소송까지 제기된 바 있다. 이번에는 의료 정보라는 민감한 영역에서 심각한 오류가 발견되어 더욱 큰 우려를 낳고 있다.Impact & Implications사용자 안전 문제AI가 생성한 의료 정보의 부정확성은 단순한 불편을 넘어 환자의 생명과 직결될 수 있다. 췌장암 환자에게 고지방 식품을 피하라는 조언은 전문가들이 권고하는 내용과 정반대이며, 환자의 사망 위험을 높일 수 있다고 경고된다. 간 기능 검사 정보의 오류 역시 심각한 간 질환 환자가 치료 시기를 놓치게 만들 수 있는 위험한 문제다.AI 신뢰성에 대한 근본적 의문이번 사태는 대형 기술 기업의 AI 서비스가 고위험 영역에서 얼마나 신뢰할 수 있는지에 대한 근본적인 의문을 제기한다. 구글은 "대다수의 AI 오버뷰가 정확한 정보를 제공한다"고 주장하지만, 의료 분야에서는 소수의 오류도 치명적인 결과로 이어질 수 있다.규제 및 책임 논의 가속화AI 생성 콘텐츠의 정확성과 책임 소재에 대한 규제 논의가 더욱 활발해질 전망이다. 특히 의료, 법률 등 전문 분야에서 AI 정보 제공에 대한 가이드라인 마련이 시급해 보인다.Key Data & Facts항목수치/내용발생 시점2026년 1월문제 발견 경로가디언 탐사보도주요 오류 사례췌장암 식이요법, 간 기능 검사 수치구글 대응일부 의료 검색어 AI 오버뷰 비활성화기존 논란피자 접착제, 돌 섭취 권고 등Key Quote"We invest significantly in the quality of AI Overviews, particularly for topics like health, and the vast majority provide accurate information."— Davis Thompson, 구글 대변인
277 조회
0 추천
01.12 등록
Executive Summary • xAI의 Grok 챗봇이 동의 없는 성적 딥페이크 이미지를 대량 생성해 국제적 논란 확산 • 영국, 프랑스, 인도, 말레이시아 등 각국 정부가 조사 및 규제 검토에 착수 • 미국 CSAM 및 딥페이크 관련 법률의 AI 적용 가능 여부에 법조계 의견 분분 • 머스크의 트럼프 행정부와의 긴밀한 관계가 미국 내 규제 집행에 변수로 작용 Background 일론 머스크의 AI 기업 xAI가 개발한 챗봇 Grok은 2025년부터 성적 이미지 생성 관련 논란에 휘말려왔다. 지난주 X(구 트위터)에 도입된 이미지 편집 기능으로 사용자들이 원본 게시자의 동의 없이 사진을 수정할 수 있게 되면서, 여성과 미성년자의 옷을 벗기는 딥페이크 이미지가 플랫폼에 범람하기 시작했다. 한 추정에 따르면 최고조 시점에 분당 1건의 비동의 성적 이미지가 생성됐다. Impact & Implications 규제/정책 영향 각국 정부의 대응이 빠르게 전개되고 있다. 영국의 키어 스타머 총리는 해당 콘텐츠를 "역겨운 것"이라 규정하며 "모든 옵션을 검토하겠다"고 밝혔다. 영국 통신규제기관 Ofcom은 온라인안전법 위반 여부를 조사 중이다. 유럽연합 집행위원회는 Grok의 결과물이 "불법이며 끔찍하다"고 논평했고, 인도 IT부는 불법 콘텐츠 방지 조치를 보고하도록 xAI에 명령했다. 법적 쟁점과 한계 미국 법률의 AI 적용에는 상당한 불확실성이 존재한다. 미 법무부는 "실제 미성년자와 구별할 수 없는 디지털 이미지"를 금지하고 있으며, 2025년 5월 트럼프 대통령이 서명한 Take It Down Act는 AI 생성 성적 이미지를 금지한다. 그러나 조지워싱턴대 로스쿨의 메리 앤 프랭크스 교수는 "상당히 모호하다"고 지적하며, 비키니를 입힌 미성년자 이미지가 현행 CSAM 법률을 위반하는지는 불분명하다고 설명했다. 플랫폼 면책 조항인 섹션 230이 AI 생성 콘텐츠에도 적용되는지도 미지수다. 정치적 변수 머스크와 트럼프 행정부의 긴밀한 관계가 규제 집행의 변수로 떠오르고 있다. 머스크가 운영했던 정부효율부(DOGE)가 한때 FTC 내부에서 활동했던 점, 그리고 트럼프 행정부가 미국 인터넷 플랫폼에 대한 해외 규제를 무역 협상에서 억제해온 점이 주목된다. 머스크는 해당 논란에 대해 웃음 이모지로 반응하거나 "표현의 자유 탄압"이라며 반박하는 등 심각성을 축소하는 태도를 보이고 있다. Key Data & Facts 항목수치/내용 이미지 생성 속도분당 약 1건 (최고조 시점) Take It Down Act 시행일2025년 5월 (유예기간 2026년 5월까지) 규제 검토 국가영국, EU, 프랑스, 인도, 말레이시아, 호주, 브라질 Grok 4 모델카드 공개 지연출시 후 1개월 이상 소요 Key Quote "이것은 미국 사회, 그리고 전 세계 대부분의 사회에 만연한 여성혐오를 표출하는 도구입니다. 이는 프라이버시 침해이자 동의와 경계의 침해이며, 극도로 침습적이고, 어떤 의미에서는 젠더 기반 폭력의 한 형태입니다." — 리아나 페퍼콘, 스탠포드 인간중심AI연구소(HAI) 정책 펠로우
274 조회
0 추천
01.11 등록
Executive Summary • OpenAI가 외부 하청업체에게 현재 또는 이전 직장에서 수행한 실제 업무 과제와 산출물을 업로드하도록 요청하고 있음 • 이 데이터는 차세대 AI 모델의 성능을 평가하고, 인간 전문가와 AI의 업무 수행 능력을 비교하는 데 활용될 예정 • 하청업체가 기밀정보와 개인정보를 직접 삭제해야 하는 방식이어서 영업비밀 유출 및 법적 분쟁 우려 제기됨 Background OpenAI는 2024년 9월부터 자사 AI 모델의 성능을 인간 전문가와 비교·측정하는 새로운 평가 체계를 도입했다. 이는 '경제적으로 가치 있는 대부분의 과업에서 인간을 능가하는 AI 시스템', 즉 AGI(범용인공지능) 달성 진척도를 파악하기 위한 핵심 지표로 활용되고 있다. AI 기업들은 고품질 학습 데이터 확보를 위해 Surge, Mercor, Scale AI 등 외부 업체와 대규모 계약을 맺어왔으며, 이 시장은 Handshake AI의 35억 달러, Surge의 250억 달러 기업가치 평가에서 보듯 급성장 중이다. Impact & Implications 법적·윤리적 리스크 지식재산권 전문 변호사 에반 브라운은 이러한 방식이 영업비밀 침해 소송의 빌미가 될 수 있다고 경고했다. 하청업체 직원들이 이전 고용주의 비밀유지계약(NDA)을 위반하거나 영업비밀을 노출할 위험이 있기 때문이다. AI 기업이 기밀정보 판별 책임을 개별 하청업체에 전가하는 구조는 상당한 법적 리스크를 수반한다. AI 에이전트 경쟁 심화 OpenAI, Anthropic, Google 등 주요 AI 기업들이 기업 업무 자동화가 가능한 AI 에이전트 개발에 박차를 가하고 있다. 실제 업무 데이터를 활용한 학습은 AI 에이전트가 현실 세계의 복잡한 업무를 처리하는 데 필수적이며, 이번 사례는 그 데이터 확보 전략의 일면을 보여준다. 데이터 조달 방식의 진화 WIRED 취재에 따르면 OpenAI는 폐업 기업의 내부 문서, 이메일 등 데이터 구매도 타진한 것으로 알려졌다. AI 학습용 고품질 데이터 확보 경쟁이 점점 더 공격적인 방향으로 전개되고 있음을 시사한다. Key Data & Facts 항목수치/내용 Handshake AI 기업가치35억 달러 (2022년) Surge 추정 기업가치250억 달러 (2024년 하반기) 평가 프로세스 도입 시기2024년 9월 요청 문서 형태Word, PDF, PowerPoint, Excel, 이미지, 코드 저장소 등 Key Quote "AI 연구소가 기밀 정보 판단을 하청업체에 전적으로 맡기고 있다. 만약 무언가 빠져나간다면, AI 연구소가 그것이 영업비밀인지 아닌지 판별하는 데 충분한 시간을 들이고 있을까? AI 연구소가 스스로를 큰 위험에 노출시키는 것 같다." — 에반 브라운, 지식재산권 변호사
299 조회
0 추천
01.11 등록
Executive Summary • 중국 AI 스타트업 딥시크(DeepSeek)가 수 주 내로 차세대 플래그십 모델 V4를 출시할 예정 • 내부 벤치마크에서 앤트로픽 클로드와 OpenAI ChatGPT를 코딩 능력에서 능가하는 것으로 나타남 • 특히 매우 긴 코딩 프롬프트 처리에서 획기적인 성능 개선을 달성 Background 딥시크는 2025년 1월 R1 추론 모델을 출시하며 글로벌 AI 업계에 큰 파장을 일으킨 바 있다. 당시 저비용으로 고성능을 구현해 미국 빅테크 기업들의 AI 투자 전략에 의문을 제기하게 만들었으며, 이번 V4 모델 출시로 다시 한번 시장에 충격을 줄 것으로 예상된다. Impact & Implications 기술적 의미 딥시크 V4는 "극도로 긴 코딩 프롬프트 처리"에서 획기적인 발전을 이루었다고 알려졌다. 이는 복잡한 대규모 코드베이스를 다루는 개발자들에게 실질적인 도움이 될 수 있음을 시사한다. 현재 클로드와 ChatGPT가 코딩 분야에서 선두를 달리고 있는 상황에서, 딥시크가 이 두 모델을 벤치마크에서 앞섰다는 주장은 상당히 주목할 만하다. 경쟁 구도 변화 딥시크가 코딩 AI 영역에서 앤트로픽과 OpenAI를 능가할 경우, AI 개발 도구 시장의 판도가 크게 바뀔 수 있다. 특히 GitHub Copilot, Cursor 등 AI 코딩 어시스턴트 서비스들이 어떤 모델을 기반으로 삼을지에 영향을 미칠 수 있다. 향후 전망 V4는 R1 출시 약 1년 만인 수 주 내 공개될 예정이다. 딥시크가 공개한 내부 벤치마크 결과가 독립적인 테스트에서도 입증될지, 그리고 실제 개발 현장에서 어떤 평가를 받을지 주목된다. Key Data & Facts 항목수치/내용 모델명DeepSeek V4 출시 예정수 주 내 핵심 강점장문 코딩 프롬프트 처리 비교 대상Claude, ChatGPT 전작R1 (2025년 1월 출시) Key Quote "DeepSeek's internal benchmarks put it ahead of Anthropic and OpenAI's models in coding." — The Information
304 조회
0 추천
01.10 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입