AI 뉴스

AI는 인간의 글쓰기를 완전히 재현할 수 없다는 연구 결과

페이지 정보

작성자 이수
작성일 2025.12.21 17:33
329 조회
0 추천
0 비추천

본문

8f3d75518a616862e3ced4197e28b7c9_1766305953_2608.jpeg
 

이번 주에 발표된 획기적인 연구에 따르면, 기술이 빠르게 발전하고 있음에도 불구하고 ChatGPT와 같은 인공지능 시스템은 인간의 글쓰기를 완전히 모방할 수 없는 것으로 드러났다. 인지 능력에 대한 AI의 영향에 대한 우려가 커지는 가운데 발표된 이 연구는, AI가 생성한 산문이 인간 작가와 구별되는 고유한 “스타일 지문(stylistic fingerprint)”을 지니고 있음을 보여준다.

유니버시티 칼리지 코크의 제임스 오설리번(Dr. James O’Sullivan)이 이끄는 이번 연구는, 전통적으로 필자 식별에 사용되던 계산 기반 방법인 문체 통계 분석(literary stylometry)을 인간과 AI의 창작 글쓰기를 체계적으로 비교하는 데 처음으로 적용한 사례다. 수백 편의 단편소설을 분석한 결과, 연구진은 AI가 매끄럽고 유창한 문장을 생성하긴 하지만, 매우 좁고 균질한 패턴을 따른다는 사실을 발견했다. 이에 반해 인간 작가들은 개인적 목소리, 창작 의도, 개별적 경험에 의해 형성된 훨씬 더 넓은 문체적 스펙트럼을 보여준다.

오설리번은 “ChatGPT가 인간처럼 들리려고 할 때조차 그 글에는 여전히 탐지 가능한 지문이 남아 있으며, 이는 컴퓨터와 사람이 아직은 완전히 같은 스타일로 글을 쓰지 않는다는 점을 시사한다”고 말했다. 네이처(Nature)의 『Humanities and Social Sciences Communications』에 실린 이번 연구 결과에 따르면, GPT-3.5, GPT-4, Llama 70B를 포함한 AI 시스템이 생성한 텍스트는 균질한 패턴을 반영하는 촘촘한 군집으로 모이는 반면, 인간이 쓴 텍스트는 훨씬 더 큰 변이와 개성을 드러낸다.


인지 영향에 대한 우려 증가

스타일로메트리 연구 결과는 AI가 인간 인지에 미치는 영향에 대한 우려스러운 연구들과 함께 제시되고 있다. 매사추세츠 공과대학교(MIT)가 6월에 발표한 한 연구는 54명의 참가자를 대상으로, 에세이를 작성할 때 ChatGPT, 구글 검색, 혹은 어떠한 도움 없이 쓰도록 나누어 살펴보았다. 뇌 스캔 결과, ChatGPT를 사용한 참가자들은 신경 연결성이 가장 약하게 나타났고, 자신이 쓴 글을 기억하는 데 어려움을 겪었다. ChatGPT 사용자 중 83%가 자신의 에세이를 정확히 인용하지 못한 반면, 독립적으로 작성한 그룹에서는 그 비율이 11%에 불과했다.

MIT 연구진은 이 현상을 “인지 부채(cognitive debt)“라고 명명하며, 단기적인 편의를 위해 미래의 인지 능력을 선(先)차입하는 것이라고 설명했다. 뇌만 활용한(도구를 사용하지 않은) 그룹은 창의성, 기억력, 의미 처리와 연관된 주파수 대역에서 가장 강한 신경 네트워크를 보여주었다.

카네기멜론대학교와 마이크로소프트의 별도 연구에서는 319명의 지식 노동자를 대상으로 설문을 진행한 결과, AI 능력에 대한 신뢰도가 높을수록 비판적 사고 노력은 감소하는 경향이 있다는 사실을 밝혀냈다. 이 연구는 실제 AI 보조 과제 936건을 분석했으며, 생성형 AI가 효율성을 높여 주는 동시에 비판적 개입을 약화시키고 독립적인 문제 해결 능력을 떨어뜨릴 수 있다고 결론지었다.


학생들의 우려가 고조되다

옥스퍼드 대학 출판부(Oxford University Press)가 13-18세 영국 학생 2,000명을 대상으로 실시한 설문조사에 따르면, 80%가 학업에 AI를 정기적으로 사용하지만, 62%는 AI가 자신의 기술 개발에 부정적인 영향을 미친다고 생각하는 것으로 나타났다. 학생 4명 중 1명은 AI가 “스스로 과제를 수행하지 않고도 답을 찾는 것을 너무 쉽게 만든다”고 답했으며, 12%는 AI가 창의적 사고를 제한한다고 보고했다.

광범위한 도입에도 불구하고, 학생들은 지침을 요구하고 있다. 옥스퍼드 보고서의 공동 저자인 에리카 갈레아(Erika Galea)는 “오늘날의 학생들은 기계와 함께 사고하기 시작하고 있습니다. 아이디어를 처리하는 데 유창함과 속도를 얻고 있지만, 때때로 멈추고, 질문하고, 독립적으로 사고하는 것에서 오는 깊이를 잃고 있습니다”라고 말했다.

댓글 0
전체 1,366 / 29 페이지
OpenAI의 코딩 에이전트 Codex의 제품 개발을 이끌고 있는 Alexander Embiricos는 일요일에 공개된 Lenny’s Podcast에서 인간의 타이핑 속도와 프롬프트를 지속적으로 작성하고 AI 작업을 검증해야 하는 필요성이 인공 일반 지능을 달성하는 데 있어 “현재 과소평가되고 있는 제한 요인”이라고 말했다.Codex는 8월 출시 이후 20배 성장했으며 현재 매주 수조 개의 토큰을 처리하고 있다. Embiricos는 시스템이 AI 에이전트가 지속적인 인간의 감독 없이 기본적으로 작동할 수 있도록 하면 생산성 향상이 가속화될 것이라고 주장했다.Embiricos는 얼리 어답터들이 2026년부터 극적인 생산성 증가를 경험할 것이며, AGI는 이러한 초기 성과와 주요 기업들이 AI 에이전트를 통해 완전한 자동화를 달성하는 시점 사이 어딘가에 도래할 것이라고 예측했다.
380 조회
0 추천
2025.12.15 등록
한국은 2026년 1월 22일부터 국가 인공지능 기본법을 시행할 예정이며, 2026년 8월부터 대부분의 AI 규칙을 시행할 유럽연합보다 앞서 포괄적인 인공지능 규제를 시행하는 세계 최초의 국가가 됩니다. 이러한 움직임은 최근 조사에서 한국 AI 스타트업의 98%가 대대적인 변화에 여전히 준비되지 않은 것으로 나타나면서, 국내 급성장하는 기술 부문에서 중소기업의 생존에 대한 우려를 불러일으키고 있습니다.​2025년 1월에 법률로 서명된 인공지능 육성 및 신뢰 기반 조성 등에 관한 기본법은 국가 AI 위원회 설립, 기본 3개 년 AI 계획 수립, 특정 AI 시스템에 대한 공개 의무를 포함한 안전성 및 투명성 요구사항 부과를 의무화하고 있습니다. 이 법은 위험 기반 접근 방식을 적용하며, 특히 의료, 교육, 공공 서비스와 같은 중요 부문에서 운영되는 고영향 AI 시스템에 대해서는 엄격한 규칙을 적용합니다.스타트업들, 준비 시간 부족에 경보 발령스타트업 얼라이언스가 2025년 12월 국내 AI 기업 101곳을 대상으로 실시한 조사에 따르면, 신규 규제를 준수하기 위한 대응 시스템을 구축한 기업은 단 2%에 불과한 것으로 나타났다. 나머지 기업 중 48.5%는 법에 대해 익숙하지 않고 준비가 되어 있지 않다고 답했으며, 다른 48.5%는 인지하고 있으나 준비가 부족하다고 응답했다. 조사는 불명확한 기준, 특히 통지 범위, 생성형 AI의 정의, 고영향 AI 시스템 지정 기준 등을 주요 부담 요인으로 지적했다.​한국인터넷기업협회 관계자는 현지 언론에 "절차상 요건으로 인해 시행령이 법 시행 직전에야 확정될 것으로 예상되어 기업들이 새로운 규정에 대비할 충분한 시간을 갖지 못할 수 있다"고 말했다. "특히 스타트업에게는 매우 부담스러울 것이다."​업계 관계자들은 일부 기업들이 1월 22일 이후 서비스를 갑작스럽게 수정하거나 중단해야 할 수도 있다고 경고한다. 이러한 규제 압박은 엄격한 준수 요건보다 혁신 촉진에 초점을 맞춘 부드러운 자율 거버넌스 접근 방식을 채택한 일본으로의 이전을 고려하는 한국 AI 스타트업의 수를 증가시키는 것으로 여겨진다.워터마크 요구사항이 논란을 촉발하다AI 생성 콘텐츠에 라벨을 표시하도록 요구하는 의무적 워터마킹 조항은 새로운 프레임워크에서 특히 논란이 되는 측면으로 부상했습니다. 딥페이크와 허위정보를 억제하기 위한 목적이지만, 업계 관계자들은 요구사항이 너무 모호하며 소비자들이 AI 생성 제품을 기피하게 만들 수 있다고 주장합니다.​"AI 생성 콘텐츠라도 일반적으로 품질을 향상시키기 위해 수많은 개인들이 협력하지만, 'AI 생성'으로 표시되면 소비자들이 꺼릴 수 있습니다"라고 한 AI 콘텐츠 기업의 관계자가 밝혔습니다. 2025년 12월에 발표된 AI 생성 광고에 대한 모니터링 강화 계획은 소셜 미디어 플랫폼 전반에 걸쳐 확산되는 조작된 콘텐츠와 딥페이크에 대한 우려를 더욱 강조합니다.​우려에도 불구하고, 과학기술정보통신부는 행정 벌금을 부과하기 전에 최소 1년의 유예 기간을 발표하여 기업들에게 추가 준비 시간을 제공했습니다. 배경훈 장관은 시행령이 "대한민국이 글로벌 AI 강국 3위로 도약하기 위한 제도적 초석"이 될 것이라고 강조했습니다.
362 조회
0 추천
2025.12.15 등록
인공지능(AI) 모델들의 성능 경쟁이 치열해지면서, 추론, 수리 등 종합적인 역량을 객관적으로 평가하는 다양한 벤치마크에 대한 관심이 높아지고 있습니다. 사용자의 직접적인 평가를 반영하는 '엘엠아레나(LMArena)'는 익명으로 받은 두 개의 AI 답변 중 더 우수한 것을 고르거나 무승부를 선언하여 순위를 매기는 방식입니다.기존 벤치마크의 한계를 극복하기 위해 만들어진 '인류의 마지막 시험(HLE)'은 수학, 물리학 등 100개 이상 과목의 고난도 문제를 통해 AI의 정답률을 측정합니다. 또한, AI의 자율적인 경제활동 능력을 측정하는 '벤딩 벤치(Vending-Bench)'는 AI가 재고 관리와 가격 책정 등을 얼마나 잘 수행하는지 평가합니다.이 외에도 코딩 오류 해결 능력을 평가하는 'SWE벤치'와 수학 올림피아드 난이도의 '매스아레나 에이펙스' 등 다양한 전문 벤치마크들이 활용됩니다. 하지만 이러한 AI 벤치마크는 윤리나 안전보다는 높은 경제적 보상이 기대되는 과업에만 초점을 맞춘다는 비판도 제기됩니다.
358 조회
0 추천
2025.12.14 등록
앨런 AI 연구소(Ai2)는 훈련 데이터와 가중치까지 완전히 공개하는 대표적인 대형언어모델(LLM)인 '올모(OLMo) 3'의 업데이트 버전 '올모 3.1'을 공개했습니다. 새로 출시된 '올모 3.1 싱크 32B'와 '올모 3.1 인스트럭트 32B'는 강화 학습(RL)을 추가 적용하여 추론, 수학, 지시 이행 능력 등 여러 벤치마크에서 성능이 크게 향상되었습니다.특히, '싱크 32B'는 고급 추론과 연구 목적에 최적화되었으며, '인스트럭트 32B'는 대화형 AI와 툴 기반 워크플로에 맞춰 현재까지 공개된 완전 오픈 소스 32B급 지시형 모델 중 가장 강력한 성능을 자랑합니다. Ai2는 이를 새로운 모델 출시가 아닌 '체크포인트 추가' 개념으로 소개하며, 개발자들이 모델의 학습 과정을 완벽하게 통제하고 자체 데이터를 추가해 재학습할 수 있도록 지원합니다.Ai2는 올모 시리즈가 개방성과 성능을 동시에 발전시킬 수 있음을 보여주며, 학습 데이터, 코드, 결정에 대한 엔드투엔드 투명성을 유지하면서 기능을 지속적으로 개선했다고 강조했습니다. 이 새로운 '체크포인트' 모델들은 Ai2 플레이그라운드와 허깅페이스를 통해 제공되어 개발자 및 연구기관의 활용을 넓힐 예정입니다.* 앨런 인공지능 연구소(Ai2)는 마이크로소프트 공동 창립자였던 고(故) 폴 앨런이 공익을 위해 고도(하이-임팩트) AI 연구 및 엔지니어링을 수행할 목적으로 2014년에 설립한 비영리 연구소입니다. 이 연구소는 텍스트를 읽고 추론하여 지식을 입증하는 AI 시스템 개발을 목표로 시작했으며, 현재도 개방성과 투명성을 중시하며 AI 분야의 발전을 주도하고 있습니다.
369 조회
0 추천
2025.12.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입