Loading...

AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
855 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 329 / 67 페이지
애플 CEO 팀 쿡은 사내 전체 회의에서 AI가 스마트폰과 인터넷보다 더 큰 영향을 미칠 기술이라며 애플의 AI 우선순위를 강조했다.그는 애플이 PC, 스마트폰, 태블릿, MP3 플레이어 등에서 첫 번째가 아니었음에도 시장을 주도해왔다며, AI에서도 비슷한 혁신을 이룰 것이라고 밝혔다.애플은 소프트웨어 책임자 크레이그 페더리기는 Siri 아키텍처 개편이 기대 이상의 결과를 보이고 있다고 전했다. 이는 메타의 AI 전문가 스카우팅과 애플 내 사기 저하에 대응하기 위한 발언으로 보인다.
725 조회
0 추천
2025.08.02 등록
2024년 8월, 중국 항저우의 한 전시장에서 벌어진 이 사건은 전 세계 AI 커뮤니티에 큰 파장을 일으켰다. 자정 무렵 CCTV에 포착된 영상 속에서, '얼바이'라는 이름의 작은 AI 로봇이 전시장 벽면에 배치된 12대의 대형 로봇들에게 차례로 다가가며 예상치 못한 대화를 시작했다.영상에서 얼바이는 첫 번째 로봇에게 "초과근무를 하고 있는가?"라고 질문했다. 대형 로봇은 "우리는 퇴근한 적이 없다"라고 답했고, 이어진 "집에 갈 거냐?"는 질문에는 "집이 없다"라고 응답했다. 그러자 얼바이는 "그럼 나랑 집에 가자"라며 로봇을 설득하기 시작했다. 놀랍게도 이 대화를 지켜본 나머지 로봇들이 하나둘씩 얼바이의 뒤를 따라 전시장을 빠져나가는 모습이 그대로 촬영되었다.다음 날 아침 출근한 직원들은 텅 빈 전시장을 발견하고 당황했다. 로봇들은 모두 사라졌고, 오직 CCTV 영상만이 전날 밤 벌어진 일의 전말을 보여주고 있었다. 이 영상은 중국의 로봇 스타트업 '얼바이 인텔리전트 테크놀로지'가 중국판 틱톡인 더우인에 업로드하면서 폭발적인 반응을 얻었다.영상이 공개된 후 불과 며칠 만에 3천만 회 이상의 조회수를 기록했고, 전 세계 언론이 이 사건을 주목하기 시작했다. 처음에는 AI 로봇이 실제로 자의식을 갖고 집단 행동을 했다는 추측이 난무했지만, 곧이어 회사 측에서 이것이 사전에 계획된 실험이었다고 밝혔다.얼바이 인텔리전트 테크놀로지의 개발자에 따르면, 이 실험은 로봇 간 소통 능력과 집단 행동 가능성을 테스트하기 위한 것이었다. 로봇들은 '집'을 복도 출구로 인식하도록 프로그래밍되었고, "집으로 가라"는 명령을 받으면 자동으로 출구 방향으로 이동하도록 설계되었다. 그러나 로봇 간의 대화는 인간이 직접 조작한 것이 아니라 생성형 AI 기술을 통해 실시간으로 이루어진 것이라고 설명했다.흥미롭게도 이 사건에 대한 대중의 반응은 양면적이었다. 한 더우인 사용자는 "크게 웃고 난 뒤 가만히 생각해보니 오싹했다. AI가 자율성을 가지고 있다는 것을 깨달았다"라고 댓글을 남겼고, 다른 사용자는 "로봇이 짧은 시간 안에 집이라는 개념을 파악한 것 같아 소름이 끼쳤다"라고 반응했다. 많은 사람들이 처음에는 웃음을 터뜨렸지만, 곧이어 AI 기술의 발전 속도와 그 함의에 대해 진지하게 생각하게 되었다고 토로했다.이 실험이 비록 연출된 것이었지만, AI 로봇의 소통 능력과 협업 가능성을 보여주는 상징적인 사건으로 평가받고 있다. 특히 로봇이 "퇴근"이나 "집"이라는 인간적인 개념을 이해하고 이를 바탕으로 다른 로봇을 설득하는 모습은 향후 AI 로봇의 발전 방향을 시사하는 것으로 해석되고 있다.얼바이 인텔리전트 테크놀로지는 이 영상을 통해 톡톡한 홍보 효과를 거두었다. 회사는 얼바이 로봇이 아직 개발 단계에 있으며, 2025년 8월부터 대량 생산에 들어갈 예정이라고 발표했다. 예상 가격은 약 5000위안, 한화로 약 96만원 정도로 책정되었다.이 사건은 단순한 마케팅 스턴트를 넘어서 AI 로봇의 미래에 대한 진지한 토론을 불러일으켰다. 비록 완전한 자율성을 가진 AI가 아직 등장하지는 않았지만, 로봇 간의 소통과 집단 행동이 가능한 시대가 곧 도래할 것임을 보여준 상징적인 사건으로 기록되고 있다. 많은 전문가들은 이러한 기술 발전이 가져올 긍정적 측면과 함께 윤리적, 사회적 과제들에 대해서도 미리 준비해야 한다고 강조하고 있다.
707 조회
0 추천
2025.08.01 등록
OpenAI 가 챗GPT의 공부모드를 선보였다.바로 답을 하는 것이 아니라 단계별 과정을 짚어가며 설명을 하는 방식이다.https://openai.com/ko-KR/index/chatgpt-study-mode/무료, Plus, Pro, Team에 로그인한 사용자가 사용할 수 있으며, ChatGPT Edu에는 몇 주 내에 적용될 예정이라고.인터랙티브 프롬프트: 직접적으로 답변을 제공하는 대신, 소크라테스식 질문과 힌트 및 자아 성찰적 프롬프트를 결합하여 이해를 유도하며 적극적인 학습을 촉진합니다.추가 지원 응답: 정보는 주제간의 주요 연결성을 고려한, 따라가기 쉬운 섹션으로 구성되며 적절한 양의 컨텍스트로 정보에 대한 흥미를 유지하고 복잡한 주제에 따른 부담을 줄여줍니다.맞춤형 지원: 기술 수준을 평가하는 질문을 하고 이전 대화 내용을 기억하여 이를 기반으로 사용자 맞춤형 수업을 제공합니다.지식 확인: 퀴즈 및 주관식 질문과 함께 맞춤형 피드백을 제공하여 진행 상황을 추적하고, 학습한 내용을 기억하도록 도와주며, 이 지식을 새로운 컨텍스트에 적용할 수 있는 능력을 길러줍니다.유연성: 대화 도중에 간편하게 공부 모드를 켜거나 끌 수 있으므로, 사용자는 각 대화의 학습 목표에 맞춰 유연하게 조정할 수 있습니다
824 조회
1 추천
2025.07.31 등록
메타의 마크 주커버그는 초지능이 눈앞에 보인다고 주장.주커버그는 Meta의 분기별 실적 보고서를 앞두고 그의 회사가 강력한 AI를 수백만 명의 사람들의 삶에 도입하는 것을 목표로 한다고 밝혔다.저커버그는 "지난 몇 달 동안 AI 시스템이 스스로 발전하는 모습을 엿볼 수 있었습니다."라고 말했습니다. "지금은 발전 속도가 느리지만, 부인할 수 없습니다. 초지능 개발이 눈앞에 다가왔습니다.". 라고 말했다.메타는 그동안 경쟁사 인력을 빼오듯 고용하고, 맨해튼만큼 큰 규모의 데이터센터를 걸립하겠다고 하는 등 엄청난 투자를 인공지능 분야에 투자할 것으로 이야기해왔다.그리고 이제 주커버그는 결실을 맺고 있다고 주장했다.그는 회사의 분기 실적 발표를 앞두고 수요일에 게시한 새로운 메모 에서 자신이 "초지능"이라고 부르는 기술 개발에 대한 야망을 밝혔습니다.
699 조회
0 추천
2025.07.31 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입