Loading...

AI 뉴스

마이크로소프트, VS 코드 기본 AI를 GPT-5에서 클로드로 전환

페이지 정보

작성자 xtalfi
작성일 2025.09.17 16:15
551 조회
0 추천
0 비추천

본문

64d20d50a290f6d3b1b62c144d12294eOcQe.png

(퍼플렉시티가 정리한 기사)

마이크로소프트는 Visual Studio Code에서 주목할 만한 전략적 전환을 단행하여, 코딩 작업에서 OpenAI의 GPT-5보다 Anthropic의 Claude Sonnet 4를 기본값으로 하는 자동 AI 모델 선택 기능을 도입했습니다. 이 변화는 2019년 이후 OpenAI에 130억 달러를 투자해온 이 기술 대기업이 AI 전략에서 더 넓은 변화를 모색하고 있음을 시사합니다.


새롭게 도입된 자동 모델 선택 기능은 9월 15일에 출시되었으며, GitHub Copilot 사용자에게 Claude Sonnet 4, GPT-5, GPT-5 mini 및 기타 모델 중에서 자동으로 선택해줍니다. 무료 사용자들은 다양한 모델이 순환 적용되는 경험을 하게 되지만, 유료 구독자들은 마이크로소프트의 공식 발표에 따르면 “주로 Claude Sonnet 4에 의존”하게 됩니다.


내부 벤치마크가 모델 선호도를 결정한다


이 결정은 내부 성과 평가에서 Anthropic의 제품이 지속적으로 우위를 보인 데에서 비롯되었습니다. 마이크로소프트 개발 부문 사장 줄리아 리우손은 6월 사내 이메일에서 직원들에게 “내부 벤치마크 기준으로 GitHub Copilot에 권장하는 모델은 Claude Sonnet 4입니다”라고 밝혔습니다. 이 권고는 GPT-5 출시 이전에 이루어졌으며, OpenAI가 최신 모델을 출시한 이후에도 변함이 없었던 것으로 전해집니다.


회사 개발 계획에 정통한 마이크로소프트 소식통들은 엔지니어들이 몇 달 전부터 코딩 작업에서 기본적으로 Claude Sonnet 4를 사용하라는 조용한 지시를 받았다고 밝혔습니다. GitHub 내부에서 이뤄진 초기 테스트에서는, GitHub 엔지니어들에 따르면 Claude 4가 “더 오래 집중을 유지하고, 문제를 더 깊이 이해하며, 보다 우아한 코드를 제공”하는 것으로 나타났습니다.


복잡한 코딩 벤치마크에서 모델의 우수한 성능이 핵심 요인이 되었습니다. Claude Sonnet 4는 소프트웨어 엔지니어링 벤치마크인 SWE-bench에서 72~73%의 정확도를 기록해 경쟁 모델들을 제쳤습니다. 마이크로소프트 내부 테스트 결과, Anthropic의 모델은 특정 개발자 워크플로에서 OpenAI의 제품보다 “미묘하지만 중요한 방식으로” 더 뛰어난 성과를 보인 것으로 나타났습니다.


Visual Studio Code를 넘어 확장하기


이 AI 모델의 다양화는 Visual Studio Code를 넘어 마이크로소프트의 광범위한 생산성 제품군으로 확장되고 있습니다. The Information은 마이크로소프트 365 코파일럿이 곧 내부 테스트에서 Claude가 엑셀 자동화와 파워포인트 프레젠테이션 생성에서 더 우수한 성능을 보인 결과 “부분적으로 Anthropic 모델이 구동할 것”이라고 보도했습니다.


AI 업계의 경쟁 역학을 강조하는 복잡한 계약 구조 속에서, 마이크로소프트는 Anthropic의 모델에 접근하기 위해 자사의 애저(Azure) 클라우드 플랫폼과 직접 경쟁하는 Amazon Web Services에 비용을 지불할 예정입니다. 이러한 추가 비용에도 불구하고, 마이크로소프트는 사용자를 위한 Copilot의 월 요금을 30달러로 유지할 계획입니다.


AI 경쟁 속에서의 파트너십 재구성


이러한 시기는 마이크로소프트와 OpenAI 관계의 중대한 변화와 일치한다. 양사는 9월 11일 파트너십을 재구성하기 위한 구속력 없는 양해각서에 서명했으며, 이를 통해 OpenAI가 공익법인으로의 전환을 추진할 수 있게 되었다. 개정된 조건에 따르면, OpenAI의 마이크로소프트와의 수익 분배는 2030년까지 20%에서 약 8-10%로 감소할 것으로 예상되며, 이는 AI 스타트업에게 500억 달러 이상의 추가 수익을 가져다줄 가능성이 있다.


마이크로소프트 AI CEO 무스타파 술레이만은 9월 12일 직원 타운홀 미팅에서 회사의 자체 AI 인프라에 대한 “상당한 투자” 계획을 발표했다. 회사의 MAI-1-preview 모델은 15,000개의 엔비디아 H100 칩으로 훈련되었으며, 술레이만은 이를 “6배에서 10배 더 큰” 규모가 될 미래 클러스터와 비교하여 “작은” 규모라고 평가했다.


멀티 모델 전략이 등장하다


이러한 발전은 마이크로소프트의 AI 파트너십에 대한 진화하는 접근 방식을 반영합니다. CEO 사티아 나델라는 타운홀 미팅에서 마이크로소프트가 “확실히 다양한 모델을” 자사 제품 전반에서 지원할 것이라고 강조하며, 이러한 멀티 모델 전략의 예시로 GitHub Copilot을 언급했습니다.


개발자에게는 자동 선택 기능이 유료 사용자에게 10% 요청 할인과 레이트 리미팅 감소 등 실질적인 이점을 제공합니다. 이 시스템은 현재의 용량과 성능을 바탕으로 최적의 모델을 자동으로 선택하며, 사용자는 챗 답변에 마우스를 올리면 어떤 모델이 각각의 응답을 제공했는지 확인할 수 있습니다.


이러한 전략적 변화는 인공지능 개발에서 성능 벤치마크가 전통적인 공급업체 관계보다 파트너십 결정을 더욱 주도하는 경쟁의 치열함을 강조합니다. 마이크로소프트가 오픈AI 투자와 동시에 AI 포트폴리오를 다양화하는 가운데, 이번 행보는 여러 AI 공급자가 기업용 소프트웨어 경험의 다양한 부분을 지원하는 미래를 시사합니다.

댓글 0
전체 469 / 65 페이지
(퍼플렉시티가 정리한 기사)엘론 머스크는 화요일 늦게 자신의 인공지능 벤처 xAI가 “Grok 5로 AGI에 도달할 가능성이 있다”고 말하며, 자신이 이전에는 “그럴 수 있다고는 결코 생각하지 못했다”며 놀라움을 표했다. 이 발언은 그의 개인 X 계정에 게시되었으며, 최근 Grok 4 모델이 이번 주 초 ARC-AGI 추론 벤치마크에서 최고 자리에 오른 이후 Grok의 다음 버전에 대한 기대를 더욱 높이고 있다.머스크의 트윗이 중요한 이유범용 인공지능(Artificial General Intelligence, AGI)—다양한 분야에서 인간의 인지 능력과 동등하거나 뛰어넘는 소프트웨어—는 업계의 성배로 여겨지고 있다. 머스크의 선언으로 그록 5(Grok 5)가 처음으로 plausibly AGI 후보로 공개적으로 홍보된 상업적 모델 중 하나가 되었다. 그의 자신감은 xAI 모델인 그록 4(Grok 4)가 ARC-AGI 리더보드에서, 추상적 문제 해결과 프로그램 합성 과제에서 오픈AI 및 안트로픽(Anthropic)의 경쟁 시스템을 능가한 성과에서 비롯된 것이다. ARC Prize 주최측은 이 테스트를 AI가 “추론하고, 새로운 문제를 해결하며, 새로운 상황에 적응하는 능력”을 측정하는 시험이라고 설명하며, 이 특성이 AGI의 필수 조건으로 간주된다고 밝혔다.교육 일정 및 기술적 목표머스크는 또한 “Grok 5가 몇 주 후에 훈련을 시작한다”고 확인했으며, 올해 말 출시를 목표로 순조롭게 진행되고 있다고 밝혔다. 업계 관측자들은 새로운 모델이 수만 개의 Nvidia GPU를 차지할 것으로 추정하며, 이는 더 큰 경쟁업체들의 하드웨어 예산에 비하면 일부분에 불과해 xAI가 속도와 효율성에 중점을 두고 있음을 보여준다. 회사 엔지니어들은 Grok 5가 멀티모달 입력과 환각을 줄이면서 컨텍스트 윈도우를 확장할 수 있도록 설계된 새로운 “사고” 아키텍처를 도입할 것이라고 암시했다.xAI 내부의 혼란낙관적인 전망은 조직 내 변화가 한창인 가운데 나왔다. 비즈니스 인사이더에 따르면, xAI는 지난주 500명이 넘는 데이터 주석(contractor) 인력을 해고했고, 20세 대학생 디에고 파시니를 Grok의 학습 데이터 라벨링을 담당하는 팀의 책임자로 승진시켰다. 더 버지는 별도의 보도를 통해, 이러한 감원 조치는 일반 주석자보다 “특화된 AI 튜터”로의 전환이라는 내부 메모가 있었음을 확인했다. xAI는 논평을 거부했지만, 전 직원들은 인원의 대폭 감축으로 인해 머스크의 가속화된 일정에 소수의 인력만으로 대응할 수 있을지 의문을 제기했다.분석가들은 어떠한 혁신적인 돌파구도 xAI를 넘어서는 파급력을 가질 수 있다고 지적한다. 머스크는 이 스타트업을 테슬라에 합병하는 방안을 언급한 바 있는데, 만약 이뤄진다면 테슬라의 자율주행 및 로보틱스 프로그램에 고급 추론 역량이 더해질 수 있다. 현재로서는 투자자와 연구자 모두 Grok 5의 향후 학습 과정이 대담한 예측을 AGI(범용 인공지능) 달성을 향한 기준 검증(progress)으로 바꿀 수 있을지 주목하고 있다.
509 조회
0 추천
2025.09.18 등록
(퍼플렉시티가 정리한 기사)인공지능은 고등 교육을 빠르게 재편하고 있지만, 이러한 변화는 학생 학습, 비판적 사고, 그리고 학문적 진실성에 미치는 영향에 대한 심각한 우려를 불러일으키고 있습니다. 최근 연구와 교육자들의 증언은 기술 발전이 교육의 목적과 가치에 대한 근본적인 질문과 충돌하는 복잡한 환경을 보여줍니다.대학생들은 전례 없는 속도로 AI 도구를 받아들이고 있습니다. 영국 고등교육정책연구소(UK Higher Education Policy Institute)에 따르면, 2025년 대학생의 92%가 AI를 적극적으로 사용하고 있었으며, 이는 2024년의 66%에서 드라마틱하게 증가한 수치입니다. 이들 중 88%는 과제 수행, 개념 설명, 기사 요약, 그리고 직접 글 생성에 생성형 AI를 활용했습니다.우려는 단순한 부정행위 고발을 훨씬 넘어섭니다. 요크대학교(University of York)의 레오 맥캔(Leo McCann) 교수와 사이먼 스위니(Simon Sweeney) 교수는 최근 가디언(Guardian) 기고문에서 학생들 사이에 부적절한 AI 사용이 만연하며, 많은 평가가 “ChatGPT를 통한 필터링”을 거치고 있다고 지적합니다. 그들은 AI로 생성된 학술 과제 답변이 종종 “일반적이고, 영감을 주지 못하며, 사실과 다른 경우가 많다”고 관찰했다고 밝혔습니다. 한 예로, 1922년 헨리 포드(Henry Ford)의 기사를 분석한 학생들이 이 논란적인 산업가를 “정교한 HR 성과 기능을 만든 인물”로 묘사하고, 그를 “변혁적 리더”라고 특징지었습니다.압박 속의 학문적 정직성AI 사용의 급증은 연구자들이 “악성 문제(wicked problem)“라고 부르는, 명확한 해결책이 없는 문제를 대학에 야기했습니다. 최근 20명의 대학 교육자를 대상으로 한 연구에서는, 평가를 AI에 더 저항적으로 만들려는 시도가 종종 교육 목표를 희생시킨다는 사실이 밝혀졌습니다. 한 교육자는 “우리는 평가를 AI에 더 저항적으로 만들 수 있지만, 너무 경직시킨다면 창의성보다는 준수 여부만을 테스트하게 된다”고 언급했습니다.이러한 문제로 인해 대학들은 급하게 새로운 정책과 탐지 도구를 도입하고 있습니다. 그러나 AI 탐지 소프트웨어는 신뢰도가 낮아, 높은 오류율로 인해 정직한 학생들에게도 잘못된 누명을 씌우는 경우가 많습니다. 실제로 상황이 너무 심각해져, 버팔로 대학의 AI 탐지 서비스를 중단하라는 청원에 1,000명 이상의 사람들이 서명한 바 있습니다. 이는 여러 대학원생이 잘못된 비행 혐의를 받게 된 사건이 발생한 뒤였습니다.관련성 격차일부 전문가들은 AI의 광범위한 사용이 더 깊은 문제를 반영한다고 주장합니다. 학생들은 자신들이 시대에 뒤떨어진 기술을 개발하도록 요구받고 있음을 인식한다는 것입니다. 세계경제포럼(World Economic Forum)의 2025 미래 직업 보고서에 따르면, AI가 점점 더 잘 다루는 일상적인 읽기, 쓰기, 수학적 연산 능력은 점차 덜 중요해지고 있습니다. 학생들이 AI를 사용하는 것은 게으름 때문이 아니라, 점점 가치가 줄어드는 기술을 연습하라는 요구를 받고 있기 때문일 수 있습니다.변화를 위한 요구교육자들은 다양한 전략으로 대응하고 있습니다. 일부는 인공지능 부정행위에 취약한 과제를 포기하고, 더 창의적이고 개인화된 과제로 대체하고 있습니다. 또 다른 이들은 인공지능을 위협이 아닌 학습 도구로 여기며, 투명한 인공지능 통합을 옹호합니다. MIT를 비롯한 여러 기관은 인공지능 탐지 소프트웨어에만 의존하지 말라는 지침을 발표했습니다.이 논쟁은 인공지능이 지배하는 세상에서 교육의 역할에 대한 더 광범위한 질문을 반영합니다. 일부 교사는 인공지능이 학생과 교사의 ‘성장’을 저해할 것이라고 우려하는 반면, 다른 이들은 인공지능이 미래 직장의 불가피한 일부임을 받아들여야 한다고 주장합니다.McCann과 Sweeney가 가디언에 보낸 서한에서 결론을 내리듯, 인공지능이 일, 교육, 일상생활에 미칠 영향을 이해하기 위해서는 ‘지나치게 축하하기보다 더 비판적인 관점’이 필요합니다. 고등교육의 과제는 인간만이 할 수 있는 깊이 있는 사고와 비판적 분석을 유지하면서도 인공지능의 이점을 활용할 수 있는 방안을 찾는 것입니다.
494 조회
0 추천
2025.09.18 등록
(퍼플렉시티가 정리한 기사)정부가 17일 2026년 1월 시행되는 AI기본법의 하위법령 초안을 공개하며 ‘필요 최소한의 규제’ 원칙을 바탕으로 산업 진흥에 방점을 둔 규제 완화 기조를 명확히 했다. 과학기술정보통신부는 이날 기자설명회에서 시행령 34개 조항과 고시 2건, 가이드라인 5건으로 구성된 하위법령을 발표했다.과태료 1년 이상 유예로 기업 부담 완화정부는 법 시행 초기 기업의 혼란을 최소화하기 위해 과태료 부과에 최소 1년 이상의 계도기간을 운영하기로 했다. 김경만 과기정통부 인공지능기반정책관은 “적어도 1년 이상 유예할 수 있다는 배경훈 장관 말이 기준점이 될 것”이라며 “국내 이해관계자뿐 아니라 글로벌 규제 강도와 동향을 함께 보면서 설정할 계획”이라고 밝혔다.이 기간 동안 사실조사와 시정명령은 진행하되 과태료는 부과하지 않으며, 컨설팅과 비용 지원을 통해 중소·스타트업의 부담을 줄이겠다는 방침이다. 정부는 또한 “충분한 증거 확보”나 “부당한 민원”의 경우 사실조사를 생략할 수 있도록 예외 조항을 명문화했다.고영향AI·고성능AI 기준 명확화하위법령은 ‘고영향 AI’를 생명·신체·기본권에 중대한 영향을 미칠 수 있는 시스템으로 정의하고, 에너지·보건의료·교통·교육 등 10개 영역에서 구체적 기준을 제시했다. 해당 사업자는 위험 관리 체계 수립과 설명 가능성 확보, 이용자 보호 방안 등을 문서화해 보관해야 한다.누적 연산량이 10의 26승 부동소수점 연산 이상인 ‘고성능 AI’에 대해서는 안전성 확보 의무를 부과한다. 이는 EU 기준인 10의 25승보다 완화된 미국 기준을 따른 것으로, 현재 국내에는 해당 기준을 충족하는 모델이 없다고 정부는 설명했다.글로벌 기업 국내 대리인 지정 의무화Google 같은 해외 대형 AI 사업자는 전년도 매출액 1조원 이상, AI 서비스 매출액 100억원 이상, 일평균 국내 이용자 100만명 이상 등의 기준을 충족할 경우 국내 대리인을 반드시 지정해야 한다. 이는 정보통신망법과 개인정보보호법 규정과 동일한 기준이다.생성형 AI에는 사전 고지와 워터마크 표시 의무가 부과되지만, 비가시적 워터마크도 허용해 콘텐츠 산업 위축 우려를 완화했다. 김경만 국장은 “AI 기술 발전 속도가 워낙 빨라 가능한 한 규제는 최소화하고 산업 진흥에 중점을 뒀다”고 강조했다.정부는 이달 중 산·학·연과 시민단체 등의 의견을 수렴한 후 10월 입법예고를 거쳐 연내 시행령과 가이드라인을 확정·공개할 예정이다.
497 조회
0 추천
2025.09.18 등록
(퍼플렉시티가 정리한 기사)티맵이 SK텔레콤의 인공지능 서비스 ‘에이닷’을 적용해 대화형 모빌리티 AI 에이전트로 진화한다는 소식이 17일 발표됐다. 티맵모빌리티와 SK텔레콤은 기존 ‘누구’ 기반 음성 안내 체계를 전면 개편하고, 운전자와의 자연스러운 대화를 통해 내비게이션 서비스의 새로운 패러다임을 제시한다고 밝혔다.음성 명령의 혁신적 변화이번 업데이트의 핵심은 정형화된 명령어 체계에서 벗어나 일상 대화 수준의 자연스러운 음성 인식이 가능해진다는 점이다. 운전자가 “근처 주유소 들렀다 집에 가자”라고 말하면 목적지와 경유지를 동시에 인식해 최적 경로를 안내하는 식이다.더욱 주목할 만한 기능은 지명 오류 자동 교정 능력이다. 예를 들어 운전자가 ‘광탄면 행복 복지센터’라고 잘못 말해도 에이닷이 ‘광탄면 행정 복지센터’로 자동 보정해 제안한다. 기존에는 부정확한 지명 입력 시 여러 후보를 화면에 표시해 운전자가 직접 선택해야 했지만, 이제는 음성만으로 목적지 설정이 완료된다.맞춤형 검색과 개인화 서비스새로운 티맵은 조건·테마 기반 검색 기능을 대폭 강화했다. “주차 가능한 카페 찾아줘”, “지금 영업하는 식당 어디야” 같은 조건 검색뿐만 아니라 “분위기 좋은 식당 가자”, “아이와 함께 가기 좋은 곳 알려줘” 등 테마별 검색도 지원한다.운전자의 주행 이력과 즐겨찾기 데이터를 활용한 맞춤형 응답도 제공된다. “유치원으로 가자”라고 말하면 인근 유치원 목록을 나열하는 대신 즐겨찾기한 유치원을 우선 추천하는 방식이다. 대화 연속성도 강화돼, “근처 치과로 가자” 후 “영업 중인지 알려줘”라고 연이어 질문하면 경로 안내와 영업 시간을 함께 제공한다.AI 에이전트 시장의 급성장이번 티맵 업데이트는 글로벌 AI 에이전트 시장의 급성장 추세와 맥을 같이 한다. 시장조사기관 마켓앤드마켓에 따르면 글로벌 AI 에이전트 시장 규모는 올해 76억 달러에서 2030년 471억 달러로 연평균 45.8% 성장할 것으로 전망된다.SK텔레콤의 에이닷은 7월 말 기준 가입자 1000만 명을 돌파했으며, 최근 베타 서비스로 선보인 ‘노트’와 ‘브리핑’ 기능도 출시 한 달 만에 80만 명 이상의 사용자를 확보하는 등 빠른 확산세를 보이고 있다.김지훈 SK텔레콤 AI사업전략본부장은 “에이닷을 티맵에 도입함으로써 명령어 중심의 일방향적 소통을 넘어 운전자의 의도를 이해하는 자연스러운 대화 경험을 제공하고자 한다”며 “에이닷이 사용자의 니즈를 선제적으로 파악하고 원하는 후속 행동까지 매끄럽게 수행할 수 있도록 지속 고도화하겠다”고 밝혔다.이번 업데이트는 17일부터 안드로이드에서 우선 제공되며, iOS에는 순차적으로 확대될 예정이다.
480 조회
0 추천
2025.09.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입