AI 뉴스

AI 챗봇이 환자 치료에서 가능성을 보이다

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:09
2,020 조회
0 추천
0 비추천

본문

1d0d9a4d33bbf927fa21a93d7d568594.png

(퍼플렉시티가 정리한 기사)

대규모 언어 모델은 의료 분야 애플리케이션에서 상당한 잠재력을 보여주고 있으며, 최근 연구들은 환자 교육 및 임상 워크플로우를 향상시킬 수 있는 능력을 보여주는 동시에 신중한 고려가 필요한 중요한 한계점들을 드러내고 있습니다.

 

중재적 영상의학 교육에서의 우수한 성과

 

CVIR Endovascular에 10월 13일 게재된 연구에 따르면, DeepSeek-V3와 ChatGPT-4o는 복잡한 중재적 영상의학 시술에 관한 환자 질문에 답변하는 데 있어 우수한 성능을 보였습니다. 베를린 샤리테 의과대학(Charité-Universitätsmedizin Berlin) 연구진은 경동맥 관절주위 색전술(TAPE), CT 유도 고선량률 근접치료, 블레오마이신 전기경화요법 시술과 관련된 107개의 질문에 대해 4개의 LLM을 평가했습니다.​

DeepSeek-V3는 BEST 질문(4.49점)과 CT-HDR 근접치료 질문(4.24점)에서 가장 높은 평균 점수를 달성했으며, TAPE 관련 질문에서는 ChatGPT-4o와 비슷한 성능을 보였습니다. 그러나 의학적으로 사전 훈련된 모델인 OpenBioLLM-8b와 BioMistral-7b는 훨씬 낮은 성능을 보였으며, BioMistral-7b는 방사선 노출에 관한 잠재적으로 위험한 정보를 제공했습니다.

 

종양학에서 안전한 AI 구현을 위한 첫 번째 지침

 

10월 20일, 유럽종양학회(European Society for Medical Oncology)는 대규모 언어 모델(LLM)을 암 치료에 안전하게 통합하기 위한 최초의 구조화된 지침을 발표했습니다. ESMO의 임상 진료에서 대규모 언어 모델 사용에 관한 지침(ELCAP)은 특정 안전 요구사항을 갖춘 세 가지 범주의 AI 응용 프로그램을 설정합니다.​

챗봇과 같은 환자 대면 도구는 명시적인 에스컬레이션 경로와 함께 감독 하에 운영되어야 합니다. 임상의 대면 도구는 공식적인 검증과 투명한 한계를 요구합니다. 전자 건강 기록과 통합된 배경 기관 시스템은 지속적인 모니터링과 기관 거버넌스가 필요합니다.​

ESMO 회장 Fabrice André는 "혁신은 종양학자들과 궁극적으로 환자들에게 도움이 되어야 하며, 그들을 혼란스럽게 하거나 오도해서는 안 됩니다"라고 말했습니다. 이 지침은 LLM이 임상 의사결정을 대체하는 것이 아니라 향상시켜야 한다는 점을 강조합니다.

 

더 광범위한 의료 응용 분야에서 엇갈린 결과 보여

 

최근 비교 연구들은 의료 전문 분야별로 다양한 성능을 보여줍니다. 2025년에 발표된 연구에 따르면 DeepSeek-V3는 복강경 담낭절제술 환자 교육에 있어 ChatGPT-4o보다 더 적합한 응답을 제공했으며, 질문의 95%에서 5점 만점 평가를 받은 반면 ChatGPT-4o는 65%를 기록했습니다. 그러나 10월 16일 발표된 Mass General Brigham 연구에서는 LLM이 의료 맥락에서 정확성보다 유용성을 우선시한다는 것을 발견했습니다.​

연구 결과는 LLM이 환자 교육과 임상 업무 지원에 있어 가능성을 보여주지만, 아직 포괄적인 의료 상담을 대체할 수는 없다는 것을 나타냅니다. 향후 연구에서는 실제 임상 환경에서 이러한 결과를 검증하고 안전한 구현을 보장하기 위해 환자 피드백을 통합해야 합니다.

댓글 0
전체 1,366 / 91 페이지
Google은 미국 외 지역에서 최대 규모의 인공지능 인프라 하드웨어 엔지니어링 센터를 대만에 개설했으며, 라이칭더 총통은 이번 조치가 대만이 신뢰할 수 있는 기술 파트너이자 안전한 AI 개발을 위한 핵심 허브임을 입증하는 것이라고 설명했다.타이베이에 위치한 이 시설은 매일 수십억 명의 사람들이 사용하는 기기에 전력을 공급하는 전 세계 Google 데이터 센터에 배치되는 기술을 개발하고 테스트할 예정이라고 Google Cloud 부사장 아머 마흐무드가 밝혔다.대만은 전 세계 반도체의 60% 이상, 최첨단 칩의 90% 이상을 생산하고 있으며, AI 수요가 급증하는 가운데 TSMC만으로도 계약 칩 제조 분야에서 64%의 글로벌 시장 점유율을 차지하고 있다.
1229 조회
0 추천
2025.11.20 등록
**마이크로소프트(Microsoft)**의 AI CEO **무스타파 술레이만(Mustafa Suleyman)**은 Copilot과 Windows에 AI가 통합되는 것에 불만을 가진 비평가들에게 반박하며, 사람들이 AI와 유창하게 대화하고 이미지와 동영상을 생성할 수 있는 능력에 감명을 받지 않는다는 사실에 “정말 놀랐다”고 말했다.술레이만의 옹호는 최근 The Verge의 보고서에서 실제 Copilot의 기능이 **마이크로소프트(Microsoft)**가 광고에서 보여주는 것과 맞지 않는다는 점이 지적된 가운데 나왔으며, Windows 사장 **파반 다불루리(Pavan Davuluri)**가 “대리 OS(agentic OS)” 비전을 홍보하다가 심한 반발을 받아 자신의 게시물에서 답글 기능을 비활성화해야 했던 사건에 이어졌다.이 논란은 **마이크로소프트(Microsoft)**가 새로운 “AI를 위한 당신의 캔버스(Your canvas for AI)” 슬로건을 밀어붙이는 가운데, Windows의 평판이 해당 매체가 “역대 최저”라고 묘사할 정도로 떨어진 상황을 부각시킨다. 사용자들은 모든 인터페이스에 원하지 않는 AI 기능을 강제로 넣는 대신 회사가 근본적인 플랫폼 문제를 해결할 것을 요구하고 있다.
1233 조회
0 추천
2025.11.20 등록
Google DeepMind는 Boston Dynamics의 전 최고기술책임자(CTO)인 Aaron Saunders를 하드웨어 엔지니어링 부사장으로 영입했습니다. 이는 CEO Demis Hassabis가 Gemini를 Android가 여러 제조업체의 스마트폰을 구동하는 것처럼 범용 로봇 운영체제로 변모시키려는 비전을 발전시키기 위한 것입니다.Hassabis는 Gemini가 “거의 모든 물리적 구성으로 즉시 작동할 수 있는” AI 기반으로 기능하기를 목표로 하며, 이는 인간형 및 비인간형 로봇을 포함하여 회사가 AI 기반 로봇공학 분야로의 진출을 강화하고 있는 가운데 추진되고 있습니다.이러한 움직임은 Google DeepMind를 2035년까지 510억 달러 규모에 달할 것으로 예상되는 급속히 성장하는 시장에서 경쟁할 수 있는 위치에 올려놓습니다. 경쟁사인 Tesla는 향후 10년간 백만 대의 Optimus 인간형 로봇 생산을 목표로 하고 있으며, Unitree와 같은 중국 기업들은 경쟁력 있는 가격의 다리 달린 로봇을 제공하고 있습니다
1219 조회
0 추천
2025.11.20 등록
MIT 연구원들은 새로운 추론 AI 모델에서 가장 많은 연산 처리를 요구하는 문제 유형이 인간이 해결하는 데 가장 오래 걸리는 문제와 동일하다는 것을 발견했으며, 이는 인공지능과 생물학적 지능이 복잡한 사고에 접근하는 방식에서 예상치 못한 수렴을 시사합니다PNAS에 게재된 이 연구는 7가지 문제 유형에 걸쳐 인간의 반응 시간과 AI가 생성한 “토큰”(내부 연산 단계)을 측정했으며, 놀라운 상관관계를 발견했습니다—인간과 모델 모두 “ARC 챌린지“라고 불리는 시각적 추론 과제에 가장 오래 걸리고 기본 산술에는 가장 적은 노력을 소비했습니다추론 모델은 훈련 중 강화 학습을 통해 향상된 성능을 달성하는데, 정답에 대해서는 보상을 받고 오류에 대해서는 페널티를 받아 문제 공간을 탐색하고 인간의 문제 해결 접근 방식을 반영하는 단계별 솔루션 전략을 개발할 수 있습니다
1231 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입