Loading...

AI 뉴스

서울대, 역전파에 필적하는 AI 훈련 방법 공개

페이지 정보

작성자 xtalfi
작성일 10.17 15:54
73 조회
0 추천
0 비추천

본문

2219855926_gm9fgb.jpg

(퍼플렉시티가 정리한 기사)

서울과학기술대학교 연구진은 오늘 수십 년간 딥러닝을 이끌어온 지배적인 역전파 방법에 대한 보다 효율적인 대안을 제공하여 인공지능 모델 훈련 방식을 변화시킨 획기적인 알고리즘을 발표했다.​

전기정보공학과 박사과정 이길하 연구원과 김현 부교수가 이끄는 연구팀이 개발한 시각 순방향-순방향 네트워크(VFF-Net)는 기존 훈련 방법의 중요한 한계를 해결하는 동시에 더 빠르고 지속 가능한 AI 개발을 약속한다.

 

역전파의 한계 극복하기

 

전통적인 심층 신경망 훈련은 역전파에 크게 의존하는데, 이는 계층을 통해 오류를 역방향으로 전파하여 네트워크 가중치를 반복적으로 조정하는 방법입니다. 성공적이기는 하지만, 이 접근 방식은 느린 수렴, 과적합 경향, 높은 계산 요구량, 그리고 해석하기 어렵게 만드는 "블랙박스" 특성으로 인해 어려움을 겪고 있습니다.​

"합성곱 신경망 훈련에 순전파-순전파 네트워크를 직접 적용하면 입력 이미지의 정보 손실이 발생하여 정확도가 감소할 수 있습니다"라고 Lee는 설명했습니다. "또한, 수많은 합성곱 계층을 가진 범용 CNN의 경우, 각 계층을 개별적으로 훈련하면 성능 문제가 발생할 수 있습니다. 우리의 VFF-Net은 이러한 문제들을 효과적으로 해결합니다."​

연구팀의 솔루션은 세 가지 혁신적인 방법론을 도입합니다: 레이블별 노이즈 라벨링(LWNL), 코사인 유사도 기반 대조 손실(CSCL), 그리고 계층 그룹화(LG). 이러한 기술들은 계층별 훈련의 효율성 이점을 유지하면서 이미지 분류에 중요한 공간 정보를 보존하기 위해 함께 작동합니다.

 

성능 및 지속가능성 이점

 

VFF-Net은 벤치마크 테스트에서 기존의 순방향-순방향 네트워크에 비해 상당한 개선을 보여주었습니다. 4개의 합성곱 계층을 가진 CNN 모델의 경우, 이 알고리즘은 CIFAR-10 데이터셋에서 테스트 오류를 8.31%, CIFAR-100에서 3.80% 감소시켰습니다. 또한 VFF-Net은 MNIST 손글씨 숫자 데이터셋에서 단 1.70%의 테스트 오류를 달성했습니다.​

"역전파에서 벗어남으로써 VFF-Net은 광범위한 컴퓨팅 리소스가 필요하지 않은 더 가볍고 뇌와 유사한 학습 방법으로 가는 길을 열어줍니다"라고 Kim 박사는 말했습니다. "이는 강력한 AI 모델이 개인 기기, 의료 기기, 가전제품에서 직접 실행될 수 있음을 의미하며, 에너지 집약적인 데이터 센터에 대한 의존도를 줄이고 AI를 더욱 지속 가능하게 만듭니다."​

2025년 10월 1일 Neural Networks 저널 190권에 게재된 이 연구는 엣지 디바이스에서 강력한 AI 모델의 광범위한 배포를 가능하게 할 수 있는 생물학적으로 더 그럴듯한 AI 학습 방법을 향한 중요한 진전을 나타냅니다.

댓글 0
전체 464 / 4 페이지
(퍼플렉시티가 정리한 기사)구글 리서치는 10월 16일에 딥소매틱(DeepSomatic)을 공개했습니다. 이 오픈소스 AI 모델은 암을 유발하는 유전적 돌연변이의 탐지 능력을 획기적으로 향상시키며, 전 세계적으로 정밀 의료의 발전을 가속할 잠재력을 지니고 있습니다. UC 산타크루즈 게놈 연구소와 아동 자선 병원(Children's Mercy Hospital)과 협력하여 개발된 이 도구는 합성곱 신경망(convolutional neural networks)을 활용해 암세포 내 유전적 변이를 전례 없는 정확도로 식별합니다.모든 주요 시퀀싱 기술에서 뛰어난 성능DeepSomatic은 벤치마크 테스트에서 기존 암 분석 도구들을 현저히 능가했으며, Illumina 시퀀싱 데이터에서 삽입 및 결실(indel)을 감지하는 데 있어 90%의 F1 점수를 달성했습니다(현재 방법은 80%). Pacific Biosciences의 롱리드 시퀀싱 데이터에서는 향상이 더욱 두드러졌고, DeepSomatic은 80% 이상의 점수를 기록한 반면 기존 도구들은 50% 미만의 점수를 받았습니다.​Nature Biotechnology에 게재된 이 AI 모델은 암 세포주에서 329,011개의 체세포 변이를 분석하고, 소아 백혈병이나 교모세포종과 같은 공격적인 뇌종양 등 난이도가 높은 사례에서 유전적 돌연변이를 성공적으로 식별했습니다. 소아 백혈병 샘플에서 DeepSomatic은 연구자가 이미 알고 있던 변이 외에 10개의 이전에 발견되지 않은 돌연변이를 추가로 발견했습니다.포괄적인 오픈소스 공개가 전 세계 연구를 가속화하다Google Research는 DeepSomatic 모델과 고품질 학습 데이터셋인 CASTLE(Cancer Standards Long-read Evaluation)을 GitHub에서 오픈 소스 라이선스 하에 공개했습니다. CASTLE 데이터셋은 세 가지 주요 플랫폼인 Illumina, PacBio, Oxford Nanopore에서 얻은 전체 유전체 시퀀싱 데이터를 사용하여 유방 및 폐암 샘플에서 얻은 6쌍의 종양-정상 세포주 쌍을 결합하고 있습니다.​“암은 근본적으로 유전 질환이며, 올바른 돌연변이 식별은 정확한 치료를 제공하는 데 매우 중요합니다.”라고 Google 연구진은 밝혔습니다. 이 툴은 학습 데이터셋을 넘어서 초기 연구되지 않은 암 유형에도 적용되어 다양한 연구 및 임상 응용에 대한 다재다능함을 보여줍니다. DeepSomatic은 종양-정상 샘플 쌍 분석뿐만 아니라 건강한 조직 비교가 불가능한 혈액암 등 어려운 종양 단독 케이스도 분석할 수 있습니다.​
51 조회
0 추천
10.18 등록
(퍼플렉시티가 정리한 기사)Microsoft는 어제 인공지능이 사이버 위협 환경을 극적으로 확대시켰으며, 회사는 현재 점점 더 정교해지는 공격에 맞서기 위해 매일 100조 개 이상의 보안 신호를 처리하고 있다고 밝혔다. 이 기술 대기업의 2025년 디지털 방어 보고서는 AI가 피싱 공격을 4.5배 더 효과적으로 만들었으며, 이는 연구자들이 "지난 1년간 피싱에서 가장 중요한 변화"라고 부르는 것을 보여준다.​10월 16일에 발표된 보고서에 따르면, AI로 강화된 피싱 이메일은 54%의 클릭률을 달성한 반면, 전통적인 피싱 시도는 단지 12%의 클릭률을 기록했다. Microsoft의 연구 결과에 따르면, 이러한 효과성의 극적인 증가는 피싱의 수익성을 최대 50배까지 높일 가능성이 있다.국가 행위자들이 AI를 무기화하다외국 적대 세력들이 미국을 대상으로 한 사이버 공격에 AI 사용을 급격히 확대하고 있습니다. 마이크로소프트는 2025년 7월 한 달 동안 외국 정부가 생성한 AI 기반 가짜 콘텐츠 사례를 200건 이상 기록했으며, 이는 2024년 7월보다 두 배 이상 많고 2023년보다는 10배 이상 증가한 수치입니다.​러시아, 중국, 이란, 북한은 대규모 언어 모델을 악의적인 작전을 강화하기 위한 "생산성 도구"로 활용하고 있습니다. 중국은 산업 전반에 걸쳐 광범위한 스파이 활동을 지속하는 동시에 새로 공개된 취약점을 무기화하는 속도가 빨라지고 있습니다. 러시아 국가 연계 행위자들은 우크라이나를 넘어 NATO 국가의 중소기업을 표적으로 삼는 것으로 확대되었으며, 이는 작년보다 25% 증가한 수치입니다.금전적 동기가 대부분의 공격을 주도한다보고서에 따르면 알려진 동기를 가진 사이버 공격의 52% 이상이 현재 갈취나 랜섬웨어를 통한 금전적 이익에 의해 추진되고 있으며, 첩보 활동에 초점을 맞춘 공격은 전체 사건의 단 4%만을 차지하고 있다. 마이크로소프트가 작년에 조사한 사이버 사건의 80%에서 공격자들은 정보 수집보다는 주로 이익을 위해 데이터를 훔치려고 했다.​신원 기반 공격은 2025년 상반기에 32% 급증했으며, 97% 이상이 유출된 자격 증명을 사용한 대규모 추측 시도를 통해 비밀번호를 표적으로 삼았다. 그러나 마이크로소프트는 피싱에 저항하는 다단계 인증이 이러한 공격의 99% 이상을 차단할 수 있다고 언급했다.​미국은 여전히 주요 표적으로 남아 있으며, 전 세계 모든 사이버 공격의 23.7%를 차지하고, 그 다음으로 영국이 5.9%, 독일이 3.4%를 차지한다. 병원, 학교, 정부 기관을 포함한 핵심 인프라는 제한된 사이버 보안 예산과 사건 대응 능력으로 인해 높은 위험에 직면해 있다.​마이크로소프트의 분석은 기존 보안 조치가 AI로 강화된 위협에 대해 부적절하다는 것이 입증됨에 따라, 조직들이 사이버 보안을 단순히 IT 문제가 아닌 "핵심 전략적 우선순위"로 취급해야 한다는 긴급한 필요성을 강조하고 있다.
49 조회
0 추천
10.18 등록
(퍼플렉시티가 정리한 기사)Amazon은 워싱턴주에 건설할 Cascade Advanced Energy Facility의 상세 계획과 건축 렌더링을 공개하며, 이 거대 기술 기업의 야심찬 원자력 에너지 프로그램에서 중요한 이정표를 세웠습니다. 10월 15일에 공개된 이 시설은 총 960메가와트 용량의 소형 모듈형 원자로 12기를 갖추게 되며, 이는 약 770,000가구에 전력을 공급할 수 있는 규모입니다.​이 프로젝트는 1년 전 발표된 Amazon의 원래 원자력 계획을 3배로 확대한 것으로, 인공지능 및 클라우드 컴퓨팅 운영을 위한 무탄소 에너지원에 대한 회사의 증가하는 의지를 보여줍니다. 건설은 이번 10년대 말까지 시작될 것으로 예상되며, 운영은 2030년대에 개시될 예정입니다.기술 산업의 원자력 전환아마존의 발표는 주요 기술 기업들의 전례 없는 원자력 투자 물결 속에서 나왔습니다. Microsoft는 Three Mile Island의 1호기 원자로를 재가동하기 위한 20년 계약을 체결했으며, Google은 첨단 원자로 개발업체들과의 파트너십을 통해 새로운 원자력 시설에 자금을 지원하기로 약속했습니다. Meta는 최근 일리노이 시설에서 1.1기가와트를 공급받기 위해 Constellation Energy와 20년 원자력 전력 계약을 체결했습니다.​원자력 투자 급증은 2030년까지 미국 전체 전력의 최대 9%를 소비할 수 있는 AI 데이터 센터의 막대한 에너지 수요를 반영합니다. "이 프로젝트는 단순히 새로운 기술에 관한 것이 아닙니다. 성장하는 디지털 세계를 지원할 신뢰할 수 있는 무탄소 에너지원을 만드는 것입니다"라고 아마존의 최고 지속가능성 책임자인 Kara Hurst가 말했습니다.모듈형 기술과 경제적 영향Cascade 시설은 X-energy의 Xe-100 고온 가스 냉각 원자로를 활용할 예정이며, 각 원자로는 80메가와트의 전력을 생산합니다. 기가와트 용량을 위해 1평방마일 이상을 차지할 수 있는 전통적인 원자력 발전소와 달리, 모듈식 설계로 인해 960메가와트 시설을 단 몇 개의 도시 블록 내에 배치할 수 있습니다.​이 프로젝트는 건설 최성수기 동안 1,000개 이상의 건설 일자리를 창출하고, 완전 가동 시 100개 이상의 정규직 일자리를 만들 것입니다. Amazon은 X-energy에 5억 달러를 투자했으며, Climate Pledge Fund를 통해 초기 타당성 조사, 허가 및 라이선스 단계에 대한 자금 지원을 약속했습니다.​워싱턴주 리치랜드에 위치한 Energy Northwest의 Columbia 발전소 근처에 위치한 이 시설은 각각 4개의 원자로로 구성된 3단계로 건설될 예정입니다. Amazon은 초기 320메가와트 단계에서 전력을 구매할 권리를 가지며, 추가 용량은 지역 전력 회사에서 이용할 수 있습니다.
49 조회
0 추천
10.18 등록
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 올트먼은 ChatGPT가 곧 모든 인간 상호작용을 합친 것보다 더 많은 일일 대화를 수행할 것이라는 놀라운 예측을 내놓았으며, 이는 AI 투자 버블에 대한 업계 우려가 커지는 가운데 AI 챗봇의 폭발적인 성장 궤도를 강조하는 것이다.야심찬 성장 전망이 업계 논쟁을 촉발하다샌프란시스코에서 최근 열린 기자들과의 만찬에서 올트먼은 "하루에 수십억 명의 사람들이 ChatGPT와 대화하게 될 것"이며, 이 플랫폼이 "언젠가는 모든 인간의 말을 합친 것보다 더 많은 대화를 나누게 될 것"이라고 전망했다. 이 대담한 예측은 ChatGPT가 이미 주간 활성 사용자 8억 명을 달성하고 매일 25억 건 이상의 메시지를 처리하고 있는 상황에서 나왔다.​이 예측은 OpenAI가 2025년 8월 큰 기대를 모았던 GPT-5 모델을 출시했지만 엇갈린 평가를 받은 격동의 시기 이후에 나온 것이다. 사용자들은 새 버전이 이전 버전인 GPT-4o보다 "더 냉담하고" 친근감이 덜하다고 불평했으며, 이에 회사는 상당한 반발 이후 일시적으로 구 모델에 대한 접근을 복원했다. 올트먼은 회사가 "어조 변화에 대해 사람들이 어떻게 느낄지 잘못 판단했다"고 인정하며 다양한 사용자 선호도를 수용하기 위한 더 많은 맞춤화 옵션을 약속했다.전례 없는 성장 궤적이 지속되다ChatGPT의 사용자 기반은 2022년 11월 출시 이후 폭발적으로 증가했으며, 단 두 달 만에 1억 명의 사용자를 확보하며 역사상 가장 빠르게 성장한 소비자 애플리케이션이 되었습니다. 이 플랫폼의 성장은 2025년에 극적으로 가속화되어, 2월 주간 사용자 4억 명에서 10월까지 8억 명으로 급증했습니다. 이는 전 세계 성인 인구의 10% 이상이 매주 이 서비스를 사용하고 있음을 나타냅니다.​대화량은 사용자 수보다 훨씬 빠르게 증가했으며, 지난 1년 동안 일일 메시지가 5.8배 증가한 반면 사용자는 3.2배 증가하여 기존 사용자들의 참여도가 더 깊어졌음을 보여줍니다. 참고로, Google은 하루에 약 85억 건의 검색을 처리하는데, 이는 현재 성장세가 지속될 경우 ChatGPT가 이론적으로 1년 내에 Google의 검색량에 필적할 수 있음을 의미합니다.대규모 인프라 투자로 거품 우려 제기OpenAI의 야심찬 성장 전망은 전례 없는 재정적 약속으로 뒷받침됩니다. 최근 주식 매각으로 5,000억 달러의 가치를 인정받은 이 회사는 Oracle 및 SoftBank와의 Stargate 프로젝트와 같은 이니셔티브를 통해 데이터 센터에 "수조 달러"를 투자할 것으로 예상합니다. 이러한 거래에는 5년에 걸친 Oracle과의 3,000억 달러 계약과 AI 관련 계약에서 1조 달러 이상의 가치를 지닌 파트너십이 포함됩니다.​그러나 투자 규모는 AI 부문이 버블 상태에 있는지에 대한 논쟁을 촉발시켰습니다. Bank of America 설문조사에 따르면 투자자의 54%가 AI 주식이 버블 영역에 있다고 믿는 것으로 나타났습니다. 비평가들은 1990년대 후반 닷컴 붐을 연상시키는 순환 금융 구조를 지적하며, 공급업체와 고객이 실제 가치를 창출하지 않으면서 서로의 가치 평가를 강화한다고 주장합니다. 이러한 우려에도 불구하고 Altman은 현재 상황을 인터넷 붐에 비유하며 낙관적인 태도를 유지하고 있으며, "누군가는 엄청난 금액의 돈을 잃게 될 것"이라고 인정하면서도 AI의 장기적인 경제적 이익에 대한 확신을 표명했습니다.
44 조회
0 추천
10.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입