AI 뉴스

서울대, 역전파에 필적하는 AI 훈련 방법 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.17 15:54
2,254 조회
0 추천
0 비추천

본문

2219855926_gm9fgb.jpg

(퍼플렉시티가 정리한 기사)

서울과학기술대학교 연구진은 오늘 수십 년간 딥러닝을 이끌어온 지배적인 역전파 방법에 대한 보다 효율적인 대안을 제공하여 인공지능 모델 훈련 방식을 변화시킨 획기적인 알고리즘을 발표했다.​

전기정보공학과 박사과정 이길하 연구원과 김현 부교수가 이끄는 연구팀이 개발한 시각 순방향-순방향 네트워크(VFF-Net)는 기존 훈련 방법의 중요한 한계를 해결하는 동시에 더 빠르고 지속 가능한 AI 개발을 약속한다.

 

역전파의 한계 극복하기

 

전통적인 심층 신경망 훈련은 역전파에 크게 의존하는데, 이는 계층을 통해 오류를 역방향으로 전파하여 네트워크 가중치를 반복적으로 조정하는 방법입니다. 성공적이기는 하지만, 이 접근 방식은 느린 수렴, 과적합 경향, 높은 계산 요구량, 그리고 해석하기 어렵게 만드는 "블랙박스" 특성으로 인해 어려움을 겪고 있습니다.​

"합성곱 신경망 훈련에 순전파-순전파 네트워크를 직접 적용하면 입력 이미지의 정보 손실이 발생하여 정확도가 감소할 수 있습니다"라고 Lee는 설명했습니다. "또한, 수많은 합성곱 계층을 가진 범용 CNN의 경우, 각 계층을 개별적으로 훈련하면 성능 문제가 발생할 수 있습니다. 우리의 VFF-Net은 이러한 문제들을 효과적으로 해결합니다."​

연구팀의 솔루션은 세 가지 혁신적인 방법론을 도입합니다: 레이블별 노이즈 라벨링(LWNL), 코사인 유사도 기반 대조 손실(CSCL), 그리고 계층 그룹화(LG). 이러한 기술들은 계층별 훈련의 효율성 이점을 유지하면서 이미지 분류에 중요한 공간 정보를 보존하기 위해 함께 작동합니다.

 

성능 및 지속가능성 이점

 

VFF-Net은 벤치마크 테스트에서 기존의 순방향-순방향 네트워크에 비해 상당한 개선을 보여주었습니다. 4개의 합성곱 계층을 가진 CNN 모델의 경우, 이 알고리즘은 CIFAR-10 데이터셋에서 테스트 오류를 8.31%, CIFAR-100에서 3.80% 감소시켰습니다. 또한 VFF-Net은 MNIST 손글씨 숫자 데이터셋에서 단 1.70%의 테스트 오류를 달성했습니다.​

"역전파에서 벗어남으로써 VFF-Net은 광범위한 컴퓨팅 리소스가 필요하지 않은 더 가볍고 뇌와 유사한 학습 방법으로 가는 길을 열어줍니다"라고 Kim 박사는 말했습니다. "이는 강력한 AI 모델이 개인 기기, 의료 기기, 가전제품에서 직접 실행될 수 있음을 의미하며, 에너지 집약적인 데이터 센터에 대한 의존도를 줄이고 AI를 더욱 지속 가능하게 만듭니다."​

2025년 10월 1일 Neural Networks 저널 190권에 게재된 이 연구는 엣지 디바이스에서 강력한 AI 모델의 광범위한 배포를 가능하게 할 수 있는 생물학적으로 더 그럴듯한 AI 학습 방법을 향한 중요한 진전을 나타냅니다.

댓글 0
전체 1,366 / 266 페이지
(퍼플렉시티가 정리한 기사)Oracle은 월요일에 Oracle AI Factory를 출시했습니다. 이는 기업들이 인공지능 솔루션을 신속하게 구현하고 운영 전반에 걸쳐 측정 가능한 비즈니스 성과를 달성할 수 있도록 설계된 포괄적인 서비스 제품군입니다.이 새로운 제품은 AI 교육 프로그램, 구현 플레이북, 고객 성공 관리자, 기술 전문가, 그리고 글로벌 AI 고객 우수성 센터를 하나의 서비스 패키지로 묶었습니다. Oracle은 AI Factory를 기업의 AI 야망과 실제 배포 사이의 격차를 해결하고, "AI 여정의 어느 지점에 있든" 고객을 만나는 것으로 포지셔닝하고 있습니다.얼리 어답터들이 즉각적인 혜택을 보고하다여러 주요 기업들이 이미 Oracle AI Factory를 사용하기 시작했으며, 상당한 운영 개선을 보고하고 있습니다. Marriott International, MTI, Etihad Salam, 그리고 Grupo Bimbo는 프로세스 복잡성 감소, 이탈률 감소, 글로벌 운영 표준화, 사이버 보안 강화 등의 혜택을 경험하고 있는 얼리 어답터들입니다.Marriott International의 인재 관리 및 조직 역량 글로벌 책임자인 Elaine Engle은 "Oracle의 AI 기반 Fusion Cloud HCM 제품군은 성과 관리에 대한 우리의 접근 방식을 향상시켜 직원들을 위한 더 빠르고 일관된 목표 설정을 가능하게 했습니다"라고 말했습니다. "이는 우리 직원들이 조직에 의미 있는 영향과 결과를 가져오는 더 명확하고 측정 가능한 목표를 개발할 수 있도록 힘을 실어줍니다."세계 최대의 제빵 회사인 Grupo Bimbo는 Oracle의 AI 기능을 활용하여 글로벌 운영을 현대화했으며, 생성형 AI 어시스턴트를 사용하여 직원들이 정책 정보에 빠르게 접근할 수 있도록 돕고, 개선된 판매 예측 및 생산 라인 모니터링을 위해 AI 기반 분석을 구현했습니다.포괄적 AI 구현 프레임워크Oracle AI Factory는 8가지 핵심 구성 요소를 포함합니다: AI 교육 및 훈련 프로그램, Oracle Fusion Applications를 위한 처방적 AI 플레이북 및 런북, Cloud Success Navigator 디지털 플랫폼, 전담 고객 성공 관리자, 선별된 AI 도구 및 사용 사례, 테스트를 위한 글로벌 AI Customer Excellence Center, 맞춤형 구현을 위한 Oracle 기술 전문가, 그리고 사전 구축된 에이전트를 갖춘 고정 범위 AI Acceleration Services.이 서비스는 올해 초 출시된 Oracle의 기존 AI Agent Studio for Fusion Applications를 기반으로 구축되었으며, 고객이 기업 운영 전반에 걸쳐 맞춤형 AI 에이전트를 생성하고 배포할 수 있도록 지원합니다. Oracle의 고객 성공 책임자이자 수석 부사장인 Gary Miller는 회사의 포괄적인 접근 방식을 강조하며 다음과 같이 말했습니다: "Oracle AI Factory는 이러한 요소들을 통합하여 최첨단 기술을 안전하고 비용 효율적으로 실질적인 가치를 제공하는 실용적인 비즈니스 솔루션으로 전환합니다".이번 발표는 2026년부터 50,000개의 AI 프로세서를 배포하기 위한 AMD와의 새로운 파트너십 및 내장형 AI 기능을 갖춘 Oracle AI Database 26ai의 출시를 포함한 Oracle의 광범위한 AI 인프라 확장과 동시에 이루어졌습니다.
2368 조회
0 추천
2025.10.15 등록
오픈AI가 챗GPT 성인 이용자에게 성적인 대화나 성인용 콘텐츠를 허용하겠다는 방침을 발표샘 올트먼 오픈AI 최고경영자(CEO)는 14일(현지시간) 엑스에 챗GPT의 새로운 버전 출시 계획을 알리면서 성인 이용자에게 허용되는 콘텐츠의 범위를 확대하겠다는 방침을 밝혔다.
2764 조회
0 추천
2025.10.15 등록
(퍼플렉시티가 정리한 기사)공정거래위원회가 마이크로소프트 의 AI 챗봇 ‘코파일럿’ 끼워팔기 의혹에 대해 현장조사에 착수했다고 14일 공식 확인됐다.주병기 공정위원장은 이날 국회 정무위원회 국정감사에서 국민의힘 유영하 의원의 질의에 “최근 현장조사를 실시했다”고 밝혔다. 이는 지난해 국정감사에서 처음 제기된 마이크로소프트 끼워팔기 의혹이 정식 조사 단계로 진입했음을 의미한다.공정위의 본격 조사 착수공정위는 마이크로소프트가 자사의 컴퓨터 운영체제 ‘윈도’와 사무용 소프트웨어 ‘M365’에 AI 챗봇 ‘코파일럿’을 결합 판매하는 행위가 끼워팔기에 해당하는지 조사하고 있다.주 위원장은 “법 위반 여부를 면밀히 검토하고 있다”며 “끼워팔기를 통한 시장점유율 확대와 가격 인상은 전형적인 이윤을 높이는 경로로, 신중하게 이 이슈를 검토하겠다”고 강조했다.이번 현장조사는 올해 5월부터 이어진 사전 모니터링과 내부 검토를 거쳐 착수된 것으로 알려졌다. 공정위는 인공지능 서비스 확산에 따른 글로벌 빅테크 기업의 시장 지배력 남용 가능성을 주요 점검 과제로 삼고 있다.과거 중단된 조사의 재개흥미롭게도 공정위는 지난해 같은 문제로 조사를 시작했다가 올해 초 사실상 중단한 바 있다. 당시 공정위는 마이크로소프트 관계자와의 면담 후 ’글로벌 AI 시장에서 챗GPT가 1위 사업자(59.7% 점유율)’라는 점을 근거로 위법성을 인정하기 어렵다고 판단했다.그러나 새 정부 출범 후 공정위의 입장이 달라지면서 정식 조사에 착수하게 된 것이다. 전문가들은 이전 공정위의 판단이 국내 시장 경쟁 제한성을 글로벌 시장 점유율로 평가한 것은 문제가 있다고 지적했다.국내 시장에 미치는 영향국내에서 윈도 운영체제는 86% 점유율을, M365는 문서 편집 프로그램 시장에서 70% 점유율을 차지하고 있어 대부분의 이용자들이 코파일럿에 노출될 수밖에 없는 상황이다. 마이크로소프트는 신규 M365 이용자에게 30~40% 비싼 코파일럿 포함 제품만 구매할 수 있게 했다.업계에서는 마이크로소프트의 시장 독점력을 앞세운 국내 AI 시장 장악 우려가 제기되고 있으며, 이로 인해 국내 소프트웨어 생태계가 황폐화될 수 있다는 지적이 나오고 있다.
2744 조회
0 추천
2025.10.14 등록
(퍼플렉시티가 정리한 기사)중국은 오픈소스 인공지능 모델 개발 분야에서 글로벌 리더십을 장악했으며, 중국 기업들은 현재 전 세계에서 자유롭게 이용 가능한 AI 시스템의 대부분을 생산하고 있고, 인기도, 성능 순위 및 개발자 채택률에서 미국 경쟁사들을 능가하고 있다. 이는 기술과 지정학적 경쟁의 미래에 중대한 영향을 미치는 극적인 변화이다.중국 모델들이 오픈 AI 환경을 장악하다중국 AI 스타트업 DeepSeek는 Hugging Face의 인기 순위에서 선두를 차지하고 있으며, 그들의 모델은 12.8k 좋아요를 받은 반면 Meta의 Llama 모델은 6.3k 좋아요를 받았습니다. 2025년 말 기준, 세계 최대 오픈소스 AI 커뮤니티인 Hugging Face의 상위 10개 트렌딩 순위 중 6개를 중국 기업들이 차지하고 있습니다.Alibaba의 Qwen 시리즈는 특히 지배적인 위치를 차지하게 되었으며, Qwen 모델의 파생 모델들이 매월 Hugging Face에 등장하는 새로운 언어 모델의 40% 이상을 차지하는 반면, Meta의 점유율은 2024년 가을 거의 50%에서 현재 15%로 하락했습니다. 이 회사는 300개 이상의 AI 모델을 오픈소스로 공개하여 100,000개 이상의 파생 모델을 생성했으며 전 세계적으로 6억 건 이상의 다운로드를 달성했습니다.전략적 이점이 중국의 리더십을 주도하다중국의 오픈소스 AI 접근 방식은 독점 모델로 향하는 미국 기업들의 움직임과 뚜렷한 대조를 이루는 신중한 전략을 반영합니다. Hugging Face의 최고 정책 책임자인 Irene Solaiman에 따르면 “중국 기업들은 자주 그리고 빠르게 출시함으로써 사용자 기반을 구축합니다”. 이러한 왕성한 생산은 중국 모델을 많은 애플리케이션에서 글로벌 표준으로 자리매김하게 했습니다.이 전략은 특히 비용 효율성 측면에서 효과적임이 입증되었습니다. DeepSeek의 R1 모델은 약 600만 달러에 훈련되었으며, 이는 OpenAI의 GPT-4의 추정 비용인 1억 달러 이상보다 훨씬 적습니다. 전문가 혼합 레이어 및 희소 어텐션 메커니즘과 같은 혁신적인 기술을 통해 달성한 이러한 비용 우위는 중국 기업들이 훨씬 낮은 가격에 경쟁력 있는 성능을 제공할 수 있게 합니다.미국의 대응과 경쟁 과제이러한 변화는 워싱턴과 실리콘밸리에 우려를 불러일으켰습니다. 2025년 7월에 발표된 트럼프 행정부의 AI 실행 계획은 “미국의 가치에 기반한 선도적인 오픈 모델” 개발을 명시적으로 요구하며 오픈소스 모델이 “지정학적 가치를 가진다”고 경고합니다.2025년 8월에 시작된 ATOM 프로젝트는 중국의 오픈소스 개발과 경쟁하기 위해 10,000개 이상의 최첨단 GPU를 갖춘 미국 기반 연구소를 설립하는 것을 목표로 하는 미국의 가장 야심찬 대응을 나타냅니다. 이 계획은 OpenAI 임원진, Hugging Face 리더십, 주요 기술 업계 인사들의 지지를 받았습니다.그러나 미국 기업들은 구조적 과제에 직면해 있습니다. 이전에 오픈 AI 모델의 선두주자였던 메타는 가장 진보된 모델을 공개하는 데 더욱 신중해졌습니다. 마크 저커버그는 최근 글에서 회사가 최고의 모델을 독점적으로 유지해야 할 수도 있다고 밝혔습니다. 한편, OpenAI는 2025년 8월에 6년 만에 처음으로 오픈소스 모델을 공개하여 전통적인 폐쇄적 접근 방식에서 주목할 만한 전환을 보여주었습니다.
2773 조회
0 추천
2025.10.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입