Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
1,784 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,366 / 73 페이지
중국의 선도적인 메모리 칩 제조업체인 ChangXin Memory Technologies(CXMT)는 일요일 베이징에서 열린 중국 국제 반도체 박람회에서 새로운 세대의 DDR5 DRAM 제품을 공개하며, 고성능 AI 메모리 시장에서 삼성전자, SK하이닉스, 마이크론 테크놀로지에 직접적인 도전장을 내밀었다.새로운 DDR5 제품은 초당 최대 8,000메가비트의 속도와 최대 24기가비트의 다이 용량을 달성하여, 글로벌 경쟁업체들의 고급 제품 사양과 동등한 수준을 보인다. CXMT의 제품 라인업은 데스크톱용 UDIMM, 노트북용 SODIMM, 데이터 센터용 MRDIMM 등 7가지 주요 모듈 유형을 포함하며, AI 컴퓨팅 서버 및 고성능 애플리케이션을 목표로 한다.공급 부족 속 시장 타이밍TrendForce에 따르면 9월 초 이후 글로벌 DDR5 가격이 307% 급등한 가운데 이번 발표가 나왔다. 삼성은 32기가바이트 DDR5 모듈의 계약 가격을 9월 149달러에서 11월 239달러로 인상했는데, 이는 주요 생산업체들이 AI 애플리케이션용 고대역폭 메모리로 생산능력을 전환하면서 공급이 부족해진 것을 반영한다. 메모리 부족으로 인해 기존 소비자 전자제품 제조업체들은 AI 데이터센터 운영업체들이 프리미엄 가격을 지불하는 가운데 제한된 재고를 확보하기 위해 경쟁해야 하는 상황이다.CXMT는 또한 8,533Mbps에서 10,667Mbps에 이르는 속도의 LPDDR5X 모바일 메모리 시리즈를 선보였다. 이 회사는 5월에 8,533Mbps 및 9,600Mbps 제품의 양산을 시작했으며, 가장 빠른 10,667Mbps 버전은 여전히 고객 샘플링 단계에 있다. 이러한 제품들은 LPDDR5 대비 66%의 속도 향상을 나타내면서 전력 소비는 30% 감소시켰다.중국의 자급자족 추진이번 제품 출시는 미국의 첨단 칩 기술에 대한 수출 규제가 지속되는 가운데 반도체 자립을 달성하기 위한 중국의 강화된 노력을 보여줍니다. Counterpoint Research에 따르면, CXMT의 글로벌 DRAM 시장 점유율은 2025년 7%에서 2027년까지 10%로 증가할 것으로 예상됩니다. 현재 SK하이닉스가 38.7%의 매출 점유율로 DRAM 시장을 선도하고 있으며, 삼성이 32.7%, 마이크론이 22%로 그 뒤를 따르고 있습니다.업계 분석가들은 2026년 글로벌 DRAM 생산량이 20% 이상 증가할 것으로 예상하며, 중국의 국가 지원 반도체 이니셔티브가 계속됨에 따라 CXMT가 예상을 초과할 가능성이 있습니다. 로이터는 CXMT가 빠르면 2026년 1분기에 상하이에서 기업공개를 준비하고 있으며, 최대 3,000억 위안(420억 달러)의 기업가치를 목표로 하고 있다고 보도했습니다.
1106 조회
0 추천
2025.11.24 등록
정부가 중앙·지방정부 내부망에서 민간 AI 기술을 안전하게 활용할 수 있는 ‘범정부 AI 공통기반’ 서비스를 24일 공식 개시했다. 과학기술정보통신부와 행정안전부는 이날 정부서울청사에서 기념행사를 열고 서비스 시연과 향후 운영계획을 발표했다.그동안 국내외 민간 AI 서비스는 내부 행정 데이터 유출 위험 등 보안 우려로 인터넷망에서만 사용 가능했고, 정부 업무 전반에 활용하는 데 제약이 있었다. 민간을 중심으로 빠르게 발전하는 AI를 행정에서 적극 활용하지 못해 업무 효율성이 저하된다는 지적이 제기돼 왔다.삼성·네이버 AI 챗봇 내부망에 도입범정부 AI 공통기반은 민간의 다양한 AI 모델, 학습데이터, 그래픽처리장치(GPU) 등을 중앙·지방정부가 공동 활용할 수 있는 서비스다. 공통기반은 공개된 행정문서와 데이터를 AI 모델과 연계해 내부망에서도 활용 가능한 AI 챗서비스 2종을 제공한다. 삼성SDS와 네이버클라우드가 개발한 AI 챗봇 서비스가 부처 내부망에 제공되며, 이를 통해 중앙·지방정부는 중복 개발이나 투자 없이 내부 행정업무부터 공공서비스까지 다양한 AI 기술을 업무 전반에 적용할 수 있게 됐다.12월에는 복잡한 용어와 절차를 몰라도 필요한 서비스와 혜택을 찾아주는 ‘정부24+ 지능검색’ 서비스가 도입될 예정이다. 2026년에는 정부가 추진 중인 ‘독자 AI 파운데이션 모델 프로젝트’를 통해 선정되는 AI 모델도 범정부 AI 공통기반에서 활용할 수 있도록 추가 도입할 계획이다.지능형 업무관리 플랫폼 시범 운영정부는 범정부 AI 공통기반을 활용한 ‘지능형 업무관리 플랫폼’ 시범서비스도 개시한다. 과기정통부, 행안부, 식품의약품안전처를 대상으로 하는 이 플랫폼은 AI를 중심으로 메일, 메신저, 영상회의 등 소통·협업 도구를 유기적으로 연계해 단순·반복적인 업무를 생략하고 업무에 집중할 수 있는 환경을 제공한다. 범정부 AI 공통기반이 활용하는 공통 데이터뿐 아니라 개인·기관이 보유한 내부 행정 문서와 데이터까지 활용해 보다 정확하고 맥락 있는 AI 답변 생성이 가능하다.정부는 서비스 운영과 확산에 앞서 실제 사용자의 의견 수렴, AI 서비스 기능 검증 및 품질 개선을 위해 이달 말부터 2026년 2월 말까지 시범 운영을 진행한다. 시범 운영 이후 2026년 3월부터는 전체 중앙·지방정부가 서비스를 이용할 수 있도록 단계적으로 서비스 대상을 확대할 계획이다.배경훈 과기정통부 장관은 “공공부문에 AI를 적극 활용해 정책 결정을 고도화하고 과학화함으로써 최고의 성과를 낼 수 있기를 기대한다”며 “이번 서비스 개시를 계기로 AI 3대 강국 실현에도 한 걸음 더 나아갈 수 있도록 박차를 가하겠다”고 밝혔다. 윤호중 행안부 장관은 “민간의 최신 AI 기술을 공공부문에 적극 도입·활용해 국민에게 더 좋은 서비스를 제공하는 ‘AI 민주정부’로 도약하겠다”고 말했다.
1143 조회
0 추천
2025.11.24 등록
Tesla는 금요일에 Full Self-Driving (Supervised) V14.2 출시를 시작했으며, CEO 일론 머스크가 차량을 “거의 감각이 있는 것처럼” 느끼게 만드는 단계라고 설명한 업데이트를 도입했습니다.회사의 AI4 하드웨어가 장착된 초기 차량들에 소프트웨어 버전 2025.38.9.5를 통해 배포된 이 업데이트는 더 높은 해상도 기능을 갖춘 업그레이드된 신경망 비전 인코더를 특징으로 합니다. 릴리스 노트에 따르면, 이 시스템은 이제 긴급 차량, 도로 위의 장애물, 그리고 인간의 제스처를 더 잘 처리하기 위해 향상된 기능을 활용합니다.향상된 기능 및 성능V14.2 릴리스에는 여러 가지 새로운 기능이 포함되어 있으며, 가장 주목할 만한 것은 운전자가 FSD가 주차할 위치를 선택할 수 있도록 하는 도착 옵션(Arrival Options)입니다—주차장, 도로변, 진입로, 주차 건물, 또는 길가에 주차할 수 있습니다. 이 업데이트는 또한 경찰차, 소방차, 구급차를 포함한 긴급 차량을 위해 길을 비키거나 양보하는 기능을 추가했습니다.Tesla는 내비게이션과 경로 안내를 비전 기반 신경망에 통합하여 차단된 도로와 우회로를 실시간으로 처리할 수 있게 했으며, 운전 스타일 선호도를 맞춤 설정할 수 있는 추가 속도 프로필을 도입했습니다. 이 시스템은 또한 비보호 회전, 차선 변경, 끼어들기, 스쿨버스 대응에서 개선된 처리 능력을 보여줍니다.초기 테스트 데이터는 상당한 성능 향상을 시사합니다. 11월 초 기준으로 FSD 버전 14는 중대한 개입 간 평균 1,454마일을 기록했으며, 이는 버전 13.2의 평균 443마일보다 3배 이상 높은 수치입니다.로보택시 확장 및 시장 맥락소프트웨어 업데이트는 Tesla가 로보택시 확장을 가속화하는 시점에 출시되었습니다. 이 회사는 11월 17일 애리조나주 교통부로부터 주 전역에서 차량 호출 서비스를 운영할 수 있는 승인을 받았으며, 이는 텍사스와 캘리포니아에 이어 세 번째 주입니다. Tesla는 네바다주 차량관리국(DMV)의 자체 인증 절차도 완료했지만, 네바다 교통 당국으로부터 상업적 승인은 여전히 필요한 상태입니다.월요일, Stifel 애널리스트 Stephen Gengaro는 FSD와 로보택시 서비스의 발전을 언급하며 Tesla의 목표 주가를 $483에서 $508로 상향 조정했습니다. Gengaro는 경영진이 연말까지 약 8개에서 10개의 대도시 지역으로 확장할 계획이라고 언급했습니다.그러나 Tesla는 미국 내 여러 도시에서 안전 운전자 없이 완전 자율주행 레벨 4 차량을 운영하는 Waymo와의 경쟁 심화에 직면해 있습니다. Waymo는 11월 20일 미니애폴리스, 탬파, 뉴올리언스로의 확장을 발표했으며, 현재 1,500대의 차량 보유에 2026년까지 2,000대를 추가할 계획입니다.Musk는 이전에 V14.2가 광범위한 출시의 시작을 알릴 것이며, V14.3에 이르면 차량이 “마치 지각이 있는 것처럼” 느껴질 것이라고 밝혔습니다.
1124 조회
0 추천
2025.11.24 등록
Google은 BleepingComputer에 따르면, 첫 해 동안 광고 없이 운영했던 AI Mode 답변 엔진에 스폰서 광고를 표시하기 시작했습니다.광고는 AI가 생성한 답변 하단에 “sponsored” 라벨과 함께 표시되며, 이는 사용자에게 더 매력적인 AI 경험을 제공하기 위해 광고를 피했던 Google의 이전 전략에서 전환된 것입니다.이러한 움직임은 Google이 ChatGPT와 같은 광고 없는 AI 검색 대안과의 경쟁에 직면하면서도, 2023년에 2,378억 6천만 달러의 수익을 창출한 지배적인 광고 사업을 보호하기 위한 것입니다.
1151 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입