Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
1,800 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,366 / 63 페이지
메타 플랫폼스가 구글의 AI 칩 텐서처리장치(TPU)를 2027년부터 데이터센터에 도입하는 방안을 논의 중인 것으로 25일 알려지면서, 엔비디아가 장악해온 AI 반도체 시장에 균열이 생길 조짐을 보이고 있다. 이날 뉴욕증시에서 엔비디아 주가는 2.59% 하락한 177.82달러에 마감한 반면, 알파벳 주가는 1.62% 상승하며 시가총액 4조 달러를 눈앞에 두게 됐다.IT 전문매체 디 인포메이션은 24일 메타가 수십억 달러 규모로 구글의 TPU를 도입하는 방안을 검토 중이라고 보도했다. 메타는 2027년부터 자사 데이터센터에 TPU를 직접 설치하고, 내년에는 구글 클라우드를 통해 TPU를 임대하는 방안도 협의하고 있는 것으로 전해졌다. 현재 메타는 AI 학습과 서비스 운영에 엔비디아 GPU를 대규모로 사용하고 있어, 이 계약이 성사되면 엔비디아의 주요 고객사에 대한 영향력이 축소될 수 있다는 우려가 나온다.구글 제미나이3.0 성공이 TPU 확산 계기구글이 자체 AI 칩에 자신감을 갖게 된 배경에는 최근 공개한 AI 모델 ‘제미나이 3.0 프로’의 성공이 있다. 제미나이 3.0 프로는 LM아레나 리더보드에서 1501점을 기록하며 처음으로 1500점을 돌파했고, ‘인류의 마지막 시험’에서 정답률 37.5%로 챗GPT의 26.5%를 크게 앞섰다. 이 모델은 엔비디아 GPU 없이 100% 자체 TPU 클러스터만으로 학습됐다는 점에서 업계의 주목을 받고 있다.구글은 지난 10월 AI 챗봇 ‘클로드’를 운영하는 앤트로픽과 최대 100만 개의 TPU를 공급하는 수백억 달러 규모의 계약을 체결한 바 있다. 구글 클라우드 경영진은 TPU 도입 확대를 통해 엔비디아 연간 매출의 최대 10%를 확보할 수 있을 것으로 보고 있다고 디 인포메이션은 전했다.엔비디아 즉각 반박, 삼성전자는 수혜 전망엔비디아는 25일 소셜미디어 엑스(X)를 통해 “우리는 업계보다 한 세대 앞서 있으며, 모든 AI 모델을 구동하고 컴퓨팅이 이뤄지는 모든 곳에서 이를 수행하는 것은 우리 플랫폼뿐”이라고 강조했다. 엔비디아는 “TPU 같은 주문형반도체(ASIC)보다 뛰어난 성능과 다용성, 호환성을 제공한다”고 덧붙였다.구글도 성명에서 “맞춤형 TPU와 엔비디아 GPU 모두 수요가 늘어나고 있다”며 “우리는 수년간 그래왔던 대로 양쪽 모두를 지원할 것”이라고 밝혔다.증권가에서는 TPU 생태계 확장의 최대 수혜자로 삼성전자를 꼽고 있다. 김동원 KB증권 연구원은 “구글 TPU 설계와 생산을 담당하는 브로드컴의 경우 삼성전자가 메모리 공급 점유율 1위를 기록하고 있어 향후 구글 TPU 생태계 확장의 최대 수혜가 기대된다”고 분석했다. SK하이닉스도 구글 TPU에 HBM을 공급하고 있어 AI 생태계 다변화로 수혜를 볼 것으로 전망된다.
1079 조회
0 추천
2025.11.26 등록
제품 리더 Aakash G와 OpenAI의 Miqdad Jaffer는 모델 품질보다는 컨텍스트 엔지니어링—사용자 기록, 관련 문서, 시스템 제약 조건과 같은 올바른 정보를 AI 모델에 제공하는 관행—이 AI 기능이 훈련이 부족한 인턴처럼 실패하거나 성공하는지를 결정한다고 주장합니다.이 글은 Apollo의 이메일 작성기를 통해 이를 보여주는데, 엔지니어들이 대화 스레드, CRM 노트, 회사 톤, 관계 컨텍스트를 계층화한 후에야 일반적인 출력에서 출시 가능한 품질로 발전했습니다.전체 코드베이스를 인덱싱하고 벡터 데이터베이스를 통해 관련 코드를 검색하여 연간 10억 달러 이상의 수익을 달성한 AI 코딩 어시스턴트 Cursor는 컨텍스트 엔지니어링이 어떻게 경쟁 우위를 만들어내는지를 보여주는 사례로, Google이 이 기능을 내부에서 구축하는 대신 경쟁사인 Windsurf와 24억 달러의 라이선스 계약을 체결하게 만들었습니다.
1072 조회
0 추천
2025.11.26 등록
하버드 비즈니스 리뷰 분석에 따르면, AI 에이전트는 아직 소비자 대상 애플리케이션에 충분히 신뢰할 수 있는 수준이 아니며—보안 및 정확성에 대한 우려로 인해 소비자의 76%가 구매에 이를 사용하는 데에 소극적인 것으로 나타났습니다—하지만 구조화되고 반복적인 작업 및 인간의 감독이 한계를 보완할 수 있는 백엔드 엔터프라이즈 운영에서는 실질적인 가치를 제공하고 있습니다.주요 유럽 인터넷 제공업체와의 사례 연구에서는 현장 기술자를 지원하기 위해 멀티 에이전트 시스템을 도입하여, 문제 해결 시간을 60% 단축시키고 연간 100만 유로 이상의 반복적인 비용 절감과 함께 고객 만족도를 크게 향상시켰다는 잠재력을 보여주었습니다.이러한 점진적 개선은 혁명적인 변화라기보다는 린 제조(Lean manufacturing) 방법론에 가깝고, 엔터프라이즈 적용에는 세밀한 프로세스 매핑, 광범위한 IT 시스템 통합, 그리고 실제 환경에서 프롬프트 기반 시스템이 일반적으로 70% 이상의 정확도를 넘지 못하게 하는 AI 환각(hallucination)에 대한 관용이 요구됩니다 .
1071 조회
0 추천
2025.11.26 등록
엔비디아가 25일(현지시간) 자사 그래픽처리장치(GPU)가 업계보다 “한 세대 앞서 있다”며 구글의 AI 칩 경쟁에 정면 반박했다. 엔비디아는 소셜미디어 엑스(X) 공식 계정을 통해 “구글의 성공에 기쁘다. 우리는 계속 구글에 제품을 공급하고 있다”면서도 “우리는 업계보다 한 세대 앞서 있으며, 모든 AI 모델을 구동하고 컴퓨팅이 이뤄지는 모든 곳에서 작동하는 유일한 플랫폼”이라고 강조했다.이번 성명은 메타가 구글의 텐서처리장치(TPU)를 2027년부터 자사 데이터센터에 도입하기 위해 수십억 달러 규모의 계약을 협의 중이라는 보도가 나온 직후 나왔다. IT 전문매체 디인포메이션은 메타가 내년에 구글 클라우드를 통해 TPU를 임대하고, 2027년부터는 직접 구매해 데이터센터에 탑재하는 방안을 검토하고 있다고 전했다.주가 엇갈린 반응이날 엔비디아 주가는 전일 대비 2.59% 하락한 177.82달러에 거래를 마쳤다. 장중 한때 5.5% 이상 급락하기도 했다. 반면 알파벳 주가는 1.53% 상승 마감했으며, 장중 328.83달러까지 오르며 52주 신고가를 경신했다. 애널리스트들은 엔비디아가 GPU 기반 AI 칩 시장의 90% 이상을 점유하고 있지만, 최근 구글의 자체 칩 TPU가 엔비디아 최신 칩인 블랙웰의 실행 가능한 대안으로 주목받고 있다고 분석했다.구글 TPU 영향력 확대구글은 10년 전부터 브로드컴을 통해 TPU를 제조해왔으며, 최근 7세대 TPU ‘아이언우드’를 출시했다. 구글은 이미 AI 챗봇 ‘클로드’를 운영하는 앤트로픽과 최대 100만 개의 TPU를 공급하는 계약을 지난달 체결했다. 구글은 이날 성명에서 “맞춤형 TPU와 엔비디아 GPU 모두 수요가 늘어나고 있다”며 “양쪽 모두를 지원할 것”이라는 입장을 밝혔다.젠슨 황 엔비디아 최고경영자는 최근 실적발표에서 “구글은 고객사이며 제미나이도 엔비디아 기술로 구동된다”고 말하며, AI 개발에 더 많은 칩과 데이터가 필요하다는 ‘스케일링 법칙’이 여전히 유효하다고 강조했다.
1082 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입