Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
1,745 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,366 / 85 페이지
유대인혐오음모론에맞서도록훈련된AI챗봇이사용자들의이러한신념을줄이고유대인에대한인식을개선했다는연구결과가수요일에공개되었습니다.이연구는유대인명예훼손방지연맹(ADL)산하반유대주의연구센터소속연구진이발표한것입니다.효과는한달후에도지속되어,증가하는반유대주의에맞서새로운희망을제공합니다.​이실험에는적어도여섯가지의대표적인반유대인음모론중하나를믿는1,200명이상의사람들이참여했습니다.여기에는유대인들이미디어를통제한다거나,이민에유대인들이관여한다는‘위대한대체이론’등이포함됩니다.참가자들은이러한이론을반박하도록프로그래밍된AI모델과대화를나눴으며,이모델은Anthropic의Claude를기반으로만들어졌습니다.연구진이‘DebunkBot’이라고부르는챗봇과교류한사람들은대조군보다자신들의신념이훨씬더약해지는경향이나타났습니다.​​이번연구의시니어저자이자코넬대학교교수인데이비드랜드는“이연구결과가주목할만한점은,사실에기반한반박이정체성과편견에뿌리깊게연결되었고오랜역사를가진음모론에도효과가있다는것”이라고밝혔습니다.랜드는이어,“AI는대부분정확한정보와증거기반반론을제시함으로써,여전히사실이사람들의생각을바꿀수있음을보여준다”고덧붙였습니다.​잘못된정보의문제,단순한편견이아니다ADL의반유대주의연구센터를이끄는MattWilliams는이연구가반유대주의를주로시민권문제가아닌잘못된정보의문제로이해하는방식의전환을반영한다고말했습니다.지난10년동안음모론을믿는미국인의비율이역사적비율의두배이상인45%에달했다고Williams는말했습니다.​이연구는AI모델이증오확산에서차지하는역할에대한감시가증가하는가운데나왔습니다.이번주,프랑스당국은ElonMusk의Grok챗봇이한사용자에게나치가스실이대량학살을위해설계되지않았다고말했다는보도이후조사에착수했습니다.3월에발표된ADL보고서는주요AI언어모델에서반유대주의와반이스라엘편향을발견했습니다.​한계및다음단계연구결과에따르면DebunkBot은완전한해결책이아니었습니다.더많은반유대주의음모론을믿는사람들은더적은변화를경험했으며,믿음은감소했지만완전히제거되지는않았습니다.그럼에도불구하고Williams는음모론믿음에대응할수있는모든전략이가치있다고말했습니다.DebunkBot은현재온라인에서이용가능하며,ADL은주요AI플랫폼들이그전문성을통합하도록설득하기위해노력하고있습니다."AI와LLM들은도구입니다,그렇죠?"Williams가말했습니다."우리는도구를선과악을위해사용할수있습니다".
1169 조회
0 추천
2025.11.21 등록
HarvardBusinessReview는채용관리자들이면접중지원자가AI를사용하는지탐지하려고하기보다는,챗봇이복제할수없는인간의기술,즉감성지능과적응력을평가할수있도록면접을재설계해야한다고주장합니다.​이기사는다섯가지핵심역량을테스트할것을권장합니다:사회적신호를읽고신체언어변화에반응하기,명확한답이없는모호한시나리오를통해추론하기,비판적사고를드러내는명확화질문하기,대화가예상치못한방향으로전개될때적응하기,그리고그룹환경에서협력적문제해결능력보여주기.​이러한접근방식은현재99%의채용관리자가채용과정에서어떤형태로든AI를사용하고있으며,지원자들은실시간으로면접응답을생성하기위해ChatGPT와같은도구에점점더의존하고있는상황에서증가하는과제를해결합니다.
1158 조회
0 추천
2025.11.21 등록
MITTechnologyReview는계획,추론및작업을독립적으로수행할수있는자율시스템인에이전틱AI가기존의운영사일로를해체하는통합데이터패브릭아키텍처를통해머신데이터를통합함으로써조직이디지털복원력을근본적으로재고할것을요구한다고보도했습니다.​Cisco의자회사인Splunk의KamHathi에따르면,전세계AI투자가2025년까지1조5천억달러에달할것으로예상됨에도불구하고,예기치않은상황에서서비스연속성과보안을보장할수있는조직의능력에대해확신을표명하는비즈니스임원은절반도되지않습니다.​인간이생성한콘텐츠로훈련된초기AI시스템과달리,에이전틱AI는장치와애플리케이션의로그,메트릭및텔레메트리와같은머신데이터에대한원활한접근을필요로하지만,현재이러한자율시스템을완전히활성화하는데필요한통합수준을달성하는조직은거의없으며,이는이상징후와부정확성의위험을초래합니다.
1182 조회
0 추천
2025.11.21 등록
취리히에본사를둔로보틱스스타트업Flexion은전Nvidia연구원들이설립한회사로,휴머노이드로봇이다양한환경에서자율적으로작동할수있도록하는인공지능소프트웨어개발을위해시리즈A펀딩으로5천만달러를확보했습니다.이번라운드는DSTGlobalPartners가주도했으며,NVentures,Redalpine,ProsusVentures,MoonfireVentures가참여했습니다.​11월20일발표된이번펀딩으로Flexion은1월설립이후총5,735만달러의자본을조달했으며,이는베이에리어에미국본사를개설하고,31명으로구성된팀을확장하며,컴퓨팅인프라와로봇플릿을확대하는데사용될예정입니다.회사는연간로봇당소프트웨어라이선스모델을통해주요주문자상표부착생산(OEM)파트너들과함께자율플랫폼의상용화를가속화할계획입니다.​원격조작에서벗어나기Flexion은인간작업자가원격으로로봇을제어하는원격조작방식을지양하고,대신고성능물리시뮬레이션에서생성된합성데이터와강화학습기법을결합한방식을선호함으로써경쟁사들과차별화됩니다.ETH취리히에서수년간의연구를거쳐CTODavidHoeller,JulianNubert,FabianTischhauser와함께회사를공동설립한CEONikitaRudin은원격조작기반접근방식이"수십만시간의수동인간시연을필요로하며"이는근본적으로확장될수없다고주장합니다.​이회사의플랫폼은Rudin이설명하는"완전자율스택"을제공하며,언어수준추론,비전-언어-행동모션생성,트랜스포머기반전신제어기능을갖추고있어로봇이최소한의인간개입으로명령을이해하고새로운상황에적응할수있습니다.단일로봇형태에초점을맞춘경쟁사들과달리,Flexion의형태무관시스템은휴머노이드로봇,바퀴형플랫폼,다중팔시스템전반에걸쳐작동하도록설계되었습니다.​급증하는로봇공학투자Flexion의투자유치는로봇공학벤처캐피털에있어활발한한해동안이루어졌으며,Crunchbase데이터에따르면11월19일기준전세계적으로107억달러이상이투자되어이미2021년이후모든연도를넘어섰다.이분야는2025년2분기에만거래가치가88억달러로급증하여전분기대비170.5%증가했다.경쟁사인PhysicalIntelligence는최근56억달러의기업가치로6억달러를유치했으며,FigureAI와Apptronik을포함한다른휴머노이드로봇스타트업들도10억달러이상의기업가치를확보했다.​Redalpine의투자자PhilipKneis는Flexion이"스택에서가장어렵고방어가능한부분인로봇을위한공유두뇌구축"에집중하기때문에두각을나타냈다고말했다.ProsusVentures의SandeepBakshi는로봇기반모델개발자들이"결국시뮬레이션기반훈련을크게활용해야할필요가있기"때문에이스타트업의시뮬레이션우선접근방식이승리할수있는위치에있다고언급했다.
1146 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입