Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
1,649 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,366 / 108 페이지
(퍼플렉시티가정리한기사)Helldivers2개발사ArrowheadGameStudios의CEO는ArcRaiders에서AI생성음성을논란의여지가있게사용한것을옹호하며,게임업계가인공지능에대해극단적인입장을취하기보다는"중간지점"을찾아야한다고주장했습니다.ShamsJorjani의이러한발언은Eurogamer가ArcRaiders에별5개중2개만부여한후나왔으며,낮은점수는주로이추출슈터게임의AI텍스트음성변환기술구현때문이었습니다.이리뷰는게임이400만장이상판매되는상업적성공을거두었음에도불구하고게임의종합Metacritic점수를떨어뜨렸습니다.​"어쩌면,그럴수도있지않을까요,현실은그중간어딘가에있지않을까요?그럴수도있지않을까요?"Jorjani는TheGameBusinessShow와의인터뷰에서말했습니다."저는사람들이극단적인견해로뛰어든다는것을알게됩니다."​성우들이보수를받은후복제됨Nexon소유의ArcRaiders개발사EmbarkStudios는추가대사를생성하는AI모델학습에자신의목소리를사용하는데동의한성우들을고용했습니다.이시스템은아이템이름,위치,나침반방향에대한음성대사를생성하며,새로운콘텐츠가추가될때마다배우들이스튜디오에돌아올필요가없습니다.​Jorjani는이접근방식을칭찬하며,자신은개인적으로멀티플레이어게임에서음성채팅을피한다고언급했습니다."이것이더많은사람들이서로소통할수있게해주며,궁극적으로게임에좋은일이라고생각합니다"라고그는말했습니다."사람들이자신의작업에대해보상받을수있도록하기만하면됩니다.분명히중간지점이있을것입니다."​ArrowheadCEO는자신의스튜디오가게임자체에는AI를사용하지않지만,관리업무를위한효율성도구로는활용한다고명확히했습니다."우리는게임에AI를넣지않지만,영수증처리를더빨리할수있게해준다면,그것은모두를위한더많은Helldivers를의미합니다"라고그는말했습니다.​업계전반의긴장이논쟁은주요퍼블리셔들이AI사용을확대함에따라더광범위한긴장을반영합니다.SquareEnix는최근2027년말까지품질보증및디버깅작업의70%를자동화하겠다는계획을발표했습니다.Krafton은10월에직원들을위한자발적사직프로그램을포함하는"AI우선"방침을시작했습니다.Microsoft소유의Activision은CallofDuty:BlackOps7에서AI로생성된콜링카드아트워크로인해반발에직면했습니다.​한편,PUBG크리에이터BrendanGreene은Eurogamer에"커뮤니티가AI관련사안에반발하는것을보고정말힘을얻었다"고말했으며,이는스튜디오들이효율성향상과창의적무결성및인력문제사이에서균형을맞추려는가운데업계의이념적분열을강조합니다.​
1091 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Xbox소유스튜디오인ObsidianEntertainment는게임개발에생성형AI를사용하지않았다고확인하며,게임업계전반에걸쳐증가하는이기술의채택에대해확고한반대입장을취했습니다.이러한선언은여러주목받는게임들이AI생성콘텐츠로인해반발에직면하고있는시점에나왔습니다.GameFile과의인터뷰에서Obsidian개발자인JoshSawyer,KateDollarhyde,LeonardBoyarsky는스튜디오가이기술을전혀사용하지않는다고명확히밝혔습니다.Obsidian이글쓰기에생성형AI를사용하는지묻는질문에Sawyer는"우리가사용한것이아니다"라고답했으며,Boyarsky는"우리는전혀사용하지않았다"고덧붙였습니다.​이러한입장은2025년Obsidian의놀라운성과를고려할때특히주목할만합니다.약285명의직원을고용하고있는이스튜디오는올해판타지RPGAvowed,서바이벌게임Grounded2,그리고SF후속작TheOuterWorlds2라는세개의주요타이틀을출시했습니다.크리에이티브디렉터를맡고있는Boyarsky는AI기반글쓰기에대해추측했던자신의2019년발언을회고하며,이제는과거의자신을"머리를한대때리고싶다"고말했고,그러한개념은빠르게"매우다루기어려워질것"이라고덧붙였습니다.​논란이주요출시작들을휩쓸다Obsidian의입장은최근업계논란과뚜렷한대조를이룬다.CallofDuty:BlackOps7은호출카드와게임내자산에AI생성아트를사용한것에대해강한비판을받았으며,플레이어들은지브리스타일아트워크에서손가락이6개인캐릭터와같은명백한오류를발견했다.이러한반발로인해미국하원의원RoKhanna는11월14일"기업이더큰이익을얻기위해일자리를없애는데AI를사용하는것을방지하는"규제를요구했다.​ArcRaiders는Eurogamer의리뷰가AI생성음성사용을비판하며게임에2/5점을부여한후유사한논쟁을불러일으켰다.EpicGamesCEOTimSweeney는소셜미디어에서이기술을옹호하며리뷰를"정치적"이라고부르고AI가성우들에게기회를창출할것이라고주장했다.NexonCEOJunghunLee는플레이어들이"이제모든게임회사가AI를사용하고있다고가정해야한다"고제안했으나,StrangeScaffold의XalavierNelsonJr.를포함한여러인디개발자들이이주장에즉각반박했으며,그는자신의스튜디오가"그런것은전혀건드리지않고연간대략3개의게임을출시한다"고언급했다.​출판사들,AI통합에박차를가하다플레이어들의저항에도불구하고,여러주요퍼블리셔들이AI도입을가속화하고있습니다.SquareEnix는2027년까지품질보증업무의70%를자동화할계획을발표했으며,ElectronicArts는직원들의AI도구사용을의무화했습니다.Ubisoft는Anno117:PaxRomana에서AI생성아트가검토과정을"통과했다"고인정하며,다가오는패치에서이를교체하겠다고약속했습니다.​Xbox책임자PhilSpencer는10월에Microsoft가자사스튜디오에AI사용을강제하지않으며,각팀이자체적으로결정을내릴수있도록허용한다고밝혔습니다.
1090 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)DanceMagazine는2025년11월17일,무용커뮤니티가분야의민주화를약속하면서도일자리안정성과예술적소유권에대한우려를제기하는도구들과씨름하는가운데,새롭게부상하는AI보조모션캡처기술에대한분석을발표했다.이기사는공연자들의움직임을디지털환경으로포착하고변환하는방식을재편한혁신의물결속에서나왔으며,새로운마커리스시스템은특수슈트와센서의필요성을제거했다.​구글이AISOMA를공개하며기술이발전하다이시기는구글이11월16일에출시한AISOMA와일치하는데,이는웨인맥그리거경의25년아카이브에서400만개의포즈로훈련된AI안무도구입니다.이시스템은기기카메라를통해사용자의춤동작을분석하고맥그리거의독특한스타일에기반한독창적인안무문구를생성하며,인공지능이예술적유산을보존하고확장할수있는방식에서중요한전환점을보여줍니다."안무가이자감독으로서의제평생의작업은우리가신체를통해그리고신체와함께어떻게사고하는지에대한끝없는탐구입니다"라고맥그리거는구글의발표에서말했습니다.​AISOMA플랫폼은TensorFlow2와MediaPipe기술을사용하여2D분석에서완전한3차원포즈추출로이동하면서이전버전보다기술적도약을나타냅니다.구글아트앤컬처의디렉터아미트수드는이를"모든사람에게자신의창의성의경계를놀이하고,탐구하고,밀어붙이도록초대하는것"이라고설명했습니다.​마커리스기술이산업표준을재편하다마커리스모션캡처시스템의최근발전으로물리적마커나특수슈트의필요성이없어졌으며,AI,컴퓨터비전,생체역학을사용하여비디오영상에서직접움직임데이터를추출할수있게되었다.MoveAI와같은회사들은2025년3월런던BAFTA에서Gen2SpatialMotionModels를출시하여개발자들이광학등급품질이라고묘사하는수준을달성했다.2024년에출시된실시간솔루션인MoveLive는4~8대의카메라를사용하여10×10미터공간에서100밀리초미만의지연시간으로공연자를캡처한다.​모션캡처는수십년동안영화,텔레비전,게임분야에필수적이었으며,댄서들은디지털캐릭터작업을위한전문무버로자주고용되어왔다.그러나이기술의진화는보상과동의에대한논쟁을불러일으켰다."예술가들이자신의움직임이미래에어떻게적용되고,재결합되거나,훈련데이터에사용될수있는지에대해계약적으로명시하고,이에대한지식과통제권을갖는것이매우중요합니다"라고안무가이자아티스트-엔지니어인LaurelLawson은2023년DanceMagazine과의인터뷰에서말했다.​노조,파업중보호조치쟁취공연자에대한AI의영향에대한우려는2024-2025년SAG-AFTRA비디오게임파업으로정점에달했으며,이는2025년7월모션캡처아티스트에대한새로운보호조치와함께종료되었습니다.95.04%의찬성률로비준된인터랙티브미디어협약은AI로생성된디지털복제본에관한사전동의와투명성을요구하며,공연자는파업기간동안동의를철회할수있습니다.2024년9월에통과된캘리포니아주법안은기업이동의없이AI를사용하여공연을복제하는것을추가로금지했습니다.​"목소리뿐만아니라신체성까지이러한캐릭터에기여하며자신의안녕을위험에빠뜨리는개인들이있습니다"라고SAG-AFTRA협상가던컨크랩트리-아일랜드는언급하며,모션캡처공연자들이성우들과동등한보호를받을자격이있다고강조했습니다.
1098 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Salesforce는일요일AgentforceCommerce플랫폼에대한대대적인업데이트를공개하며,인공지능이소비자들의온라인상품발견및구매방식을재편함에따라소매업체들이ChatGPT와같은AI플랫폼을통해직접제품을판매할수있도록했다.​이번발표는전세계15억명의쇼핑객을대상으로한Salesforce데이터에따르면,2025년상반기AI어시스턴트기반온라인트래픽이119퍼센트급증한가운데나왔다.이회사는AI에이전트가사이버위크기간동안전세계주문의21퍼센트에영향을미칠것으로예상하며,이는2,630억달러의매출을의미한다.​ChatGPT를통한직접판매이번업데이트의핵심은AgenticCommerceProtocol과의통합으로,이는Stripe와OpenAI가공동개발한개방형표준으로소매업체가제품카탈로그를ChatGPT에직접연결할수있게해줍니다.소비자는Stripe와의파트너십을통해챗봇내에서구매를완료할수있으며,Stripe가사용자가대화를떠나지않고도결제를처리합니다.​"Stripe및OpenAI와ACP에대한협력을통해,우리는에이전틱커머스의미래를위해설계된통합시스템을제공하고있으며,구매까지의경로를획기적으로더빠르고개인화되게만들고있습니다"라고Salesforce의CommerceCloud및Retail총괄매니저인NitinMangtani가말했습니다.​Salesforce는또한Google과AgentPaymentsProtocol에대한파트너십을맺어여러플랫폼에서안전한거래를가능하게했습니다.​새로운기능및초기결과이제일반적으로사용가능한가이드쇼핑기능은7개언어로개인화된제품추천을제공하고대화를진행합니다.Pandora는Agentforce를통해자주묻는질문을자동화한후순추천고객지수(NetPromoterScore)가10%증가했다고보고했으며,AI추천은더높은주문량과평균주문금액으로이어졌습니다.​Pacsun은ChatGPT통합을사용하여Z세대및알파세대고객에게다가갈계획입니다.최고디지털및정보책임자(ChiefDigital&InformationOfficer)ShirleyGao는"우리는AgentforceCommerce와OpenAI의통합이우리제품을AI플랫폼으로확장할수있는강력한기회를제공한다고믿습니다"라고말했습니다.​2026년에출시될추가기능으로는2026년겨울에주문관리를위한주문라우팅(OrderRoutingforOrderManagement),같은기간에베타버전으로진입하는머천다이징을위한AgentforceActions,그리고2026년봄에파일럿으로시작하는POS를위한AgentforceActions가있습니다.Commerce용Data360ZeroCopyAccess는스토어프론트,마케팅및서비스데이터를실시간고객프로필과연결합니다.​
1130 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입