Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 08.05 09:05
155 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 123 / 18 페이지
디자인 프로토타입 툴로 유명한 Figma 가 연초 계획한 대로 AI 기능을 탑재한 앱을 모두에게 공개했다.그동안 베타 테스트로 운영해 온 Figma AI 앱은 7월 24일부터 모두가 사용할 수 있도록 공개된 것이다피그마가 홈페이지를 통해 밝힌 내용의 핵심은 아래와 같다.--Figma Make와 Figma AI의 Make and Edit Image , Boost Resolution 등 의 기능이 베타 버전에서 일반 공개 버전으로 전환된다는 소식을 전해드리게 되어 기쁩니다.정식 사용자는 Figma Make 파일을 게시*하거나 비공개적으로 공유하는 기능을 포함하여 AI 기능과 Figma Make의 모든 잠재력을 활용할 수 있습니다.View, Collab 및 Dev 시트 사용자는 Figma Make 파일을 초안 상태로 무제한으로 사용할 수 있으며, 사용 가능한 제품에서 AI 기능을 사용해 볼 수 있습니다.스타터 플랜 사용자는 Figma Make 파일을 무제한으로 초안 형태로 사용할 수 있으며, 최대 3개의 Figma Make 파일을 팀과 공유할 수 있습니다. 다른 AI 기능은 유료 플랜에서만 제공됩니다.단, Figma Make 파일 게시 기능은 아직 베타 버전입니다.
245 조회
0 추천
2025.07.25 등록
AI 분야의 투자로 Big Tech 의 CAPEX 진출이 크게 늘고 있다고 미국 언론들이 보도했다.미국 4대 기술 기업 의 지출은 작년에 63% 급증하여 사상 최고치를 기록. 마이크로소프트, 알파벳, 아마존, 메타는 2024년에 2,460억 달러의 자본 지출을 보고했는데, 이는 2023년의 1,510억 달러에서 증가한 수치이다. 이들은 AI 대규모 언어 모델 연구의 선두를 유지하기 위해 데이터 센터를 구축하고 특수 칩 클러스터를 채우기 위한 경쟁에 돌입하면서 올해 지출이 3,200억 달러를 초과할 수 있다고 예측되었다.
194 조회
0 추천
2025.07.25 등록
오픈AI의 GPT 5 가 8월중 출시할 것으로 TechCrunch가 보도했다.원래 이 버전은 연초 5월 말로 예상됐으나 추가 테스트 등으로 일정이 미뤄졌고,내부 인사와 CEO 샘 알트먼의 트위터 언급을 통해 8월 중 발표가 이뤄질 것으로 알려졌다.새 버전은 다음과 같은 기능이 업데이트 될 예정이라고 한다.통합 모델: GPT-5는 기존의 GPT-시리즈와 o-시리즈(특히 o3 reasoning 기술)를 통합한 형태로 제공될 예정이다. 이로써 사용자가 모델을 따로 선택할 필요 없이, 하나의 시스템에서 다양한 인공지능 기능을 누릴 수 있다124.다양한 버전: 메인 GPT-5 외에 미니(mini)·나노(nano) 버전도 함께 제공된다. mini는 ChatGPT와 OpenAI API에서, nano는 API에서만 제공될 예정이다123.강화된 추론(Reasoning): CEO 샘 알트먼은 팟캐스트에서 “내가 답을 못하던 문제를 GPT-5가 완벽하게 풀었다”며, 사람을 능가하는 수준의 추론 능력을 강조했다. 모델의 대표적 '여기 있다' 순간이었다고 언급했다
241 조회
0 추천
2025.07.25 등록
유튜브 영상 요약입니다.(요약은 젠스파크)---GPT가 24시간 전에 몰래 업데이트한 이미지 일관성 기능이 진짜 미쳤어요!기존: 같은 캐릭터 생성해도 얼굴이나 옷이 계속 바뀜 ????현재: 캐릭터 외형은 그대로 유지하면서 배경/상황만 딱 변경! ✨/ 실전 활용 사례 15가지1. 얼굴 감정 변화같은 사람이 웃는 표정 → 놀라는 표정 → 의심하는 표정정말 자연스럽게 감정만 바뀌고 외형은 동일!2. 시간여행 컨셉아기 사진 넣고 → 10살, 20살, 30살 버전 생성옷 색깔, 얼굴 특징까지 일관성 있게 유지됨3. 커플 프로필 사진커플은 그대로 두고 배경만 변경한강 → 야경 → 바닷가 → 뉴욕 이런 식으로!4. 반려동물 사진우리집 강아지 사진으로 다양한 상황 연출공 가지고 놀기, 친구들과 뛰어놀기, 간식 먹기 등5. AI 모델링헤어컬러 변경, 의상 체인지 자유자재염색 시뮬레이션도 가능!6. 옷 갈아입히기온라인 쇼핑몰 운영하시는 분들 대박일듯같은 모델로 다양한 의상 착용샷 생성7. 제품 촬영이거 진짜 혁신적임!기존 모델 촬영비 최소 20-30만원 → AI로 해결제품 + 배경 자연스럽게 합성8. 캐릭터 IP 개발쿼카 캐릭터로 운동→러닝→식사→수면 스토리 제작유튜브, 인스타, 틱톡 콘텐츠 제작 가능9. 유튜브 썸네일유명 유튜버 썸네일 스타일에 내 얼굴 합성썸네일 제작 시간 30분 → 3분으로 단축!10. 로고 합성폴로 로고를 모델 의상에 자연스럽게 적용패션 브랜드 런칭 전 가상 시안 제작 가능11. 이모티콘 제작일관된 캐릭터로 "공부중", "밥먹는중", "일하는중" 이모티콘카톡 이모티콘 사업도 가능할듯?12. 전자책 표지레퍼런스 디자인 + 내가 원하는 제목디자이너 의뢰 전 가시안 제작13. 제품 연출컷캐리어를 인천공항에서 찍은 것처럼 합성실제 촬영 없이도 퀄리티 높은 연출 가능14. 웹툰 제작일관된 캐릭터로 4컷 만화 생성대본까지 같이 요청하면 더 완벽!15. 뷰티/화장품모델 + 화장품 자연스러운 합성진짜 광고 수준의 퀄리티!이 정도면 정말 많은 업계가 변화할 것 같아요...촬영업계: 비용 절감 효과 엄청남디자인: 가시안 제작이 초스피드로전자상거래: 제품 촬영비 대폭 절약콘텐츠 제작: 개인도 퀄리티 높은 콘텐츠 가능⚠️ 주의사항아직 텍스트 디테일은 약간 아쉬운 부분 있음프롬프트를 구체적으로 작성할수록 원하는 결과 나옴제품 촬영시 누끼컷(배경 제거된 이미지) 사용 권장
173 조회
0 추천
2025.07.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입