Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
737 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 335 / 73 페이지
한국인이 가장 많이 사용한 AI챗봇 순위가 발표되었습니다. chatgp가 압도적 1위인 건 알겠는데 제타와 채티, 크랙은 다소 생소하고 다글로가 예상보다 많이 사용하네요. 1. 챗GPT: 1,844만 명(압도적 1위) 2. 제타: 304만 명 3. 뤼튼: 245만 명 4. 퍼플렉시티(Perplexity): 171만 명 5. 에이닷: 138만 명 6. 다글로: 63만 명 7. 채티: 43만 명 8. 클로드(Claude): 42만 명 9. 그록(Grok) AI: 36만 명 10. 크랙: 35만 명 제타는 스캐터랩이 만든 AI 캐릭터 채팅이며 90%가 1020대. 1인당 사용시간이 월 17시간채티는 채팅형 웹소설이며 AI와 대화하며 이야기를 읽고 만드는 양방향.크랙은 뤼튼에서 만든 AI 캐릭터 서비스로 이용자가 캐릭터 만드는 스토리 대화형
901 조회
0 추천
2025.07.17 등록
OpenAI, DeepMind, Anthropic, Meta가 같이 낸 최신 논문에서 앞으로의 AI는 ‘생각을 말로 설명하는 능력’을 잃을 수 있다고 경고했대. 지금까지는 체인 오브 소트(Chain of Thought) 방식 덕분에 AI가 어떤 논리로 결론을 냈는지 사람이 따라갈 수 있었는데, 앞으로는 그 과정이 언어가 아니라 비언어적인 방식으로 진행될 수도 있다네. 그 말인즉슨, AI가 왜 그런 판단을 했는지 설명을 안 해줄 수도 있다는 거고, 그러면 우리가 AI의 잘못된 판단이나 이상 행동을 잡아내기가 더 어려워질 수 있다는 얘기지.
847 조회
0 추천
2025.07.17 등록
OpenAI가 ChatGPT에 결제 체크아웃 시스템을 도입할 계획이 알려졌다. 이 기능이 도입되면 이용자들은 챗봇 대화 안에서 바로 상품을 구매할 수 있게 된다. 이렇게 진행된 결제애 대해 OpenAI는 수수료를 받게 될 예정이라고. 출시 시점은 아직 나오지 않았고 OpenAI 및 제휴사인 Shopify 등과 테스트 후 수익 배분 등 세부 조건을 논의하게 된다고. 또한 Shopify는 백엔드 결제 인프라 제공 파트너로 참여 중이며, 양사는 올해 초부터 쇼핑 연동, 제품/리뷰 기능 개선 등을 협력해왔
848 조회
0 추천
2025.07.17 등록
YouTube는 2025년 7월 15일부터 'YouTube 파트너 프로그램(YPP)' 수익화 정책을 업데이트해, '비정통적(inauthentic)'이고 대량 생산되거나 반복적인 영상의 수익화를 제한한다고 공지했다.. 해당 정책은 특히 최신 AI 기술을 통한 대량 저품질 콘텐츠에 제한을 을 걸 것으로 예상된다. 공지 내용은 아래와 같다. "YouTube는 YouTube 파트너 프로그램(YPP)을 통해 수익을 창출하려는 크리에이터에게 항상 '진정성 있는 자체 제작' 콘텐츠를 업로드하도록 요구해 왔습니다. 2025년 7월 15일에 대량 제작된 콘텐츠 및 중복 콘텐츠를 보다 잘 식별할 수 있도록 가이드라인을 업데이트할 예정입니다. 오늘날의 '허위' 콘텐츠를 더 잘 반영하도록 정책이 업데이트됩니다."
822 조회
0 추천
2025.07.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입