Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
1,662 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 908 / 211 페이지
중국 최대 검색엔진 운영사인 바이두가 인공지능을 활용해 동물의 울음소리를 인간 언어로 번역하는 혁신적인 기술을 개발 중이라고 로이터가 보도했습니다.바이두는 최근 중국국가지식산권국에 관련 기술에 대한 특허를 출원했으며, 공개된 특허 문서에 따르면 이 시스템은 동물의 울음소리뿐만 아니라 행동 패턴, 생리학적 신호 등 다양한 데이터를 수집한 후 이를 사전 처리하고 통합해 AI가 분석하는 방식으로 작동합니다.분석된 결과는 동물의 감정 상태를 파악하는 데 활용되며, 이 감정은 다시 의미 단위로 해석되어 인간의 언어로 번역됩니다.바이두는 특허 문서에서 이 시스템이 인간과 동물 간 감정적 소통과 이해를 한층 더 깊게 해주며 종을 뛰어넘는 커뮤니케이션의 정확성과 효율성을 개선할 것이라고 설명했습니다.바이두 대변인은 현재 여전히 연구 단계에 있다고 밝혔으며, 중국 SNS에서는 우리 집 강아지가 나한테 뭐라고 하는지 드디어 알게 될까라는 기대 섞인 반응과 함께 실제 현장에서 얼마나 정확하게 작동할지는 두고 봐야 한다는 회의적인 시선도 나타나고 있습니다.
1719 조회
0 추천
2025.08.04 등록
인공지능 휴머노이드 로봇이 그린 초상화가 경매 역사상 최고가에 낙찰되어 화제가 되고 있습니다.AFP통신 등 외신에 따르면 영국 런던 소더비 디지털 아트 세일 경매에서 세계 최초 초현실주의 로봇 아티스트 '아이다'가 그린 작품이 132만 달러(약 18억4700만원)에 팔렸다고 보도했습니다.'인공지능 신'이라는 제목의 이 작품은 컴퓨터 과학의 아버지로 불리는 영국 수학자 앨런 튜링의 얼굴을 그린 2.2m 크기의 대형 초상화입니다. 당초 경매 예상가는 18만 달러 정도였으나 실제 낙찰가는 예상의 7배를 넘어서는 기록적인 수준을 보였습니다.아이다는 2019년 근현대 미술 전문가 에이단 멜러가 옥스퍼드대학교와 버밍엄대학교 소속 AI 전문가들과 협업하여 개발한 로봇으로, 단발머리의 젊은 여성 외형을 하고 있으며 눈에 장착된 카메라와 로봇 팔을 이용해 직접 그림을 그립니다.소더비 측은 휴머노이드 로봇 아티스트가 경매에 출품한 최초의 작품이 기록적인 낙찰가를 기록한 것은 근현대 미술사의 한 획을 그은 것이라며 AI 기술과 국제 미술 시장의 교차점이 커지고 있음을 보여준 사례라고 평가했습니다.
1731 조회
0 추천
2025.08.04 등록
엘론 머스크의 xAI가 개발한 AI 챗봇 'Grok'이 6초 분량의 동영상을 생성하는 새로운 기능 'Imagine'을 공개했다.이 기능은 사용자 프롬프트에 따라 소리를 포함한 짧은 영상을 만들 수 있으며,성인용 및 나체 영상(‘spicy mode’)까지 제작이 가능하다는 점에서 논란이 되고 있다.현재 일부 직원들과 구독자들이 베타 테스트 중이며, 공식 출시일은 10월로 예정되어 있습니다.이 업데이트는 기존 Grok챗봇이 선정적인 AI '컴패니언'을 도입하면서 이미 논란에 휩싸인 상태에서발표되었고, 이 기능이 유명인 등 타인의 얼굴·이미지를 사실적으로 합성해 만든 '딥페이크' 영상 생산에 악용될 수 있다는 우려를 낳고 있다.
1881 조회
0 추천
2025.08.03 등록
애플 CEO 팀 쿡은 사내 전체 회의에서 AI가 스마트폰과 인터넷보다 더 큰 영향을 미칠 기술이라며 애플의 AI 우선순위를 강조했다.그는 애플이 PC, 스마트폰, 태블릿, MP3 플레이어 등에서 첫 번째가 아니었음에도 시장을 주도해왔다며, AI에서도 비슷한 혁신을 이룰 것이라고 밝혔다.애플은 소프트웨어 책임자 크레이그 페더리기는 Siri 아키텍처 개편이 기대 이상의 결과를 보이고 있다고 전했다. 이는 메타의 AI 전문가 스카우팅과 애플 내 사기 저하에 대응하기 위한 발언으로 보인다.
1763 조회
0 추천
2025.08.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입