Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
698 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 329 / 58 페이지
2025년 5월 25일 중국 항저우에서 세계 최초의 휴머노이드 로봇 격투 대회가 열렸습니다. 중국중앙방송총국이 주최한 이 대회에는 유니트리 G1 로봇 4대가 참가했습니다.로봇들은 키 130cm, 무게 35kg으로 인간 조종사가 리모컨으로 조작했지만, 격투 동작은 전문 격투선수로부터 학습한 AI 기술로 구현되었습니다. 손 타격 1점, 발차기 3점, 쓰러지면 5점 감점이라는 규칙으로 진행되었고, 넘어진 후 8초 내에 일어나지 못하면 패배 처리되었습니다.경기에서는 로봇들이 잽, 어퍼컷, 킥 등 다양한 격투 기술을 선보였으며, "AI Strategist"라는 로봇이 우승했습니다. 전 세계에 생중계 된 이 대회는 로봇 기술의 실용화 가능성을 보여주는 중요한 이정표로 평가 받고 있으며, 중국의 로봇 산업 발전 의지를 드러낸 행사로 해석됩니다.
513 조회
0 추천
2025.08.19 등록
애플은 올해 WWDC에서 Xcode의 "Intelligence" 기능에 챗GPT(ChatGPT)와 다양한 LLM(대형 언어모델) API 연동을 예고한 데 이어, Anthropic의 Claude도 Xcode에 네이티브로 통합할 계획을 갖고 있음이 확인되었다.9to5mac 매체에 따르면 Xcode 26 베타 7 분석 결과, Claude Sonnet 4.0 및 Claude Opus 4의 지원 코드와 Anthropic 계정 관련 언급이 발견되었다고. 그동안 챗GPT만 Xcode와 1차로 통합이 되어 있었으나, 이제 Claude도 유사한 수준의 네이티브 지원을 받을 기반이 마련된 것으로 예상된다.Xcode에 연동되는 Swift Assist라는 기능은 2024년 WWDC에서 최초로 공개된 애플의 AI 기반 코딩 도우미였으며, GitHub Copilot과 유사한 서비스였다. 하지만 실제로 출시되지는 않았고, 이제 Xcode 26에서 기능이 더 확장된 형태로 새롭게 선보이게 되며,. 공식 명칭도 더 이상 Swift Assist가 아니지만, 애플 자체 모델과 챗GPT, 그리고 다양한 서드파티 LLM을 네이티브로 지원하게 된다.애플은 2025년 5월경부터 Claude 기반 Xcode를 내부적으로 테스트해왔던 것으로 알려졌다. 그동안 Swift Assist 확장설이나 챗GPT만 지원한다는 루머가 돌았지만, 이번 발견으로 Claude를 선호하는 개발자들에게 좋은 소식이 될 것으로 보인다.
602 조회
0 추천
2025.08.19 등록
Claude Opus 4 및 4.1, 소수의 대화 종료 기능 도입안트로픽은 최근 Claude Opus 4와 4.1에 소비자용 챗 인터페이스에서 특정 극단적 상황에 한해 대화를 종료할 수 있는 기능을 도입했으며, 사용자로부터 학대적인 상호작용이 반복될 때 사용된다고 밝혔다.특히 이 기능은 잠재적인 AI 복지 연구의 일환으로 도입되었다고 하며, 사용자가 스스로 채팅 종료를 요청할 때, 혹은 Claude가 반복적인 거절에도 불구하고 생산적인 대화로 전환이 불가능하다고 판단할 때에만 최후의 수단으로써 사용된다고 한다.따라서 대부분의 일반 사용자는 평소에는 해당 기능을 경험하지 않을 전망이다.Claude가 대화 종료를 선택하면 해당 채팅에서는 추가 메시지를 보낼 수 없으나, 다른 대화에는 영향을 주지 않는다.사용자는 여전히 이전 메시지를 수정하거나 새로운 선택지를 만들어 대화를 이어갈 수 있다. 이 기능은 계속 개선될 예정이고 피드백을 받고 있다고 회사는 밝혔다.
530 조회
0 추천
2025.08.18 등록
LG전자가 "Radio Optimism" 이라는 이름으로 AI 음악생성 이벤트를 진행하고 있네요.https://radiooptimism.lg.com/ko누구나 쉽게 음악을 만들고 이를 공유하는 이벤트로 간단히 분위기와 장르 등을 선택하면 곡을 만들어줍니다..https://live.lge.co.kr/2508-lg-radio-optimism/
505 조회
3 추천
2025.08.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입