Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
199 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 136 / 9 페이지
이 사업은 공무원이 보안 걱정 없이 다양한 생성형 AI 서비스를 활용하도록 관련 플랫폼과 거대언어모델(LLM), 컴퓨팅 자원(GPU 등) 등을 제공하는 게 목적이다. 행안부는 오는 11월 일부 서비스를 시범 제공할 계획이다. 삼성SDS 컨소시엄에 포함된 AI 플랫폼 2종(삼성SDS 패브릭스, 네이버 하이퍼스튜디오)과 LLM 모델 6개를 선정해 우선 서비스한다. 공무원은 이들 가운데 원하는 플랫폼과 LLM을 활용, AI를 업무에 적용해볼 수 있다.-> 우리가 아는 흔한 LLM모델을 쓸 수 있다는 말인가?
99 조회
0 추천
2025.08.20 등록
오픈AI는 2025년 8월 17일부터 챗GPT의 응답 톤을 보다 따뜻하고 친근하게 조정하는 업데이트를 적용했습니다. 이로 인해 대화가 더 자연스럽고 사용자 친화적으로 느껴집니다. 기존에는 정보 위주의 다소 딱딱한 응답이 주를 이뤘다면, 이제는 감정 표현이 더 풍부해졌습니다. 예를 들어, 이전에는 "오늘 서울 날씨는 맑음, 기온 25도입니다"라는 응답이었다면, 이제는 "서울 오늘 날씨가 정말 좋아요! 맑고 기온 25도라 나들이 가기 딱 좋겠네요!"처럼 보다 생동감 있는 답변을 제공합니다. 사용자 피드백에 따르면 대화의 자연스러움이 약 20% 향상되었습니다.PS. 그래서 그런지 자꾸 반말을 하네요...
100 조회
0 추천
2025.08.20 등록
구글 딥마인드가 초경량 AI 모델 '젬마 3 270'(2억 7천만 매개변수)을 오픈소스로 공개했습니다. 이 모델은 휴대폰, 노트북, 웨어러블 기기 등 저전력 장치에서도 고효율로 작동하도록 설계되었습니다. 특히, 개발자 커뮤니티를 지원하기 위해 무료로 제공되는 '제미나이 CLI 깃허브 액션'과 함께, AI 코딩 협업 도구로 주목받고 있습니다. 이는 소규모 개발자나 스타트업이 AI를 쉽게 활용할 수 있게 돕는 흥미로운 움직임입니다.젬마는 간단히 사용할 수 있습니다. 사용방법은 아래와 같습니다.- 구글 딥마인드의 깃허브 저장소 또는 Hugging Face 모델 허브에서 젬마 3 270을 다운로드합니다.- Python 환경에서 pip install gemma 명령어로 설치합니다.- gemma run --model gemma-3-270m 명령어를 실행하여 모델을 사용할 수 있습니다.
104 조회
0 추천
2025.08.20 등록
2025년 5월 25일 중국 항저우에서 세계 최초의 휴머노이드 로봇 격투 대회가 열렸습니다. 중국중앙방송총국이 주최한 이 대회에는 유니트리 G1 로봇 4대가 참가했습니다.로봇들은 키 130cm, 무게 35kg으로 인간 조종사가 리모컨으로 조작했지만, 격투 동작은 전문 격투선수로부터 학습한 AI 기술로 구현되었습니다. 손 타격 1점, 발차기 3점, 쓰러지면 5점 감점이라는 규칙으로 진행되었고, 넘어진 후 8초 내에 일어나지 못하면 패배 처리되었습니다.경기에서는 로봇들이 잽, 어퍼컷, 킥 등 다양한 격투 기술을 선보였으며, "AI Strategist"라는 로봇이 우승했습니다. 전 세계에 생중계 된 이 대회는 로봇 기술의 실용화 가능성을 보여주는 중요한 이정표로 평가 받고 있으며, 중국의 로봇 산업 발전 의지를 드러낸 행사로 해석됩니다.
100 조회
0 추천
2025.08.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입