Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 08.05 09:05
91 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 111 / 2 페이지
MIT 연구진이 기업의 생성형 AI 시범사업 중 95%가 수익 창출에 실패했다는 충격적인 연구 결과를 발표했다.18일(현지시간) 포춘지에 따르면, MIT 미디어랩 NANDA 이니셔티브가 발표한 '생성형 AI 격차: 2025년 비즈니스 AI 현황' 보고서는 대부분의 기업 AI 프로젝트가 기대에 못 미치는 성과를 거두고 있다고 밝혔다.연구진은 95%의 기업에서 생성형 AI 구현이 부진한 핵심 원인이 AI 모델의 품질이 아니라 도구와 조직 모두의 '학습 격차'에 있다고 분석했다. 경영진들이 종종 규제나 모델 성능을 탓하지만, MIT 연구는 잘못된 기업 통합 방식을 지적했다.생성형 AI 예산의 절반 이상이 영업 및 마케팅 도구에 투입되고 있지만, MIT는 백오피스 자동화에서 가장 큰 투자수익률을 발견했다. 성공적인 AI 배포의 비결은 도입 방식에 있다. 전문 업체로부터 AI 도구를 구매하고 파트너십을 구축하는 방식은 약 67%의 성공률을 보인 반면, 내부 개발은 3분의 1 정도의 성공률만을 기록했다.
9 조회
0 추천
08.21 등록
구글 포토에 드디어 음성으로 사진집이 가능해졌습니다. AI 편집기능이 추가된 것입니다."이 사진을 더 좋게 만들어줘"라고 말하면 자동으로 편집해준다고 합니다. 편집 스킬이 부족한 사람들한테 정말 유용한 기능일 것 같습니다.특히 C2PA 표준 도입으로 AI로 편집했는지 원본인지 구분할 수 있게 된 점이 인상적입니다. 딥페이크나 가짜 이미지를 걸러낼 수 있는 기능입니다.구글 픽셀 10(Pixel 10)부터 시작해서 iOS와 안드로이드 구글포토로 점진적을 확대될 예정이라고 합니다.
11 조회
0 추천
08.21 등록
- 최근 월 약 28만 원(200달러) 구독료로 800만 원 상당의 토큰을 사용하는 '추론 고래'(Inference whales) 개발자들이 다수 등장.- 일부 헤비유저 때문에 앤트로픽, 바이브 코딩 등 AI 스타트업의 수익성 악화 논란.- 대표적으로 한 사용자는 한 달간 51억 토큰(806만 원치 API 비용)에 달하는 클로드 코드 사용. 상위 169명은 한 달간 2777억 토큰 소비.- 서비스 업체들은 남용 방지 위해 무제한 요금제에 주간 사용량 제한 등 도입, 별도 초과 요금 부과 시작(8/28부터).- 비용 하락에도 최고 모델 수요는 여전히 높으며, AI 활용 워크플로우 확대에 따라 실제 토큰 사용량은 증가.- 전문가들은 "AI 추론 비용 감소가 현실적으로 어렵고, 무제한 요금제는 지속 불가능"이라는 의견 제시
20 조회
0 추천
08.20 등록
이 사업은 공무원이 보안 걱정 없이 다양한 생성형 AI 서비스를 활용하도록 관련 플랫폼과 거대언어모델(LLM), 컴퓨팅 자원(GPU 등) 등을 제공하는 게 목적이다. 행안부는 오는 11월 일부 서비스를 시범 제공할 계획이다. 삼성SDS 컨소시엄에 포함된 AI 플랫폼 2종(삼성SDS 패브릭스, 네이버 하이퍼스튜디오)과 LLM 모델 6개를 선정해 우선 서비스한다. 공무원은 이들 가운데 원하는 플랫폼과 LLM을 활용, AI를 업무에 적용해볼 수 있다.-> 우리가 아는 흔한 LLM모델을 쓸 수 있다는 말인가?
12 조회
0 추천
08.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입