Loading...

AI 뉴스

Google 사진 앱에 텍스트와 음성으로 바로 수정하는 사진 편집 기능 적용

페이지 정보

작성자 JeromePark
작성일 2025.08.22 09:20
630 조회
0 추천
0 비추천

본문

구글이 사진 앱에 수정사항을 텍스트로 바로 수정요청하는 기능을 적용.

이 기능은 곧 런칭할 픽셀10에서부터 적용이 될 예정.

또한 사진이 어떻게 편집되었는지 C2PA 인증 기술로 추적이 가능하다고.

79b6dc674e75f5361dabad7c184cc2d9vr6J.png

아래는 구글 블로그의 소개 내용.

Google Photos에서는 이제 사진을 편집할 때 원하는 내용을 텍스트나 음성으로 직접 요청할 수 있습니다. 사용자는 어떤 편집 효과를 적용할지 직접 고르지 않아도 되고, 그저 "차를 배경에서 제거해줘"처럼 자연스럽게 말을 하면 AI가 알아서 반영해 줍니다. 이 기능은 미국의 Pixel 10 기기에서 우선 제공됩니다.

새롭게 디자인된 사진 편집기는 직관적 UI와 AI 기반 제안으로 일반 사용자도 쉽게 다양한 효과를 활용할 수 있습니다. 이번에 도입된 대화형 편집 기능으로, 구체적인 요청뿐 아니라 "사진 복원해줘", "색감 보정해줘" 등 복합적인 요구도 한 번에 처리할 수 있습니다. 여러 번 연속해서 추가 요청을 하며 세부 조정도 가능합니다.

밝기 조절, 배경 제거 같은 기본 편집뿐 아니라 배경 교체, 파티 모자 추가 등 창의적인 효과 요청도 대화로 손쉽게 처리할 수 있습니다. 사용자가 별도의 편집툴을 배우지 않아도 다양한 AI 편집을 자유롭게 즐길 수 있게 되었습니다.

Pixel 10 기기에서는 C2PA(디지털 콘텐츠 인증) 기술이 적용되어, AI가 사진 수정에 개입한 흔적·정보를 확인할 수 있습니다. Google Photos에도 점진적으로 이 기능이 적용되며, 사진이 어떻게 만들어지고 어디에 AI 편집이 사용됐는지 투명하게 확인할 수 있습니다.

 

댓글 0
전체 382 / 78 페이지
DeepMind는 인터랙티브 환경을 시뮬레이션할 수 있는 차세대 세계 모델인 Genie 3를 공개했다.Genie 3는 실제 이미지와 텍스트 프롬프트 기반으로 상호작용 가능한 가상 환경을 1초 만에 생성하는 등 전통적인 강화학습 접근 방식에서 진일보한 능력을 보여주게 된다고.주요 특징 중 하나는 단일 비지도 학습 데이터만으로도 텍스트, 이미지, 비디오 등 다양한 입력을 활용하여 풍부한 가상 세계를 생성하고, 사용자로부터 받은 조작에 즉각적으로 반응하도록 설계되어 있다는 점이 있으며, 기존 세계 모델들과 달리, 실제 세상의 복잡한 물리 및 논리적 규칙을 자체적으로 학습한다. 예를 들어, 물체를 움직이거나 주변 환경을 변화시키는 등 플레이어의 행동에 따라 세계를 동적으로 변형시킬 수 있다고 밝혔다.이 기술은 게임, 로보틱스 등 시뮬레이션 기반 AI 연구의 새로운 가능성을 제시한다. Genie 3를 통해 다양한 상황에서 AI 에이전트의 행동을 미리 실험하고 효율적으로 학습시킬 것으로 기대된다.
875 조회
0 추천
2025.08.06 등록
2025년 7월 말부터 "국세청이 8월 1일부터 AI로 전 국민 계좌를 실시간 감시하고 가족 간 50만원 송금도 증여세를 부과한다"는 가짜뉴스가 SNS와 유튜브를 통해 폭발적으로 확산됐습니다."8월부터 가족 간 계좌 이체 못 합니다" 같은 제목의 유튜브 영상들이 조회수 200만을 넘기며 전국민을 공포에 떨게 만들었습니다. 많은 사람들이 가족에게 생활비 송금하는 것조차 두려워하게 된 상황이었죠.하지만 국세청이 직접 나서서 "이건 가짜뉴스"라고 공식 해명했습니다. 국세청 관계자는 "개인의 소액 거래를 들여다보기 위해 새롭게 가동하는 시스템은 없다"고 명확히 밝혔습니다.이 소문은 임광현 신임 국세청장이 "AI 탈세 적발 시스템을 고도화하겠다"고 언급한 것을 잘못 이해해서 퍼진 것으로 분석됩니다. 청장의 발언은 기존 세무조사에 AI를 활용하겠다는 중장기 계획이었는데, 이것이 완전히 왜곡된 것이죠.세무 전문가들도 "친구가 50만원 송금했다고 국세청이 들여다본다는 것은 난센스"라며 "상식선에서의 거래는 우려할 필요 없다"고 설명했습니다.결국 AI 기술에 대한 막연한 불안감과 SNS의 빠른 전파력이 결합해 전 국민을 혼란에 빠뜨린 대표적인 가짜뉴스 사건이 되었습니다.
871 조회
1 추천
2025.08.06 등록
알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다.이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다. 이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.다양한 이미지 사례는 링크에서 확인할 수 있다.오픈소스여서 설치형으로도 테스트 가능.
840 조회
0 추천
2025.08.05 등록
미국 패션잡지 Vogue 가 AI 를 이용한 광고 사진 사용으로 논란이 일고 있다.최근 보그(Vogue) 잡지 8월호에 게재된 광고가 큰 논란을 불러일으키고 있다. Guess 브랜드의 광고에 AI로 생성된 모델이 등장하면서, 독자들은 이에 반발하며 구독을 취소하고 보이콧을 촉구하고 있는 것. 이 광고는 단순히 패션업계의 혁신으로 받아들여지기보다는, 기술이 인간의 창의성과 직업에 미치는 영향에 대한 광범위한 논쟁의 불씨를 당기고 있다고 테크크런치는 전했다. 이 사건은 소셜 미디어, 특히 틱톡에서 큰 논란이 되며 많은 비판이 일고 있다.보그 미국판 2025년 8월호에 실린 게스(Guess) 광고의 AI 모델은 금발의 백인 여성이다.광고 이미지 속에서 이 모델은 줄무늬 원피스와 플로럴 수트를 착용하고 포즈를 취하고 있었으며, 언뜻 보기에는 실제 사람처럼 보인다. 하지만 이미지 한쪽 구석에 'AI 생성 이미지'라는 작은 문구가 적혀 있어 이 모델이 인공지능으로 만들어진 것임을 알 수 있다.광고 제작사는 실제 모델을 고용하여 촬영한 데이터를 기반으로 AI 이미지를 완성했다고 밝혔고, 모델의 모습은 현실적인 동시에 AI가 만들어낸 '완벽한' 모습이기도 하였다.틱톡 링크 참고https://www.tiktok.com/@lala4an/video/7529605769386364191
881 조회
0 추천
2025.08.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입