Loading...

AI 뉴스

구글 '나노바나나' 정체 공개...새 AI 이미지 편집 모델 출시

페이지 정보

작성자 aIer
작성일 08.27 09:50
22 조회
1 추천
0 비추천

본문

구글이 AI 이미지 모델을 대폭 업그레이드한 'Gemini 2.5 Flash Image'를 출시하며 자연어 명령으로 이미지를 생성하고 기존 사진을 병합하며 이상한 왜곡 없이 정밀 편집할 수 있는 기능을 제공한다고 발표했다. 

이번 업그레이드는 업계 선두인 오픈AI(OpenAI)와의 격차를 줄이려는 시도로, ChatGPT가 7억 명의 주간 사용자를 보유한 반면 구글 Gemini는 4억 5천만 명의 월간 사용자에 머물러 있다. 구글은 여러 편집 과정에서 캐릭터나 객체의 일관성을 유지하는 AI의 가장 큰 난제 중 하나를 해결했다고 밝혔으며, 사용자가 간단한 명령으로 배경 흐리기, 티셔츠 얼룩 제거, 자세 변경, 흑백 사진에 색상 추가 등의 세밀한 작업을 할 수 있다고 설명했다. 

공식 출시 전 이 모델은 크라우드소싱 평가 플랫폼 LMArena에서 'nano-banana'라는 익명으로 등장해 샘 알트만(Sam Altman)의 셔츠 색깔을 바꾸는 등 놀라운 성능을 보여주며 화제가 됐다. 새 모델은 Gemini 앱뿐만 아니라 개발자들이 Gemini API, 구글 AI 스튜디오, Vertex AI를 통해 접근할 수 있으며, 부동산 목록 카드, 직원 유니폼 배지, 제품 목업 제작 등 실제 사용 사례에서 활용되고 있다.

1e628bd2308db83f8b22e29a99342bbcOKxe.jpg
댓글 0
전체 123 / 11 페이지
오픈AI가 출시하고 불만이 많아진 GPT-5를 잘쓰기 위한 프롬프트 가이드를 공개했다.https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide?ref=blog.secondbrush.co.kr이 가이드에서는 모델을 학습하고 실제 작업에 적용해 온 경험을 바탕으로 모델 출력의 품질을 극대화하기 위한 프롬프트 팁을 다루고 있다.. 에이전트 작업 성능 향상, 명령어 준수 보장, 새로운 API 기능 활용, 프런트엔드 및 소프트웨어 엔지니어링 작업을 위한 코딩 최적화 등의 개념을 살펴보고, GPT-5를 활용한 AI 코드 편집기 Cursor의 프롬프트 튜닝 작업에 대한 핵심 인사이트도 제공한다고..가이드에 따르면,"모범 사례를 적용하고 가능한 한 표준 도구를 도입함으로써 상당한 성과를 거두었으며, 이 가이드와 저희가 개발한 프롬프트 최적화 도구가 GPT-5 사용의 발판이 되기를 바랍니다. 하지만 항상 그렇듯이 프롬프트는 모든 경우에 적용되는 것은 아니라는 점을 명심하십시오. 여기에 제시된 기반을 바탕으로 실험을 수행하고 반복하여 문제에 대한 최상의 해결책을 찾을 것을 권장합니다."라고 되어 있다.Goal: Get enough context fast.목표: 빠르게 충분한 콘텍스트를 얻는다.Parallelize discovery and stop as soon as you can act.탐색을 병렬로 진행하고, 행동할 수 있게 되면 즉시 중단한다.Method:방법:Start broad, then fan out to focused subqueries.먼저 넓게 시작하고, 이후에는 구체적인 하위 쿼리로 확장한다.In parallel, launch varied queries; read top hits per query. Deduplicate paths and cache; don’t repeat queries.다양한 쿼리를 병렬로 실행하고, 각 쿼리의 상위 결과를 읽는다. 경로는 중복 제거하고 캐시에 저장한다. 동일한 쿼리를 반복하지 않는다.Avoid over searching for context. If needed, run targeted searches in one parallel batch.콘텍스트를 지나치게 탐색하지 않는다. 필요할 경우, 한 번의 병렬 배치로 목표 검색을 수행한다.Early stop criteria:조기 중단 기준:You can name exact content to change.변경할 정확한 내용을 지정할 수 있다.Top hits converge (~70%) on one area/path.상위 결과의 약 70%가 한 영역 또는 경로로 모인다.Escalate once:한 번에 에스컬레이션한다:If signals conflict or scope is fuzzy, run one refined parallel batch, then proceed.신호가 상충하거나 범위가 불분명하면, 정제된 병렬 배치를 한 번 실행한 후 진행한다.Depth:깊이:Trace only symbols you’ll modify or whose contracts you rely on; avoid transitive expansion unless necessary.변경하거나 의존하는 심볼만 추적하고, 필요하지 않다면 전이적인 확장은 피한다.Loop:반복:Batch search → minimal plan → complete task.배치 검색 → 최소 계획 → 작업 완료.Search again only if validation fails or new unknowns appear. Prefer acting over more searching.검증에 실패하거나 새로운 미지의 요소가 나타난 경우에만 다시 검색한다. 추가 검색보다는 행동을 우선한다.
152 조회
0 추천
08.12 등록
Yomiuri Sues U.S. AI Startup over Use of Articles; Perplexity Allegedly Used Over 100,000 News Stories요미우리 신문 3개 자회사가 미국 AI 스타트업인 Perplexity를 상대로 기사와 이미지를 무단으로 이용했다며 소송을 제기했다미우리 측은 퍼플렉시티가 약 12만 건의 디지털 기사와 이미지를 무단으로 복제해 검색엔진 답변에 사용했다고 주장했다.신문사 측은 약 21억7000만 엔의 손해배상을 요구했으며, 기사와 이미지 무단 복제가 저작권법상 복제권 및 공중송신권을 침해했다고 주장했다. 신문사에 따르면, 퍼플렉시티는 기존 검색엔진과 달리 직접 답변을 제공해 언론사 사이트 유입 감소로 광고 수입이 줄었다고 했다.요미우리 측은 언론의 노력과 투자가 AI 기업에 무단으로 이용되고, 공정한 보도를 해치는 결과가 된다고 했다. 이에 대해 퍼플렉시티는 일본 내 오해에 유감을 표하며 사실관계 확인에 노력 중이고, 언론사와의 협력 의향을 밝혔다.요미우리는 이번 소송이 일본 언론사로서는 최초 사례라고 했다. 미국에서도 유사한 소송이 진행 중이라고 밝혔다.
139 조회
0 추천
08.12 등록
애플이 새로운 시리(Siri) 업그레이드를 준비하고 있으며, 이는 서드파티 앱(Uber, YouTube, Facebook, WhatsApp 등)과 자체 앱(메일, 메시지 등)에서 깊이 있는 통합과 제어가 가능할 것으로 알려졌다..사용자는 음성만으로 사진 검색 및 편집, 인스타그램 댓글 작성, 쇼핑 앱 탐색 및 장바구니 추가 등 앱 내 세부 기능을 조작할 수 있게 된다. 이번 개선의 핵심은 'App Intents' 시스템과 애플의 생성형 AI 'Apple Intelligence'에 있다사실 새로운 시리의 출시는 여러 차례 연기되어 왓다. . 잦은 지연의 원인은 구형 시리 시스템과 신형 LLM(대규모 언어 모델) 아키텍처가 결합된 하이브리드 구조의 버그, 약 1/3 확률의 실패율 등 기술적 문제가 컸던 것으로 알려졌다.
160 조회
1 추천
08.11 등록
GPT-5 가 나왔어요.영상으로 모든 걸 보여줍니다.자막이 있으니 편하게 보세요.
134 조회
1 추천
08.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입