OpenAI가 ChatGPT Agent를 발표했습니다.
기존 Deep Research와 Operator를 통합한 에이전트입니다. 알아서 모두 다 해줍니다. 예시인데 놀랍습니다. "식당을 찾고 예약하는 작업을 시키면, 텍스트 브라우저로 후보를 찾은 다음, 비주얼 브라우저로 사진을 보고, 예약 가능 여부를 확인하고, 마지막으로 예약을 완료하는 식으로 진행할 수 있어요 [2]. 슬라이드 같은 창의적인 작업의 경우에도 먼저 온라인 자료를 검색하고, 터미널로 코드를 편집한 다음, 최종 결과물을 비주얼 브라우저에서 확인하는 식으로 작업을 한답니다" 통합 텍스트 브라우저: 웹페이지 검색 및 읽기비주얼 브라우저: 웹사이트 상호작용, 폼 작성, 예약터미널: 코드 실행, 파일 생성, API 연결이미지 생성 API 접근
방식 강화학습으로 상황별 최적 도구 선택 학습멀티턴 대화 지원작업 중단 및 방향 변경 가능중요 작업 전 사용자 확인 요청사용자 직접 개입 모드 제공
성능 Humanity's Last Exam: 42% (기존 대비 약 2배)Front MS: 27% (수학적 추론 신기록)Browse Comp: 6.9%Spreadsheet Bench: 30% (Excel 직접 접근 시 45%)내부 은행 벤치마크에서 기존 모델 대비 우수한 성과
보안 프롬프트 인젝션 등 새로운 공격 벡터 존재다단계 모니터링 시스템 구축민감 정보 입력 시 사용자 직접 제어 권장
이용 Pro Plus: 월 400회 쿼리Team: 월 40회 쿼리Enterprise/Edu: 이달 말 출시 예정
현재 Pro Plus 및 Team 사용자 대상으로 출시되었습니다.