무엇이 달라졌나: 브라우저 화면을 이해하고 행동

Computer Use는 GUI를 직접 다룬다. 모델이 DOM이나 고정 API에 의존하지 않고, 렌더링된 화면을 인식해 버튼 클릭, 텍스트 입력, 스크롤, 양식 작성, 드래그 앤 드롭을 수행한다. 레이아웃이 수시로 바뀌는 동적 사이트에서도 과업 수행을 목표로 한다.

성능과 가격: 벤치마크·요금 체계

Online-Mind2Web에서 76.7%로 보고되며, WebVoyager에서도 상위 성능을 보였다. 제공은 Google AI Studio와 Vertex AI를 통해 이뤄지며, Gemini 2.5 Pro 유사 토큰 요금제를 따른다. 무료 플랜과 달리 Computer Use는 초기에 유료 모델로 제시됐다.

보안과 안전: 다중 보호막

민감 행위는 사용자 확인을 요구한다. 액션별 정책 점검과 개발자 제어를 통해 무단 결제, 개인정보 노출 등의 리스크를 줄인다. 기업 환경 적용을 염두에 두고 기록·감사 가능성을 높였다.

적용과 파급: 검색·결제·Workspace로 확산

Project Mariner, 검색 내 AI 모드 등 구글 서비스에 적용이 진행 중이다. 내부 파일럿에서 실패 케이스의 다수를 단축 처리했다는 보고가 있다. 브라우저 에이전트 시장 성장세와 함께 채택 경쟁이 본격화될 전망이다.

더 많은 정보는TECH & AI 허브