제미니 로보틱스 AI 로봇 작업 시연

출처 : SONOW

구글 딥마인드는 화요일에 자사의 가장 진보된 AI 로봇 모델을 공개했으며, 이러한 시스템은 복잡한 작업을 실행하기 전에 생각을 할 수 있고 문제 해결을 위해 실시간 정보 검색까지 할 수 있다. 새로운 두 모델인 제미니 로보틱스 1.5와 제미니 로보틱스-ER 1.5는, 구글 딥마인드 로보틱스 책임자인 Carolina Parada에 따르면, 광범위한 재프로그래밍 없이 새로운 환경에 적응할 수 있는 다재다능한 로봇을 만드는 데 있어 상당한 진전을 보여준다.

샌프란시스코 재활용 규정 검색해 쓰레기 분류 성공

이번 혁신은 제미니 로보틱스-ER 1.5에 초점을 맞추고 있으며, 딥마인드는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명한다. ER은 구체적 추론을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있다.

시연 동안 연구원들은 로봇에게 현지 규정에 따라 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했다.

재프로그래밍 없이 완전히 새로운 상황 처리 가능

현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.

Carolina Parada, 구글 딥마인드 로보틱스 책임자

시스템은 두 가지 모델 접근 방식을 통해 작동한다. 제미니 로보틱스-ER 1.5가 추론과 계획을 담당하고, 제미니 로보틱스 1.5가 물리적 행동을 실행한다. 놀랍게도, 한 로봇에서 학습한 작업이 완전히 다른 플랫폼, 심지어 휴머노이드 로봇에도 이전될 수 있다.

ALOHA2 훈련 작업, Franka·Apollo 휴머노이드에 적용

구글 딥마인드는 두 팔을 가진 ALOHA2 로봇에서 훈련된 작업이 Franka 로봇 팔과 Apptronik의 휴머노이드 로봇 Apollo에도 매끄럽게 적용되는 모습을 시연하여 이 능력을 보여주었다. 이러한 크로스 플랫폼 호환성은 산업 전반에 걸쳐 로봇 공학 개발을 가속화할 수 있다.

제미니 로보틱스-ER 1.5 모델은 이제 제미니 API를 통해 개발자들이 사용할 수 있으며, 액션 모델에 대한 접근은 선정된 파트너에게만 제한적으로 제공된다. 이번 발표는 이달 초 공개된 AI 시스템 RoboBallet 등 딥마인드의 더 넓은 로봇 공학 이니셔티브에 기반을 두고 있다. RoboBallet은 최대 8대의 제조 로봇을 기존 방식보다 25% 더 높은 효율로 조율한다.