인간을 돕는 로봇이 더 복잡한 일을 수행할 수 있도록 훈련하는 새로운 인공지능(AI) 모델이 나왔다.
구글은 28일 더 똑똑한 로봇을 위한 새 AI 모델인 로보틱스 트랜스포머 2(RT-2)를 공개했다.
이 모델은 지난해 공개한 RT-1의 업그레이드 버전이다. RT-1은 로봇이 물건을 집고, 놓고, 서랍을 여는 등의 작업을 수행할 수 있도록 훈련하는 모델이다.
RT-2는 로봇이 인터넷상의 이미지와 정보를 습득해 행동으로 옮길 수 있도록 훈련하는 시각-언어-행동(vision-language-action) 모델이라고 구글은 설명했다.
구글은 “RT-2는 향상된 일반화 능력과 의미론적, 시각적 이해를 갖고 있다”며 “기존의 정보를 기반으로 새로운 작업에 필요한 가장 적합한 도구 등을 결정하는 능력을 보여준다”고 말했다.
RT-2는 예를 들어 쓰레기 버리기와 같은 작업을 이해하도록 로봇을 훈련한다.
쓰레기를 줍는 일은 인간에게는 단순하지만, 로봇은 우선 어떤 것이 쓰레기인지를 인식한 뒤 그것을 줍고 버리는 방법을 알 수 있도록 프로그래밍이 돼야 한다.
RT-2는 로봇이 이런 단계별로 훈련받지 않았더라도 인터넷 웹상에 나오는 시각적 정보 등을 이용해 그 일을 수행할 수 있도록 도움을 준다.
구글 AI 팀인 딥마인드의 로봇 사업 책임자 빈센트 반호크는 “RT-2는 대량의 웹 데이터에서 지식을 전달할 수 있기 때문에 이미 쓰레기가 무엇인지에 대한 생각을 갖고 있으며 훈련 없이도 이를 식별할 수 있다”고 말했다.
또 “그런 행동을 하도록 훈련받지 않아도 쓰레기를 버리는 방법에 대한 생각을 갖고 있다”며 “RT-2는 시각-언어 훈련 데이터에서 과자 봉지나 바나나껍질을 이해하고 작업을 수행할 수 있다”고 설명했다.
RT-2는 RT-1에 비해 새로운 작업 수행에 있어 두 배의 성능을 보였다고 구글은 강조했다.
뉴욕타임스(NYT)는 구글이 이 새로운 기술을 가진 로봇을 출시하거나 판매할 계획을 아직 갖고 있지 않으며, 이 모델로 훈련한 로봇은 창고나 가정에서 비서로 사용될 수 있을 것이라고 전망했다.