
AI 세이프티 스타트업 에임인텔리전스(AIM Intelligence)가 LG전자 및 미국 로봇 OS 기업 오픈마인드(OpenMind)와 협력하여 개발한 ‘Video2Robot(비디오투로봇)’ 파이프라인을 26일 공개했다.
이번 프로젝트는 3사가 추진 중인 ‘피지컬 AI 세이프티(Physical AI Safety)’ 연구의 일환이다. 로봇이 실제 환경에서 겪을 수 있는 위험 상황을 시뮬레이션 단계에서 검증하여 안전성을 높이는 것을 목표로 한다.
영상 속 동작을 로봇 데이터로 변환… ‘실패’ 데이터 확보
공개된 ‘Video2Robot’은 오픈소스 파이프라인으로, 영상 속에 등장하는 인간의 동작을 분석하여 로봇이 학습할 수 있는 데이터로 변환하는 엔진이다.
주요 특징은 생성형 AI(Veo, Sora 등)를 활용해 현실에서 직접 연출하기 어려운 고위험 시나리오를 데이터화한다는 점이다. 인간과의 근접 상호작용, 급경사에서의 미끄러짐, 고하중 물체 조작 시 균형 붕괴 등 로봇이 작동 중 겪을 수 있는 다양한 사고 상황을 가상으로 생성하고 이를 학습 데이터로 변환한다.
기존 로봇 학습 과정에서는 고가 장비의 파손 우려와 안전 문제로 인해 낙상이나 충돌 데이터를 수집하는 데 물리적 한계가 있었다. Video2Robot은 이를 시뮬레이션 환경으로 대체하여 로봇이 실제 환경의 위험 상황을 사전에 학습(Preemptive Learning)할 수 있도록 설계됐다.
멀티모달 노하우, 피지컬 AI로 확장
에임인텔리전스는 그동안 텍스트, 오디오, 비디오 등을 다루는 멀티모달(Multimodal) AI 안전 연구를 수행해 왔다. 이번 성과는 기존의 소프트웨어 중심 연구 역량을 물리적 세계(Physical World)의 로봇 안전 문제로 확장했다는 점에서 의미가 있다.
해당 기술은 공개 직후 깃허브(GitHub) 스타 400개를 기록하고 소셜 미디어 조회수 20만 회를 넘어서는 등 관련 연구자들의 관심을 받고 있다.
권태윤 에임인텔리전스 연구원은 “Video2Robot은 로봇이 실제 환경에서 마주할 돌발 상황을 선제적으로 대비하기 위한 도구”라며 “향후 피지컬 AI 세이프티 프레임워크를 구축해 나갈 계획”이라고 밝혔다.






댓글 남기기