
DOM 제어 방식 1위·커머스 분야 1위 달성…오픈AI·앤트로픽과 경쟁
커머스 AI 에이전트 스타트업 인핸스가 글로벌 웹 AI 에이전트 벤치마크 ‘Online-Mind2Web 리더보드’에서 자사의 ‘ACT-1’ 모델이 전체 3위를 기록했다고 22일 밝혔다.
Online-Mind2Web은 웹 AI 에이전트 분야 벤치마크로, 136개 실제 웹사이트에서 300개 작업을 기준으로 AI 에이전트의 실제 성능을 객관적으로 평가한다. 실제 운영 중인 웹사이트에서 AI가 얼마나 복잡한 작업을 수행할 수 있는지 측정하며, 사람 및 AI 자동 평가를 모두 활용하는 검증 시스템을 갖추고 있다.
인핸스의 ACT-1(Action Transformer) 모델은 Online-Mind2Web 리더보드에서 오픈AI의 Operator, 앤트로픽의 Claude Computer Use 3.7과 함께 상위권을 차지했다. 특히 DOM(Document Object Model) 제어 방식 기준 1위, 커머스 분야 1위를 동시 달성했다.
DOM 제어 방식은 기존의 스크린샷 및 좌표 기반의 제어 방식과 달리 웹페이지 구조에 직접 접근해 웹사이트를 제어하는 기술이다.
인핸스의 ‘ACT-1’은 웹 자동화에 특화된 행동형 AI 모델로 버튼 클릭, 메뉴 선택 등 복잡한 UI 제어가 가능하다. DOM 제어 방식으로 브라우저 환경에서만 동작하는 방식을 통해 개인정보 유출 위험을 최소화하고 보안성을 확보했다고 회사는 설명했다.
API를 통한 접근이 불가능한 도메인에서도 데이터 수집이 가능하고, 동적 페이지 변화에 실시간 대응할 수 있어 크롤링, 자동화, 웹 테스트 등에 활용된다.
커머스 분야에서 필요한 실시간 가격 변동, 쿠폰 할인 정보, 재고 상태 등 복잡하고 동적인 커머스 환경 요소들을 정확하게 처리하는 능력을 인정받았다. 인핸스는 현재 ACT-1을 기반으로 한 커머스 특화 AI 에이전트 솔루션 ‘커머스OS’를 운영하고 있다.
인핸스는 이번 성과를 바탕으로 웹 AI 에이전트 기술을 지속 개발해 버티컬 커머스 분야에서 기술력 확보에 나선다는 계획이다. ACT-1과 모방 학습(Imitation Learning) 기술을 결합해 복잡한 작업까지 실행할 수 있는 차세대 AI 에이전트로 발전시킬 예정이다.
이승현 인핸스 대표는 “오픈AI, 앤트로픽과 같은 글로벌 AI 기업들과 어깨를 나란히 할 수 있게 된 것은 큰 의미”라며 “웹 AI 에이전트 기술 개발을 지속 강화해 버티컬 산업 분야에서 글로벌 시장을 선도해 나가겠다”고 말했다.
Leave a Comment