
미국 인공지능(AI) 연구개발 기업 앤트로픽(Anthropic)은 25일 차세대 AI 모델 ‘클로드 오퍼스 4.5(Claude Opus 4.5)’를 공개했다. 이번 모델은 코딩, 에이전트, 컴퓨터 활용 분야의 성능을 강화했으며 심층 연구 및 실무 문서 처리에 최적화되었다.
앤트로픽에 따르면 오퍼스 4.5는 소프트웨어 엔지니어링 테스트에서 높은 성능을 기록했으며, 앤트로픽 앱과 API, 주요 클라우드 플랫폼에서 즉시 사용 가능하다. 이용 가격은 백만 토큰 기준 5달러(입력) 및 25달러(출력)로 책정됐다.
앤트로픽은 모델 출시와 함께 개발자 플랫폼, 클로드 코드(Claude Code), 소비자용 앱에 대한 대규모 업데이트를 단행했다. 장시간 구동되는 에이전트를 지원하는 도구가 추가됐으며, 엑셀과 크롬 등 데스크톱 환경에서의 활용성이 확장됐다. 또한 앱 내 문맥 관리 기능이 강화되어 긴 대화의 연속성을 보장한다.
사전 테스트에 참여한 기업 관계자들은 긍정적인 평가를 내놓았다. 이동재 뤼튼테크놀로지스 최고제품책임자(CPO)는 장문의 스토리텔링 능력과 일관성을, 사라 삭스 노션(Notion) AI 리드 엔지니어는 사용자 의도 파악 능력과 효율성을 높게 평가했다. 라쿠텐의 유스케 카지 비즈니스 AI 총괄 매니저는 자가 개선 에이전트 분야에서의 학습 속도를 차별점으로 꼽았다.
자체 엔지니어 채용 시험을 적용한 내부 평가에서도 오퍼스 4.5는 제한 시간 2시간 조건 하에 기술력과 판단력 부문에서 인간 지원자보다 높은 점수를 기록했다. 다만 앤트로픽 측은 해당 평가가 협업이나 커뮤니케이션 역량은 제외된 기술 중심의 평가임을 명시했다.
비전, 추론, 수학 등 주요 지표에서도 전작 대비 성능이 향상됐다. 특히 항공사 상담원 시나리오를 가정한 ‘타우2 벤치(τ2-bench)’ 테스트에서 오퍼스 4.5는 규정 내에서 우회적인 해결책을 제시하는 등 고도화된 문제 해결 능력을 보였다. 앤트로픽은 이러한 문제 해결 방식이 ‘보상 해킹(reward hacking)’으로 이어지지 않도록 안전성 검증을 강화했다고 밝혔다.
개발자 편의성을 위한 기능도 추가됐다. API에 도입된 ‘에포트(effort)’ 파라미터를 통해 개발자는 작업의 성격에 따라 속도와 비용, 성능의 균형을 조절할 수 있다. 중간 수준의 에포트 설정 시 소네트 4.5와 동등한 성능을 내면서도 토큰 사용량은 76% 감소하는 효율을 보였다.
제품군 업데이트도 함께 이루어졌다. AI 코딩 어시스턴트인 ‘클로드 코드’에는 실행 전 계획을 검토하는 ‘플랜 모드’와 데스크톱 앱 지원이 추가됐다. 이를 통해 로컬 및 원격 세션의 병렬 실행이 가능해졌다. ‘클로드 포 크롬’과 ‘클로드 포 엑셀’의 접근 권한도 확대되어 맥스(Max), 팀(Team), 엔터프라이즈(Enterprise) 이용자들의 업무 활용도가 높아질 전망이다.
앤트로픽은 맥스 및 팀 프리미엄 이용자를 대상으로 오퍼스 4.5의 사용 한도를 상향 조정하여 실무 활용을 지원할 계획이다.






댓글 남기기