
원라인에이아이가 추론 특화 한국어 AI 모델 ‘OLAF v2’를 공개했다. 이 모델은 OpenAI o1의 핵심 기술인 생각 프로세스(thought process)와 테스트 시간 스케일링(test-time scaling)을 기반으로 개발됐다.
기존 AI 모델들이 단순히 답변만 생성하는 것과 달리, 이 방법을 적용하면 다양한 접근 방식과 사고 과정을 통해 더 정확한 답을 찾아내는 것으로 알려져 있다. 이미 Alibaba의 QwQ와 DeepSeek의 r1이 이 방식으로 성능을 입증한 바 있다.
생각 프로세스는 AI 언어모델의 새로운 추론 방식이다. 이는 기존의 생각의 사슬(Chain-of-Thought)과 유사한 방식으로 작동한다. 모델이 주어진 문제를 스스로 이해하고 해결 방안을 제시하는 사고 과정을 생성한다. 이를 통해 복잡한 추론이 필요한 문제도 체계적으로 해결할 수 있게 됐다. 이 과정에서 오답을 발견하여 스스로 고치는 등 자신의 실수를 스스로 극복하기도 하면서 보다 신뢰도 높은 답변을 내놓게 된다.
테스트 시간 스케일링은 모델이 더 많은 계산 자원을 사용하여 복잡한 문제에 대해 스스로 생각하며 더 깊이 있는 추론을 수행하도록 하는 방법이다. 이는 모델이 다양한 전략과 시나리오를 시뮬레이션하여 최적의 솔루션에 도달하도록 도우며, 대표적으로 몬테카를로 트리 탐색 (Monte Carlo Tree Search, MCTS) 등의 방법이 활용된다.
OLAF v2는 14B와 1.5B 두 가지 버전으로 출시됐다. 두 버전 모두 STEM(Science, Technology, Engineering, Mathematics) 문제를 해결하기 위한 추론 특화 모드를 갖추고 있다. 32K의 context length를 지원하여 RAG (Retrieval-Augmented Generation) 및 도구 기반 애플리케이션에 적합하도록 제작되었다. 모델 학습 과정에서는 반복적인 데이터 생성과 부적절한 질문에 대한 거부 메커니즘에 중점을 두어 환각을 줄이고 신뢰도를 높였다.
정한얼 원라인에이아이 대표는 “OLAF v2가 보여준 뛰어난 추론 능력은 복잡한 금융 데이터 분석과 리스크 평가에 특히 강점을 보일 것”이라며 “현재 국내 주요 금융사들과 진행 중인 프로젝트를 통해 금융권 특화 서비스로 발전시켜 나갈 계획”이라고 밝혔다.
Leave a Comment