
국내 인공지능 기업 투디지트가 한국어 LLM 평가 모델 ‘K-Judge’를 공개했다.
K-Judge는 LLM이 생성한 한국어 답변을 문맥과 문법 측면에서 분석해 모델의 완성도와 자연어 처리 능력을 정밀하게 평가할 수 있도록 만든 자체 시스템이다. 특히 인터넷 연결 없이도 작동 가능한 오프라인 환경을 지원하며, 외부 서비스 의존 없이 내부 검증이 필요한 보안 중심 산업군에서도 활용 가능성이 높다는 평가를 받고 있다. 실제로 현재 투디지트가 진행 중인 한국수력원자력의 AI 지원 시스템 개발 프로젝트에서도 K-Judge의 활용이 검토 중임을 전했다.
투디지트는 이번 K-Judge 개발 과정에서 광주 인공지능산업융합사업단(AICA)의 지원을 받았다. AICA의 GPU 자원을 통해 한국어 데이터셋 강화와 LLM 기술 고도화에 시너지를 낼 수 있었다. 앞으로도 국내 AI 산업 생태계 조성을 목표로 양 기관이 긴밀한 전략적 협력을 지속할 계획이라고 전했다.
AI 업계 관계자들은 이제는 ‘모델을 만드는 기술’만큼이나 ‘모델을 제대로 검증하는 기술’이 중요해지는 시대라고 말한다. 특히 공공, 금융, 의료 등 민감 정보가 오가는 산업 분야에서는 외부 AI 활용이 불가능한 경우가 많아, 자체 개발한 모델의 성능을 독립적으로 측정할 수 있는 국산 평가 체계의 필요성은 더욱 커질 전망이다.
박석준 투디지트 대표는 “K-Judge는 한국어 데이터 특성에 최적화된 LLM 평가 모델로, 다양한 개발 환경에서 실질적인 도움을 줄 수 있는 기술”이라며, “앞으로도 국산 AI 기술의 경쟁력 강화와 자립적 생태계 조성을 위해 지속적으로 노력하겠다”고 밝혔다.
Leave a Comment