
우주 AI 솔루션 기업 텔레픽스가 위성 및 우주 분야에 특화된 AI 검색모델 ‘픽시’ 시리즈를 오픈소스로 공개한다. 픽시(PIXIE, TelePIX Intelligent Embedding)는 대규모 언어모델이 답변을 생성하기 전 기술 문서에서 정확한 정보를 찾아주는 AI 검색모델이다.
이 모델은 위성 및 우주 분야를 비롯한 전문 기술 영역에 특화되어 개발됐다. 기존 범용 검색 모델의 전문 용어 이해 한계와 데이터 설명 가능성 부족 문제를 해결하기 위해 항공우주, 위성, 국방 등 기술 문서에 맞춤화된 임베딩 모델로 설계됐다.
픽시 시리즈는 총 4가지 모델로 구성된다. 픽시 스플라드(PIXIE-Splade)는 한국어 전용 희소 벡터 모델로 대규모 문서에서 특정 단어가 포함된 문서를 빠르게 찾을 수 있다. 픽시 룬(PIXIE-Rune)은 한국어 및 영어로 학습된 인코더 기반 임베딩 모델로 시맨틱 검색에 최적화됐다.
픽시 스펠(PIXIE-Spell)은 디코더 기반 임베딩 모델로 다국어 검색을 지원한다. 이 모델은 6억 개(0.6B)와 17억 개(1.7B) 파라미터를 가진 2가지 버전으로 제공된다. 4가지 모델 모두 자사의 위성영상 분석 AI 에이전트 솔루션 ‘샛챗’에 적용되어 사용자 질문 의도를 파악하고 관련 정보를 검색하는 데 활용된다.
텔레픽스는 픽시가 한국어와 영어 검색 벤치마크에서 높은 NDCG(Normalized Discounted Cumulative Gain) 점수를 기록했다고 밝혔다. NDCG는 사용자 의도에 부합하는 검색 결과를 상위에 배치하는 능력을 평가하는 국제 표준 지표다.
이번 픽시 시리즈는 AI 모델 공유 플랫폼인 허깅 페이스에 오픈소스로 공개됐다. 텔레픽스는 국내 우주기업 중 자체 개발 AI 임베딩 모델을 오픈소스로 공개하는 것은 이번이 처음이라고 설명했다. 회사 측은 이를 통해 우주산업계 전반의 AI 기술 발전을 가속화하고 우주 AI 생태계 확장에 기여할 것으로 기대한다고 밝혔다.
박재완 텔레픽스 AI연구팀장은 “픽시 모델의 검색 성능은 샛챗이 생성하는 응답의 품질을 결정하는 핵심 요소”라며 “픽시 시리즈 오픈소스 공개로 연구자와 기업이 자유롭게 모델을 활용할 수 있게 되어 산업 전반의 기술 발전 속도가 빨라질 것으로 기대된다”고 말했다.
한편 텔레픽스의 샛챗은 위성 기반 우주 빅데이터를 학습한 AI 에이전트로, 사용자가 자연어로 질의를 입력하면 답변 생성과 지도 표시 등 다양한 기능을 제공한다. 이 솔루션은 최근 자사 큐브위성 ‘블루본’ 위성영상과 함께 폴란드 위성기업에 수출됐다.
Leave a Comment