카카오, AI 안전성 검증하는 가드레일 모델 오픈소스로 공개

카카오가 AI 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 ‘Kanana Safeguard(카나나 세이프가드)’를 오픈소스로 공개한다.

‘Kanana Safeguard’는 카카오가 자체 개발한 언어모델 ‘Kanana’를 기반 기술로 활용했으며, 한국어 및 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화된 성능을 보유하고 있다. AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어(F1-Score)를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록하기도 했다.

이번에 오픈소스로 공개한 모델은 총 3가지로, 각각의 모델은 리스크 유형에 따라 유해성 및 위험성에 대한 효과적 탐지가 가능하다. 사용자의 발화 또는 AI의 답변에서 증오, 괴롭힘, 성적 콘텐츠 등에 대한 유해성을 탐지하는 ‘Kanana Safeguard’과 개인 정보나 지식재산권 등 법적 측면에서 주의가 필요한 요청을 탐지하는 ‘Kanana Safeguard-Siren’, AI 서비스를 악용하려는 사용자의 공격을 탐지하는 ‘Kanana Safeguard-Prompt’이며, 모두 허깅페이스(Hugging Face)를 통해 다운로드 할 수 있다.

카카오는 ‘Kanana Safeguard’에 상업적 이용과 수정 및 재배포 등이 자유롭게 가능한 아파치2.0(Apache 2.0) 라이선스를 적용했다. 향후 지속적인 업데이트를 통해 모델을 고도화 할 예정이다.

카카오 김경훈 AI Safety 리더는 “생성형 AI의 등장 이래, 기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다”며 “책임감 있는 AI 구축에 대한 인식을 널리 확산시키고, 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 계획”이라고 말했다.

AI Kanana Safeguard 카나나 세이프가드 카카오

최원희

플래텀 에디터 / 스타트업 소식을 가감 없이 전하기 위해 노력하겠습니다.

최원희

최원희

댓글

Leave a Comment

✨ 많이 본 기사

💌 플래텀 뉴스레터 구독

개인정보 수집 및 이용

버즈니, AI 숏폼 자동 생성 서비스 ‘VISKIT AI’ 베타 출시

Platum

AI 도로 복구 ‘로보로드’, 2억원 시드 투자 유치

김문선

디노티시아, 국회 회의록 AI 검색 서비스 ‘폴리큐’ 베타 출시

Platum

텔레픽스, 유럽우주국 주최 AI 경진대회서 우승

Platum

카카오, AI 안전성 검증하는 가드레일 모델 오픈소스로 공개

최원희

최원희

댓글

Leave a Comment

✨ 많이 본 기사

💌 플래텀 뉴스레터 구독

개인정보 수집 및 이용

관련 기사

버즈니, AI 숏폼 자동 생성 서비스 ‘VISKIT AI’ 베타 출시

Platum

AI 도로 복구 ‘로보로드’, 2억원 시드 투자 유치

김문선

디노티시아, 국회 회의록 AI 검색 서비스 ‘폴리큐’ 베타 출시

Platum

텔레픽스, 유럽우주국 주최 AI 경진대회서 우승

Platum