글로벌

AI는 단순한 기술이 아니라 문화의 전략적 자산이다

Shisa.ai를 통해 본 일본의 AI 주권 실험

얼마 전 일본에서 오랫동안 기업가로 활동한 외국인 친구와 현지 경험에 관해 이야기를 나눴습니다. 그는 시장 경쟁보다 적응하는 데 더 애를 먹은 것은 일본 특유의 소통 방식이라고 말했습니다.

“어떤 때는 상대가 매우 공손하게 말하는데도, 그게 진짜 승낙한 건지, 아니면 사실상 정중한 거절인 건지 확신이 서지 않아요.” 그는 쓴웃음을 지으며 예를 들었습니다. 한 번은 고객에게 창구를 소개해 달라고 부탁했는데, 상대방이 정중하게 “생각해 보겠습니다”라고 답했습니다. 그는 당연히 다시 연락이 올 줄 알았지만, 결국 그 메일이 마지막이었죠.

사실 이러한 말투는 일본인이 흔히 사용하는 완곡한 거절 방식입니다. “도와주지 않겠다는 건 아니지만, 거절한다고 말하기 곤란한 상황”이라는 뜻이죠. 이런 소통 방식은 일본 문화에 익숙하지 않은 사람들에게는 정말 오해하기 쉽습니다.

저는 그 이야기를 듣고 정말 공감했습니다. 언어란 단순히 단어를 번역하는 것이 아니라, 말투, 맥락, 그리고 서로 간의 암묵적인 이해까지 포함되기 때문입니다.

저는 문득 우리가 매일 사용하고 있는 AI LLM(거대언어모델)을 떠올렸습니다. 오랫동안 현지에 거주한 기업가조차 상대의 말뜻을 오해할 수 있는데, ‘영어 문맥’으로 학습된 AI 모델이 과연 이러한 문화적 섬세함을 제대로 파악할 수 있을까요?

AI의 문화적 편견

이 같은 의문은 MIT 슬론의 최근 연구에서도 확인되었습니다.

연구팀은 OpenAI의 ChatGPT와 바이두의 어니(문심일언)와 같은 거대언어모델을 실험한 결과, 모델이 서로 다른 언어로 응답할 때 서로 다른 문화적 편견을 보인다는 사실을 발견했습니다. 중국어로 질문할 때 AI는 ‘집단 중심’적인 사고방식을 보이는 반면, 영어로 질문할 때는 ‘개인을 강조하는’ 표현 방식이 뚜렷하게 나타났습니다.

예를 들어, 거대언어모델에게 보험 광고 슬로건을 디자인해 달라고 요청할 경우, 중국어로 입력하면 AI는 “가족의 미래는 당신의 약속입니다”와 같은 문구를, 영어로 입력하면 “당신의 미래, 당신의 평화, 우리의 보험”과 같은 문구를 만들어냅니다. 같은 질문이라도, 사용하는 언어에 따라 전혀 다른 문화적 가치의 우선순위가 반영됩니다.

언어는 단순한 도구가 아니라 문화의 전달자다(사진: 신위안 캐피탈)

더 중요한 것은, 이러한 문화적 성향이 사용자에게 무의식적으로 영향을 미치고, 심지어 AI가 편집한 미디어와 교육 자료를 통해 사회 전반에 스며들 수 있다는 사실입니다. 다시 말해, 생성형 AI는 특정한 문화와 가치관을 조용히 복제하고 있으며, 우리가 직접 언어 모델을 사용하지 않더라도 이미 그 언어 모델이 구축한 문화적 관점과 가치관 속에 놓여 있을 가능성이 큽니다. 그리고 우리는 이를 깨닫지 못하는 경우가 많죠.

문화 인프라가 된 거대언어모델

언어 모델이 담고 있는 것은 단순한 기술이 아니라 바로 문화입니다. 각 빅스피치 모델의 결과는 어떤 어조가 ‘합리적’이고 어떤 반응이 ‘정상’ 인지를 암묵적으로 정의하고 있으며, 빅스피치 모델을 사용하여 서로 대화할 때 우리는 그 뒤에 있는 가치의 논리를 받아들이고 있습니다.

이러한 이유로 점점 더 많은 국가들이 언어 모델을 ‘주권 거버넌스’의 관점에서 바라보기 시작했습니다. 유럽연합은 2024년에 인공지능법(AI Act)을 통과시켜, 최초로 응용 위험에 따라 등급을 나누고, 기초 모델 개발자에게는 훈련 데이터의 출처를 공개하도록 요구했습니다. 이는 모델이 내포한 문화적 가치에 대한 가시성과 통제력을 확보하려는 조치입니다.

한편 싱가포르는 동남아시아 지역의 문화에 맞춘 오픈소스 거대언어모델인 Sea-Lion을 개발하고 있습니다. 동남아시아 언어와 문화적 배경을 폭넓게 수집함으로써 Sea-Lion은 현지 요구에 부합하는 AI를 구현하고 이를 기반으로 새로운 애플리케이션을 구축하고 있습니다.

사우디아라비아는 국부펀드를 통해 직접 개입하여, 왕세자가 주도하는 휴메인(Humain)을 설립했습니다. 이 기업은 슈퍼컴퓨팅 센터와 대규모 데이터 센터 건설에 나섰으며, 총투자 금액은 1,000억 달러에 달합니다.

이러한 다양한 전략들은 모두 공통된 메시지를 전달합니다. 언어 모델은 단순한 알고리즘이 아니라, 문화적 가치, 정보 거버넌스, 국가 안보와도 관련이 있으며, 타인에게 의존하지 말고 스스로 구축해야 한다는 것입니다.

외국에서 훈련된 언어 모델에 장기적으로 의존하는 것은, 단순히 그들이 정한 말투와 상호작용 논리를 받아들이는 것뿐 아니라, 구조적인 위험을 초래할 수 있습니다. 생성형 AI가 점차 산업 전반에 스며들면서, 그 말뭉치가 특정 문화에 편향되어 있다면, 그 가치관 또한 사회 전반에 스며들어 우리가 사고하고 표현하는 방식을 조용히 재구성할 수 있습니다.

일본의 시도: Shisa.ai, 문화에서 출발한 언어 모델

언어 이해를 둘러싼 글로벌 경쟁 속에서, 일본에서는 특히 눈에 띄는 현지 시도가 등장했습니다. 바로 Shisa.ai입니다. 단 3명으로 구성된 이 팀은 제한된 자원 속에서도 4,050억 개의 파라미터를 가진 일본어 거대언어모델을 성공적으로 학습시켰습니다. 실제 테스트 결과에 따르면, 이 모델은 명령 이해, 번역, 의미 추론 등 다양한 일본어 과제에서 우수한 성능을 보였으며, OpenAI의 GPT-4나 중국의 DeepSeek-V3와 동등한 수준의 성능을 보였습니다. 작은 스타트업으로서 이는 단순한 기술적 성과를 넘어, 문화적 주체성을 실천한 의미 있는 성취였습니다.

Shisa.ai, 자체 학습한 거대 대규모 일본어 언어 모델 ‘Shisa V2-405B’를 출시했다. (사진: Shisa.ai)

Shisa.ai의 창립자 세 명은 모두 이민자 출신으로, 일본에 정착해 창업하기로 결심했습니다. 이들은 AI 주권은 현지 언어와 문화에서 출발해야 하며, 자국 모델을 구축하는 것은 단지 다양성을 보존하기 위한 것이 아니라, 데이터 프라이버시, 지정학적 탄력성, 국가 디지털 자주권과도 깊이 관련된다고 믿고 있습니다.

CEO 지아 셴과 CTO 레너드 린은 공동 창업자이며, 특히 Shisa 모델은 레너드가 주도적으로 개발한 그의 대표작입니다. 그리고 팀의 AI 연구원인 아담 렌센마이어는 전혀 다른 배경을 지니고 있습니다. 그는 일본 애니메이션 팬들에게 익숙한 자막 번역가로, <진격의 거인>, <건담>, <명탐정 코난(극장판)>, <은하철도 999>, <짱구는 못말려>, <우주전함 야마토>, 그리고 편의점에서 구입할 수 있는 <우주형제> 등 수많은 작품에 참여한 바 있습니다. 탁월한 언어 감각과 어투에 대한 극도의 섬세함 덕분에, 그는 모델 훈련에서 핵심적인 역할을 하였고, Shisa.ai가 일본어 세계의 깊은 언어 맥락과 문화적 디테일에 훨씬 더 가깝게 다가갈 수 있게 되었습니다.

Shisa.ai는 처음부터 일본 현지에서 모델을 훈련하기로 결정했고, 일본어 특유의 말투와 사회적 암시 같은 특성에 의도적으로 집중했습니다. 창업자 지아 셴은 “지난 30년간의 인터넷 말뭉치는 대부분 거대언어모델에 의해 학습되었다. 이제 AI 훈련 자료는 곧 한계에 부딪칠 것이며, 앞으로의 돌파구는 ‘더 많은 데이터’가 아니라 ‘맥락에 더 가까운 데이터’가 될 것이다. 예를 들어, 온라인에 자동으로 남지 않는 목소리와 감정이 될 것”이라고 지적했습니다. 예를 들어, 어르신들의 대화, 지역 사투리, Z세대가 데이트할 때의 말투 변화 등 언어와 문화가 얽혀 있는 실제 말뭉치를 누가 확보하느냐에 따라, 다음 세대 모델의 주도권이 결정될 것입니다.

이 아이디어는 일본 정부에서도 지지하고 있습니다. 2024년 일본 경제산업성은 GENIAC(Generative AI Accelerator Challenge) 프로그램을 출범시켜, 자금, 멘토링, 대규모 연산 자원을 제공하여 스타트업들이 자체 기반 모델을 개발할 수 있도록 지원했습니다. Shisa.ai는 이 프로그램의 선정 팀 중 하나로, 모델 훈련 속도를 성공적으로 가속화하여 일본의 언어 모델 연구 개발 역량을 부각시켰습니다.

더 인상적인 점은, Shisa.ai가 단순히 기술 개발에만 그치지 않았다는 것입니다. 그들은 말투 이해 기술을 실제 산업에 적용했습니다. 예를 들어, 일본 식당에서 외국인 관광객을 응대하고, 소매점에서 반품 및 교환 업무를 지원하며, 기차역에 다국어 AI 키오스크를 설치해 여행객에게 길 안내와 서비스를 제공합니다. 이러한 활용은 단순한 기술 시연이 아니라 문화 간 커뮤니케이션에 실질적으로 대응한 사례입니다.

Shisa V2-405B는 다양한 일본어 과제에서 OpenAI의 GPT-4o 및 중국의 DeepSeek-V3와 동등한 성능을 보여주었다. (사진: Shisa.ai)

누구의 말투가 AI의 말투가 될 것인가?

Shisa.ai는 시작에 불과하지만, 중요한 사실을 일깨워줍니다. 생성형 AI는 빠르게 일상생활과 산업 전반에 스며들고 있으며, 그 안에 담긴 말투는 우리가 서로를 이해하고 자신을 표현하는 방식에 큰 영향을 미치게 될 것입니다.

언어는 단순한 도구가 아니라 문화의 전달자이며, 우리가 말하는 방식은 결국 AI가 세상을 이해하는 방식을 결정하게 됩니다.

글 : 매트 첸(Matt Cheng) 체루빅 벤처스 매니징 파트너, 아워송 코파운더 Matt Cheng, Founder and General Partner of Cherubic Ventures

외부 전문가 혹은 필진이 플래텀에 기고한 글입니다. 외부기고는 본지의 편집방향과 다를 수 있습니다. / 기고문의 editor@platum.kr

댓글

Leave a Comment


관련 기사

스타트업

스티비, 이메일 마케팅 AI 트렌드 사이트 오픈…”담당자 68.5% AI 활용 중”

스타트업

와들, 아가방앤컴퍼니에 AI 쇼핑 상담 솔루션 ‘젠투’ 공급

트렌드

2025년 CRM 핵심 키워드는 ‘맞춤형·투명성·AI’

스타트업

채널코퍼레이션, 채팅에서 전화로 AI 상담 서비스 확장