멀티모달

스타트업

카카오, 텍스트·음성·이미지 동시 처리하는 ‘Kanana-o’, 글로벌 모델과 경쟁력 입증

카카오가 텍스트, 음성, 이미지를 동시에 처리할 수 있는 통합 멀티모달 언어모델 ‘Kanana-o’의 성능을 공개했다. 이 모델은 다양한 형태의 정보를 통합적으로 이해하고 처리하는 능력을 갖춰 인공지능 ...

트렌드

2025 AI 트렌드 전망 – 멀티모달에서 AI 에이전트까지

시간이 빠르게 흐르고 있다. 우리가 몸담고 있는 이 시대를 ‘특이점의 시대’라고 부르는 것이 이제는 어색하지 않다. 유명 과학자 레이 커즈와일이 말한 ‘특이점’은 기술의 변화가 너무나 ...