라이브검색 기술 공개 … 네이버, ‘NAVER LIVE SEARCH 2016’ 콜로키움 개최
21일, 네이버 주최로 국내 검색기술 관련 전공의 석박사들과 네이버 검색 기술에 대해 논의하는 ‘NAVER LIVE SEARCH 2016’ 콜로키움이 개최되었다.
이번 콜로키움에는 네이버 김광현 검색연구센터장을 비롯, 네이버 검색 연구를 이끌고 있는 개발자들이 대거 참석했으며, 서울대, KAIST, 포항공대 등 전국 12개 대학의 21개 연구실의 석박사들을 대상으로 라이브검색의 콘텍스트, 딥러닝 활용, 검색시스템 등 제반 연구 프로젝트들을 공개했다.
네이버는 이번 콜로키움에서 이러한 ‘라이브검색’에 대한 기술을 ‘Context-aware’, ‘Artificial Intelligence’, ‘System’ 등 총 세 개의 세션을 통해 상세하게 공개함으로써 검색 전문가들과 기술 노하우를 공유하는 자리를 가졌다.
또한, 네이버는 콜로키움 행사장에 각 개별 연구에 대한 쇼케이스 부스를 마련해, 실제 기술이 적용된 데모 서비스를 살펴볼 수 있도록 했다.
네이버는 앞으로 해마다 검색 기술에 대한 콜로키움 행사를 정기적으로 개최해, 국내 검색 연구가들에게 네이버 검색 기술과 노하우를 지속적으로 공유해나갈 방침이다.
아래는 이날 발표세션 내용을 정리한 것이다.
발표 세션 내용 요약
■ 세션1. Context – aware (11:10-12:30)
◎ 라이브(LIVE) 검색 | 강인호 이사
Feedback, Withness, context 정보를 활용하여 사용자 문맥에 적합한 검색 결과 제공
- 장소와 시간의 제약없이 실시간으로 정보를 얻고자 하는 모바일 시대에서 이용자들의 의도를 파악해, 그에 맞는 생생한 검색 결과를 제공하기 위함.
- 좋아요, 댓글, 쇼핑 정보, 뮤직 플레이 등과 같은 사용자의 활동 정보를 피드백 정보로 활용하는 ‘라이브 피드백’, 사용자의 현재 상황을 잘 이해하는 ‘라이브 콘텍스트’, 관심사가 유사한 사용자 네트워크 정보를 활용하는 ‘라이브 위드니스’ 등을 활용해, 사용자 의도를 이해하고 유형화한 뒤,사용자의 문맥에 적합한 검색 결과를 제공하는 방식
◎ 시멘틱 태깅 | 정유진 리더
질의와 문서에 사용된 단어들의 의미를 구분해 주는 기술로, 사용자 검색 의도에 일치하는 문서들만 선별하여 제공
- 검색 의도가 섞여있는 수많은 질의들을 식별하기 위해서는 ‘의미 구분자’가 필요함.
- 시맨틱 태깅은 문맥 내 의미를 인식 및 분석해(시멘틱), 해당 단어에 정확한 의미 구분자(Entity ID)를 부착하는 기술. 원활한 시멘틱 태깅을 위해서는, ‘context’로 출현할 가능성이 높은 단서 확보가 관건.
- 네이버는 네이버가 구축한 방대한 DB를 바탕으로, 검색뿐만 아니라, 다양한 서비스에 시멘틱 태깅을 적용할 예정
◎ Context 기반의 개인화 추천 | 최재호 리더
빅데이터 분석을 통해 사용자들의 다양한 context를 파악하여 맞춤형 추천 정보 제공
- 모바일이 PC와 다른 점은 ‘로그인’이 되어 있고, ‘항상’ 곁에 있으며, 이용자가 ‘어디’ 있는지 알 수 있음. 이를 바탕으로 사용자가 입력한 검색어와 보고 듣는 콘텐츠를 분석함으로써, 사용자의 ‘관심사‘를 파악 가능.
- 네이버는 모바일 검색 이용자들의 context(성별/세대, 관심사, 위치/시간)를 분석해 양질의 정보를 제공할 예정
■ 세션2. Artificial Intelligence (13:30-14:50)
◎ Vision&Language, 이미지/동영상과 텍스트의 만남 | 김상범 리더
딥러닝 기반 비전–언어 통합기술을 바탕으로 사용자에게 이미지/동영상 데이터를 효과적으로 전달
- 네이버는 ▲유명인의 고화질 현장 이미지들을 이벤트별로 구성해, 타임라인 형태로 제공 ▲특정 음식점에 대한 데이터를 분석해, 해당 음식점을 가장 잘 나타내는 최적의 이미지를 추출해 제공 ▲한 상품과 유사한 스타일의 다른 상품을 편리하게 검색할 수 있는 기능 등을 제공할 예정
◎ Understanding&Information | 이현아 리더
사용자의 마음을 들여다 보는 것처럼 질문의 의도를 잘 이해하고, 사용자의 context에 맞는 정보를 적절히 찾아줌으로써 좀 더 똑똑한 네이버로 진화
- 사용자 질의를 구조/의미적으로 분석하여 검색 의도를 잘 파악하기 위한 NLU 기술
- 정형화되어 있지 않은 빅데이터로부터 사용자가 궁금해하는 지식을 추출하는 IE 기술
◎ 네이버 인공지능 대화 시스템: LAON | 서희철 리더
사용자와 대화하듯이 검색결과를 제공하는 시스템으로 대화를 분석해, 사용자에게 적합하면서 간결한 검색결과 제공
- 네이버앱 내 음성 검색 시, 상대방과 묻고 답하는 대화방식으로 답변 제공.
- 인물, 영화, 방송, 날씨 등의 카테고리에 선 적용할 예정
■ 세션3. System (15:10-16:30)
◎ Feature-based Crawl for Mobile Web | 원성재 리더
모바일에서 좋은 콘텐츠를 찾기 위한 수집기술의 변화
- 모바일 시대가 되면서 발생한 새로운 문제들을 해결하기 위한 네이버 수집시스템의 정책과 수집방식에 변화
- 개선된 수집기술로 외부 생산자들의 좋은 콘텐츠가 네이버 검색에 더 잘 노출될 수 있도록 할 예정
◎ Context 엔진 CASE | 강유훈 리더
Context/AI 기반의 신규 검색 서비스를 지원하는 시스템 기술
- 네이버는 대규모 텍스트, 이미지/동영상, 이용자 활동 등 방대한 로우(raw) 데이터 중에서,콘텍스트를 보다 잘 추출하고 데이터를 보다 잘 이해하기 위해, ‘CASE’라는 대규모 실시간 데이터 처리 및 이해 기술을 개발함.
- 네이버는 CASE를 기반으로 이용자의 실시간 콘텍스트를 정확히 파악해 검색 결과를 제공할 예정
◎ 네이버 검색을 떠받치는 검색시스템: BREW | 곽용재 이사
하루 15억건의 질의를 받아 0.9초 안에 결과를 응답하는 국내 인터넷 서비스 중 최대의 트래픽을 처리하는 대규모 검색 시스템 기술
- 네이버는 라이브 검색에서 필요한 실시간 갱신을 대규모 데이터 기반의 검색 상에서 구현하기 위해 ‘BREW(Burst, Real-time, Event-Wise Search System)’라는 검색 시스템을 자체 개발함.
- 네이버는 이 기술을 통해서 대용량의 라이브한 피드백, 컨텍스트, 위드니스 등의 정보에 대해 실시간으로 ‘수신 저장 – 빅데이터 처리 – 검색 반영’ 절차를 수행하여 사용자들에게 생생한 품질의 검색서비스를 제공할 예정