[서치데이2008] 키워드기반 검색엔진에서 의미기반 검색엔진으로 - 이영진 시맨틱스 부장 검색/Search Review2008/04/24 23:54
큐로보라는 나름 상용화된 시맨틱검색을 만든 업체라 기대했는데,
발표 초반에는 너무 일반적인 내용을 이야기해서 약간 재미없었다. (검색엔진의 역사 -_-)
결국 핵심은 웹으로부터 의미기반 DB생성을 어떻게 하는 것일 듯.
질의의 '의미 파악'을 일단 해당 질의 내 단어의 '주제분야 파악'으로 먼저 봤던 것 같은데,
이렇게 러프한 의미 파악으로는 실제로 복잡 다양한 이용자 의도를 만족시키기는 약간 부족한데... 음... 시맨틱 검색 고민된다.
나도 나름 차세대 검색에 있어서 핵심 기술이라고 생각하는데 말이지.
p.s 큐로보 라는 서비스 네이밍은 잘 안외워지는 네이밍이다.
큐보로인지 큐로보인지 헷갈리공 -.- 쫌 더 쉽고 명확한 걸로 짓지.
--- 주요 내용 요약 ---
* 검색엔진 발전 방향
정보공유 필요성 -> 정보를 풍부하게 할 필요성 -> 원하는 정보의 손쉬운 접근, 분류된 정보
-> 더욱더 많은 정보 -> 양질의 정보에 대한 정렬(알고리즘 로봇) -> 더 정확한 검색결과 (소셜, 의미, 개인화)
* 시맨틱 검색
의미검색 : 검색어와 동일한 의미를 갖는 기술
시맨틱검색엔진 기능
- Grouping : 주제 기반
- Meaning : 기계가 알아들을 수 단어
- Reasoning : 기계 스스로 추론
현재 Meaning 단계 & Reasoning 초기 단계
시맨틱검색엔진 예
- Hakia : 백과사전형 컨텐츠. 전체 페이지 50% 정도는 수작업에 의해 진행
- Quintra
시맨틱 검색엔진 구현 기술요소
(일반) 시맨틱 검색 = 시맨틱 웹을 검색해주는 거다.
기존 웹 vs. 시맨틱 웹
- 홈페이지 제작 방법
- 홈페이지 제작 툴
- 홈페이지 제작 난이도
- 정보 등록 방법
...
-> 한마디로 정보량이 구멍가게 수준
시맨틱 검색엔진 구현 방안
(일반) 온톨로지(수작업) -> RDF 문서를 수집/탐색하는 크롤러 모듈 -> 시맨틱 검색엔진
(제안) 웹으로부터 의미기반 DB생성 (로봇 자동생성, 약 1% 정도의 수작업)
-> 크롤러 모듈 (의미기반 DB에 의해 일반 웹페이지에 시맨틱 특성 부여된 페이지 탐색)
* 시맨틱 검색엔진 해결해야 하는 과제들
- 70% 정도의 자동화, 나머지는 수작업해서 온톨로지 개발

