달력

02

« 2012/02 »

  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  •  
  •  
  •  

'텍스트마이닝'에 해당되는 글 2

  1. 2008/07/07 [정리] 텍스트마이닝 핵심내용 정리 (5)
  2. 2008/07/07 [리뷰] 질의 로그 클러스터링을 이용한 FAQ 검색 (2)

이번 학기에 수강한 '텍스트마이닝' 수업에서 배운 내용을
시험 공부하면서 정리해보았었다.

주로 정영미 교수님의 '정보검색연구' 4장, 5장, 6장 내용 + 각종 프린트물 종합 정리!

< 목차 >

- 텍스트마이닝 전처리 – 정보추출
- 유사도 척도와 자질 선정
- 문헌 클러스터링
- 텍스트 범주화
- 자동요약



update : SVM 분류기 관련 내용 조금 수정됨

Posted by 시루

검색 재현율이 타 검색 컬렉션에 비해 현저하게 떨어지는
FAQ 검색 성능을 높이기 위해
FAQ 질의 로그를 MRD (Machine Readable Dictionary)를 이용해서
각각의 FAQ와 클러스터링 했다.

지식iN 처럼 FAQ 데이터가 무지 많은 컬렉션에는
적용하는 것이 무리이기는 하겠지만,
일반적인 사이트 FAQ 검색에는 활용해볼 만할 듯.

Posted by 시루