달력

02

« 2012/02 »

  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  •  
  •  
  •  

검색 재현율이 타 검색 컬렉션에 비해 현저하게 떨어지는
FAQ 검색 성능을 높이기 위해
FAQ 질의 로그를 MRD (Machine Readable Dictionary)를 이용해서
각각의 FAQ와 클러스터링 했다.

지식iN 처럼 FAQ 데이터가 무지 많은 컬렉션에는
적용하는 것이 무리이기는 하겠지만,
일반적인 사이트 FAQ 검색에는 활용해볼 만할 듯.

Posted by 시루
정보이용자연구 수업에서
이용자들의 정보 행태 관련한 72가지의 이론이 요약되어있는
교재를 가지고 한 사람당 3-4개의 이론을 쭈욱~ 훑고 있는데,
내가 담당한 이론은 아래와 같다.

Theories of Information Behavior
(Ed. by Karen E. Fisher, Sanda Erdelez, and Lynne McKechnie, 2005)

27. Information Acquiring-and-Sharing
28. Information Activities in Work Tasks
29. Information Encountering
30. Information Grounds

4가지 이론 모두 발표를 준비하면서 매우 흥미롭다고 느껴졌다.

특히 Information Acquiring-and-Sharing 과 Information Encountering은
웹 상에서의 이용자 정보 행태와 직접적으로 관련이 있는 것들이여서
웹 기획자들이 한번쯤 리뷰를 할 만한 이론 인듯 하고,

Information Actitivies in Work Tasks와 Information Grounds는
주로 오프라인 기반으로 이용자들을 면밀히 관찰하고 인터뷰하면서 나온
이론들로서 여기서 강조하고 있는 시사점을
어떻게 하면 온라인에서 적용시켜볼지를 고민하는데 도움이 될 듯 하다.

Posted by 시루

특수분류법 시간에 발표한 '목록' 관련한 Chapter 발표 내용

G G Chowdhury and Sudatta Chowdhury (2007)
Organizing Information - 3장Cataloguing

도서에 대한 '목록'을 만드는 것을 보통 '편목'이라고 하는데
매우 따분한 내용이라고 생각했던 것과 달리
FRBR 이라던지 RDA 라던지 하는 새로운 개념을 배울 수 있어서 유익했다.

검색기획에서는 일명 'DB 필드 정의 작업'이 이 Cataloguing 작업이라고 볼 수 있다.

비록 '서지레코드'여서 주로 문헌에 대한 필드 정의 이기는 하지만,
IFLA에서 국가서지레코드의 기본 요건을 정의하면서
이용자가 목록을 통해서 하고자 하는 바를 먼저 정리하고,
결과적으로 어떤 필드들이 필요한지를 도출해내는 과정 자체는
배울만한 부분이 있는 사고 과정이라는 생각이 들었다.



Posted by 시루
계량정보학 두 번째 발표도 역시 Loet Leydesdorff 박사의 논문이었다.

아래와 같이 긴~ 제목의 논문을 읽으면서 배운 것은
"Co-occurrence Matrices and Their Applications in Information Science :
Extending ACA to the Web Environment"

계량정보학에서 '행렬'이라는 것을 만들고, 다루는 방법에 대한 감을 익혔다는 것.

논문에서는 주로 대칭행렬이 아니라 '비대칭행렬'을
기본 분석 대상 행렬로 사용하라고 하고 있고,
그 예제로 저자 동시인용 분석(ACA, Author Cocitation Analysis) 분석결과를 들고 있다.
그리고 논문의 끝 쪽에서 Google Scholar를 이용해서 웹 기반 ACA 데이터에 대한
분석 결과도 짧게 논하고 있다.

논문이 약간 어수선한 것 같기는 하지만,
SPSS로 MDS로 연습 그림도 그려보고 해서 리뷰한 소득은 있었다.

발표 논문 원문



발표자료
Posted by 시루

한 학기 내내 내용 기반 이미지 검색에 대해 배웠지만,
여전히 상용 이미지 검색은 TBIR 기반으로 서비스 된다.

Zheng Chen의 논문처럼 오히려 웹 마이닝 등의 데이터 가공을 통해서
CBIR과 적절히 혼합된 이미지 검색 모델링을 하는게 더 현실적일 듯 싶다.

이용자 피드백 모델은 실제 이미지 검색 클릭로그 데이터를 이용해서 응용할 수 있지 않을까.
이번 학기 리뷰/발표한 논문 중에 가장 잘 와닿은 논문이였다.

발표 논문 원문 : Zheng Chen et al. 2001, JASIST 52(10), 831-839


발표자료
Posted by 시루

멀티미디어 시스템 수업 중에 동영상 내용 자체(주로 영상 이미지)를 색인하고 검색하는
다양한 기법들에 대한 기본서를 발표할 기회가 생겼다.

Shot Detection 하는 방법, Video Summary 방법 등은
동영상 검색 기획하면서 미쳐 알지 못했던 내용들이라서 매우 유용했음!

발표 논문 :
Multimedia Database Management System, Lu, Guojun, 1999
Ch7. Video Indexing and Retrieval

(조금 오래된 책이기는 하지만, 멀티미디어 데이터의 내용 기반 검색 응용은 여전히 답보상태 -.- 그래서 기본적인 내용은 지금도 유용)

발표자료


 

Posted by 시루

계량정보학 분야에서 '저널 인용' 주제로 연구할 때,
20여년 간 이 주제로 연구를 꾸준히 해온 Loet Leydesdorff 박사의 논문을 빼놓을 수가 없다.

그가 최근 JCR (Journal Citation Report) 데이터를 연구 대상으로 확보 가능해지면서
다양한 분석을 내놓고 있는데,
이 논문은 초기의 Online Mapping Exercise라고 부재가 붙여진 논문이다.

계량정보학을 통한 학문의 지적 조직체계 (Intellectual Organization)를 분석해감에 있어서
그가 강조하는 점은 Localization과 분석의 상대성이다.

어느 하나의 절대적인 기준으로 전체 학문 맵을 분석하기는 어렵고,
각 도메인 별 혹은 각 중심 저널 별로 분석 관점이 달라질 수 있다는 점.

또한 저널 인용 분석의 경우,
피인용(Cited)과 인용 (Citing) 활동 조차도 분리해서 분석해야 한다고 보고 있다.

논문을 읽으면서 어느 정도 그의 주장에 공감이 가기는 했지만,
그와 같은 방식으로 분석하게 되면
때로는 매우 지협적인(?) 분석을 하게 될 수 있을 것 같다는 생각이 조금 들었음.

발표 논문 원문



* Online Access : http://users.fmg.uva.nl/lleydesdorff/jcr04/index.htm

발표자료

Posted by 시루
지금은 인하대학교 Digital Media Lab 담당교수로 계신 박인규 박사님이
1999년에 다른 분들과 함께 쓰신 내용기반 이미지 검색 관련 논문이다.

그동안 주로 Histogram 으로 이미지 컬러 자질들을 표현했는데,
이 논문에서는 Histogram과 Graph를 복합적으로 이용하여
컬러 이미지의 자질을 표현했다.

그리고 일반적인 컬러 분포 자질 이외에 컬러와 컬러간의 인접도 (Adjacency)와
이미지 공간상에서의 컬러 분포를 기반으로 보다 정확히 컬러 이미지를 표현하고자 함.

향후 질감, 모양 등 다른 특징들도 여러 개의 그래프로 표현해보고 싶다고 함.
그래프로 표현하는 것의 유용함이 있는 듯 한데,
후속 연구를 더 찾아볼 필요가 있을 듯.

발표 논문 원문


발표자료 
Posted by 시루
이번 학기 '멀티미디어 시스템' 첫 발표 논문은 Yang의 내용기반 이미지 검색 관련 실험 논문이다.

예제 이미지 쿼리 기반의 시스템과 브라우징 방식의 시스템에서 내용 기반 이미지 검색을 구현해서, 검색성능과 Information Seeking Behavior 관점에서 평가한 논문이다.

발표하면서 교수님 코멘트도 그랬고, 내가 리뷰해보더라도
실험 설계 자체가 너무 뻔한(?) 결론을 이끌어낼 수 밖에 없는 설계였다.
즉, '브라우징 형식'의 이미지 검색이 갖는 특징들 자체를 결론이라고 내고 있으므로 -.-

그렇다 하더라도 내용 기반 이미지 검색 관련해서는 처음보는 논문이라,
이것 저것 찾아보면서 발표해서 도움은 많이 되었음.

단, SOM (Self-Organizing Map) 개념을 이해하는데 시간이 많이 걸렸고,
실제로 지금도 아주 딱~ 와 닿지는 않음. (어려워 OTL)

Christopher C. Yang, "Content-based image retrieval: a comparison between query by example and image browsing map approaches", JIS 2004

발표 논문 원본




발표자료

Posted by 시루

이번 학기에 수강하고 있는 '정보검색이론연구' 수업에서
Query Expansion / Relevance Feedback 관련한 논문 리뷰를 발표하는데,
 
내가 맡은 논문은 MS Research 소속 연구자들이 작년에 발표한
"Improving web search ranking by incorporating user behavior information" 였다.

RankNet이라는 신경망 기반의 랭킹 학습 알고리즘에 대해서 이해하는데
너무 많은 시간을 소비하기는 했으나,
그래두 내꺼로 꼭꼭 씹어서 발표할 수 있어서 밤 샌 보람이 있었다.

발표 논문 원본



발표 자료


Posted by 시루