April 19th, 2012
얼마 전에 허위로 작성된 리뷰를 찾으려는 연구를 소개했다. 자연어 처리 기법으로 리뷰 내용을 분석해서 상상으로 꾸며진 글을 분류하는 것이었는데, 흥미가 생겨서 관련 연구를 더 찾아봤다. 역시나 최근 몇 년 동안 꾸준하게 연구해온 사람들이 있었고, 또 그 방법론에서도 눈에 띄는 흐름이 있었다.
2008년 WSDM에 나온 Opinion Spam and Analysis를 보면, 리뷰 문서 단위로 보면서 각각이 스팸인지 아닌지 판정하려고 한다. 여기서 스팸이라 함은, 흔히 생각하는 그런 말도 안 되는 광고 문서가 아니라 특정 상품을 홍보하거나 혹은 깎아내릴 목적으로 작성된 가짜 리뷰(Fake Review) 혹은 의견 스팸(Opinion Spam)을 말한다. 여기서 궁금한 점은 세 가지다. (1) 리뷰가 허위로 작성된 스팸인지 아닌지 어떻게 알까? (2) 스팸 판정 모델을 만들려면 학습에 쓸 데이터가 있어야 하는데 그건 어떻게 구했을까? 마지막으로 (3) 어떤 특성(Feature)을 이용해서 분류했을까? [계속 읽기]
3 Comments |
paper |
Permalink
Posted by SL
March 17th, 2011
우리는 별다른 수고 없이도 소리를 듣고 느끼지만 귀와 뇌가 없는 컴퓨터에게 공기의 진동으로부터 음악을 듣는 것은 특별한 노력이 필요한 일이다. 어렵긴 하지만 그래도 그럴 만한 가치가 있다. 기계가 음악을 들을 줄 알게 되면 무엇이 가능해지는지 이 동영상을 보자. 조유진(Yoo-jin Cho)이라는 분이 바이올린 협주곡을 연주하는 장면이다. 협주곡이라면 독주자(soloist)와 오케스트라가 함께 연주한다는 뜻인데, 오케스트라는 어디에 있을까? 바로 컴퓨터 속으로 들어갔다.

위의 링크는 Music Plus One이라는 프로젝트의 데모 영상이다. [계속 읽기]
No Comments » |
paper |
Permalink
Posted by SL
February 28th, 2011
구글 크롬의 재치있는 에러 메시지에 많은 사람이 재미있어 한 기억이 난다.

지구에서 유머 감각을 가진 생물종은 인간밖에 없다고 한다. 바로 그 지성의 총체, 유머에 대한 계산 모델을 탐구하는 연구 소갯글이 IEEE Intelligent Systems에 Computational Humor라는 제목으로 실렸다. 따끈따끈한 내용은 아니고 벌써 5년이나 지난 2006년의 글이지만 Computational Humor(계산 유머?) 연구의 동향을 살펴볼 수 있다. [계속 읽기]
2 Comments |
paper |
Permalink
Posted by SL
October 12th, 2010
요즘 들어서 난독증이 의심되는 나에게 스스로 선물한 책이다. 소감을 쓰기에 앞서, <How to Read a Book>이라는 점잖은 원제를 <생각을 넓혀주는 독서법>이라는 허접한 자기계발서풍의 제목으로 바꿔버린 센스에 경의를 표한다. 덕분에 밖에서 읽을 때면 자꾸 얼굴이 화끈거려서 손으로 표지를 가려야 했다.
책을 읽는 데에는 흥미 유발이나 정보 수집 등 다양한 이유가 있겠지만 이 책은 그중에서도 읽기를 통해 이해력을 증진하고 싶은 사람을 위한 길잡이를 자처한다. 저자는 책 읽기 수준을 4가지로 구분하는데, 가장 중점적으로 다루는 것은 3수준의 ‘분석하며 읽기’다. 글의 내용을 잘 이해하기 위한 8개의 원칙과 각각의 실천 지침을 자세히 설명하고 있다. [계속 읽기]
8 Comments |
book |
Permalink
Posted by SL