• Home
  • About
  • Bookmark
  • Library
  • Search
  •  

    Our Sentiments, Exactly

    May 12th, 2009

    CACM 4월호에 실린 짧은 글인데, Sentimental Analysis의 개념을 설명하고 기술 상용화를 준비하고 있는 회사들의 이야기가 있어서 간단히 소개한다.

    이 글에서는 Sentimental Analysis라는 용어로, 여태껏 Opinion Mining, Business Intelligence 따위의 단어로 불리던 기술응용분야를 묶었다. Sentimental Analysis를 간단히 설명하자면, 사람들이 적은 글에서 특정 대상(또는 주제)에 대한 저자의 주관적인 의견을 뽑아내는 것이다. 예를 들어 영화 리뷰나 제품 사용기가 있을 때, ‘글을 쓴 사람이 대상을 좋아했는가? 만약 그렇다면 얼마나 좋아했는가?’를 알아내는 것부터 ‘그 영화 줄거리는 좋은데 배우가 연기를 못 해’ 같은 의견을 추출하는 것까지를 모두 포함한다. [계속 읽기]


    Automatically Profiling the Author of an Anonymous Text

    March 16th, 2009

    저자들의 설명에 따르면, 작자 미상의 글이 있을 때 그 글의 내용이나 스타일 등을 통해서 저자에 대한 정보를 추측하는 것을 Authorship Profiling이라고 한다. 저자로 추정되는 여러 후보를  중에서 한 명을 콕 집어내는 Authorship Attribution과 달리, Authorship Profiling은 저자의 성별이나 나이 따위의 개인적인 특성을 추측하려는 것이다.

    이런 게 왜 필요할까? 가령 어느 익명 게시판에 갔더니 특정 상품에 대해 부정적인 리뷰가 넘쳐난다고 생각해보자. 회사 관계자라면 그 상품을 나쁘게 평가한 소비자들이 주로 남자인지 여자인지, 청소년인지 장년층인지 궁금하지 않을까? [계속 읽기]


    Programming Collective Intelligence: 첫인상

    December 2nd, 2007

    이 책은 요즘 유행하는 웹 2.0을 표방하는 서비스에 적용할 만한 패턴분류(pattern classification) 또는 기계학습(machine learning) 이론을 소개하고, 이를 활용하여 재미있고 유용한 서비스를 구현하는 방법을 설명한다. 책의 구성은 단순하다. 챕터마다 특정 알고리즘을 소개하고 그것을 적용할 만한 웹서비스를 제시한 뒤 실제 구현 코드를 보여주면서 마무리 짓는 형식이다.

    등장하는 알고리즘의 면면을 살펴보면, Recommendation, Decision Tree, Neural Network, Bayesian Classifier, Optimization, Clustering, Support Vector Machine, Feature Extraction 등으로 아주 화려하다. [계속 읽기]


    Page 4 of 41234