Our Sentiments, Exactly

by SL

CACM 4월호에 실린 짧은 글인데, Sentimental Analysis의 개념을 설명하고 기술 상용화를 준비하고 있는 회사들의 이야기가 있어서 간단히 소개한다.

이 글에서는 Sentimental Analysis라는 용어로, 여태껏 Opinion Mining, Business Intelligence 따위의 단어로 불리던 기술응용분야를 묶었다. Sentimental Analysis를 간단히 설명하자면, 사람들이 적은 글에서 특정 대상(또는 주제)에 대한 저자의 주관적인 의견을 뽑아내는 것이다. 예를 들어 영화 리뷰나 제품 사용기가 있을 때, ‘글을 쓴 사람이 대상을 좋아했는가? 만약 그렇다면 얼마나 좋아했는가?’를 알아내는 것부터 ‘그 영화 줄거리는 좋은데 배우가 연기를 못 해’ 같은 의견을 추출하는 것까지를 모두 포함한다.

이런 작업을 제대로 하려면, 한 문장의 긍정/부정을 판정하는 것을 시작으로 호불호의 정도를 파악하고 저자의 의도까지 파악해야 하는데, 생각처럼 그리 녹록한 작업은 아니다. (“그 영화에서 마음에 들지 않았던 것은 배경음악뿐이다.” 이런 문장을 생각해보자.) 게다가 글의 문맥이나 쓰인 단어의 뉘앙스까지 고려해야 하니까… 기술적 난이도는 짐작하는 것 이상일 것이다.

따라서 글에서 소개된 기업들이 심오한 기술적 성취를 이뤘을 거라고는 사실 별로 생각하지 않는다. 사례로 들고 있는 것들을 보면,
1) 웹에서 특정 주제가 얼마나 많이 언급되고 그에 대한 긍정/부정은 어떤지 보여준다거나
2) 리뷰에서 추출한 구절(phrase)을 검색 결과에 반영한다거나
3) 분석한 결과를 기업 마케팅이나 내부 프로세스에 적용한다는 얘기가 많다.

결국, 그동안 이론적으로 연구된 내용이 제품으로 개발되어 실제 비지니스에 응용되기 시작할 것이라는 데에 의미가 있는 것 같다. 확실히 이 Sentimental Analysis가 정확하게 제대로 잘 된다고 했을 때 그 응용분야를 상상하는 것은 무척 흥미진진한 일이다. 그때쯤이면 지금 인터넷 쇼핑 사이트에서 “추천 시스템”이나 “관련 상품 보여주기” 기능이 일반화(?)된 것처럼, 리뷰 분석 결과를 마케팅에 활용하는 것이 당연시될 것이고.. (또 그밖의 다른 응용은 미래의 즐거움으로 남겨두기로 하자.)

하지만 아무리 기술이 성숙해지더라도 그것이 어떻게 쓰이는지는 결국 기술의 사용자에게 달렸다. 뉴스와 댓글분석이 가능해졌을 때, 사용자에게 특정 사안에 대한 다양한 관점을 보여주는 용도로 쓰일 수도 있겠지만 또 한편으로는 여론몰이에 활용될 수도 있지 않을까? 기업이 자기네 제품에 대한 안 좋은 리뷰를 발견했을 때, 쓰게 받아들여서 추후 개선 노력을 할 수도 있겠지만 그냥 간단하게 ‘허위사실유포’라는 사유로 검색포털에다가 삭제 요청을 해버릴 수도 있지 않은가?

이제 막 피어나기 시작하는 기술을 바라보며 잠시 핑크빛 꿈에 부풀었다가 결국은 괜히 생각만 많아졌다.