December 24th, 2011
바야흐로 빅데이터의 시대라고 한다. 폭증하는 정보 속에서 가치있는 것을 찾아내는 일은 점점 더 중요해지고 있으며, 이를 위해 가능한 모든 것을 정량화하려는 시도 또한 계속되고 있다. 정보검색 연구자들은 문서의 품질을 자동으로 평가하기 위한 알고리즘을 찾아 분투하고 있는데, 현재까지 가장 성공적이라고 알려진 것은 웹페이지 간의 링크 구조를 분석하는 방법이다. 그런 방식의 선구자 격인 알고리즘이 바로 HITS(Hyperlink-Induced Topic Search)이며, 이를 개발한 사람은 현재 코넬대학교에 교수로 있는 존 클라인버그다.
최근 그의 연구를 보면 관심사가 사회연결망(소셜 네트워크)에 집중되어 있는 듯하다. 하지만 테마는 여전히 네트워크 분석이며, 도메인만 웹페이지에서 사람으로 바뀐 것이다. 근래에 발표한 연구 중에서는 사람 간의 권력 차이(power difference)를 측정하려는 시도가 눈에 띈다. [계속 읽기]
No Comments » |
paper, web |
Permalink
Posted by SL
December 16th, 2011
얼굴 인식 기술을 다양한 분야에 활용한 사례가 보여서 소개한다.
얼굴 인식 기술을 활용한 광고 기법 하나. 라스베가스의 어느 카지노에는 그 앞에 가면 자동으로 고객에게 맞는 레스토랑을 추천해주는 서비스가 있다고 한다. 인텔의 Anonymous Video Analytics 기술을 사용한 것인데, 그 사람의 얼굴을 보고 성별과 나이대를 추정해서 그에 어울리는 곳을 추천해주는 것이다. 젊은 여성과 중년 남성의 취향이 같지는 않을 테니. 하나 더 재미있는 것은 센서를 써서 그 사람이 광고를 보고있는지를 판단하는 기능인데, 여러 사람이 있더라도 광고 디스플레이를 보고 있는 사람에게 타겟팅할 수 있겠구나. [계속 읽기]
No Comments » |
web |
Permalink
Posted by SL
December 16th, 2011
검색 관련 기사 두 개가 눈에 띄었다.
올해 2월 구글에서 Content Farm(우리가 보통 어뷰징이라고 부르는 것인데, 광고 수익 같은 상업적 이득을 노리고 검색엔진으로부터 자기네 사이트로의 유입을 최대화하려는 사이트를 일컫는다. 문서의 품질로 승부하는 대신 갖가지 꼼수를 동원하기도 한다.)과의 전쟁을 선포했다. 1년 가까이 지난 후 그 효과를 간단히 분석해보니 구글이 일단은 승리한 것 같다는 얘기다. Content Farm들은 검색 엔진으로부터의 유입 감소를 체감하고 있으며, 관련된 회사 중에는 주가가 곤두박질친 곳도 있다고 한다. 또, 50개 쿼리 샘플의 상위 검색 결과에서 상업적인 컨텐츠는 줄어들고 품질 높은 문서가 늘어났다고도 한다. 쿼리 50개의 결과만 보고 결론을 내리기는 힘들지만, 구글에서 품질 낮은 사이트를 걸러내야겠다고 작정했다면 못했을 것 같지는 않다. [계속 읽기]
No Comments » |
web |
Permalink
Posted by SL