November 14th, 2010
LDA(Latent Dirichlet Allocation)로 검색하다가 아이추판다님 블로그에서 재미난 글을 발견하고 나도 따라 해봤다.
블로그를 시작한 2007년 8월 27일부터 지금까지 작성한 총 136개 포스트를 대상으로 LDA를 돌렸다. 더 이상 직접 구현해 본답시고 삽질하지 않기로 했으므로 인터넷에서 파이썬으로 구현된 LDA 코드를 구했다. 한글 문서를 다룰 때 항상 문제가 되는 어근 추출은 국민대학교 강승식 교수님이 공개한 형태소분석기를 사용해 명사만 뽑는 방식으로 해결했다. 이걸로 준비는 끝, 결과를 살펴보자. [계속 읽기]
2 Comments |
note |
Permalink
Posted by SL
October 12th, 2010
요즘 들어서 난독증이 의심되는 나에게 스스로 선물한 책이다. 소감을 쓰기에 앞서, <How to Read a Book>이라는 점잖은 원제를 <생각을 넓혀주는 독서법>이라는 허접한 자기계발서풍의 제목으로 바꿔버린 센스에 경의를 표한다. 덕분에 밖에서 읽을 때면 자꾸 얼굴이 화끈거려서 손으로 표지를 가려야 했다.
책을 읽는 데에는 흥미 유발이나 정보 수집 등 다양한 이유가 있겠지만 이 책은 그중에서도 읽기를 통해 이해력을 증진하고 싶은 사람을 위한 길잡이를 자처한다. 저자는 책 읽기 수준을 4가지로 구분하는데, 가장 중점적으로 다루는 것은 3수준의 ‘분석하며 읽기’다. 글의 내용을 잘 이해하기 위한 8개의 원칙과 각각의 실천 지침을 자세히 설명하고 있다. [계속 읽기]
8 Comments |
book |
Permalink
Posted by SL