November 14th, 2010
LDA(Latent Dirichlet Allocation)로 검색하다가 아이추판다님 블로그에서 재미난 글을 발견하고 나도 따라 해봤다.
블로그를 시작한 2007년 8월 27일부터 지금까지 작성한 총 136개 포스트를 대상으로 LDA를 돌렸다. 더 이상 직접 구현해 본답시고 삽질하지 않기로 했으므로 인터넷에서 파이썬으로 구현된 LDA 코드를 구했다. 한글 문서를 다룰 때 항상 문제가 되는 어근 추출은 국민대학교 강승식 교수님이 공개한 형태소분석기를 사용해 명사만 뽑는 방식으로 해결했다. 이걸로 준비는 끝, 결과를 살펴보자. [계속 읽기]
2 Comments |
note |
Permalink
Posted by SL
August 5th, 2010
Weka(Waikato Environment for Knowledge Analysis)는 뉴질랜드의 University of Waikato에서 개발하여 GNU 라이센스로 공개한 기계학습 환경(A suite for machine learning software)이다. 다른 건 일단 제쳐놓고, 자바로 만들어졌기 때문에 맥 OS에서도 잘 실행된다. 홈페이지에서 프로그램을 받아서 실행하면 아래와 같은 화면이 뜨고, 여기서 Explorer를 클릭하면 된다.

UCI(University of California, Irvine)의 Machine Learning Repository에 가면 다양한 기계학습 테스트 데이터를 구할 수 있다. [계속 읽기]
No Comments » |
note |
Permalink
Posted by SL