November 14th, 2010
LDA(Latent Dirichlet Allocation)로 검색하다가 아이추판다님 블로그에서 재미난 글을 발견하고 나도 따라 해봤다.
블로그를 시작한 2007년 8월 27일부터 지금까지 작성한 총 136개 포스트를 대상으로 LDA를 돌렸다. 더 이상 직접 구현해 본답시고 삽질하지 않기로 했으므로 인터넷에서 파이썬으로 구현된 LDA 코드를 구했다. 한글 문서를 다룰 때 항상 문제가 되는 어근 추출은 국민대학교 강승식 교수님이 공개한 형태소분석기를 사용해 명사만 뽑는 방식으로 해결했다. 이걸로 준비는 끝, 결과를 살펴보자. [계속 읽기]
2 Comments |
note |
Permalink
Posted by SL
February 9th, 2010
블로그를 구경하다 보니 글에 태그를 다는 이유는 크게 두 가지로 나뉘는 것 같습니다. 주제어나 핵심단어를 선정해서 검색을 용이하게 하는 아주 실용적인 경우가 있는가 하면, 본문과 연결되는 유머나 뒷담화(?)를 써서 탄복을 자아내는 경우도 있습니다. 또 어떤 곳에서는 본문에다가 아주 능청스럽게 거짓말을 쓰고 마지막에 “만우절”이라는 태그를 걸어두기도 하더군요 :) 이렇듯 태그는 활용하기 나름이고 반드시 어떤 식으로 써야 한다는 지침 같은 건 없습니다.
저도 블로그 글에 태그를 답니다.
[계속 읽기]
6 Comments |
thought |
Permalink
Posted by SL
October 6th, 2009
이번에 블로그를 티스토리에서 워드프레스로 옮기면서 구글 커스텀 검색엔진(Google Custom Search Engine: CSE)을 달았습니다. 처음부터 워드프레스 홈페이지의 정식 매뉴얼을 찾아볼 걸 괜히 꼼수 쓰려다가 고생만 했네요.
1. 워드프레스가 내장한 기본 검색 대신 외부 검색 기능 넣기
codex.wordpress.org/Creating_a_Search_Page를 보면 searchform.php라는 템플릿 파일을 만들어서 Search 페이지를 연결하는 법이 나와 있습니다. 쓰고 싶은 외부 검색엔진을 설정한 뒤에 코드를 복사해 넣으면 됩니다. [계속 읽기]
No Comments » |
note |
Permalink
Posted by seunglee