알아가는 즐거움

Learning to think

Tag: personal-data-analysis

책의 관계를 그래프로 그려보자 2: d3.js를 써서

엑셀에서 NodeXL을 써서 그렸던 책의 관계 그래프를 최근에 알게 된 D3.js로 다시 그려보았다. D3.js는 데이터 시각화를 처리하는 자바스크립트 라이브러리로서, 이걸 이용하면 데이터를 표현하는 인터랙티브한 웹페이지를 손쉽게 만들 수 있다. 어떤 그림을 그릴 수 있는지는 여기에서 살펴보자. 이전에 했던 것처럼, 1) 책 데이터에 태그를 단 뒤 2) 책과 태그를 노드로 놓고 3) 그들 간의 관계를 링크로 […]

책의 관계를 그래프로 그려보자

간단하게 그래프를 그려주는 도구를 찾고 있었는데, 우연히 정보시각화 아틀리에 블로그의 글을 보고 NodeXL이라는 엑셀 플러그인을 알게 되었다. (무료) 이런 프로그램을 찾아다닌 이유는 아래와 같은 그림을 그리기 위해서였다. 누르면 커져요

LDA 실습: 이 블로그의 주제는?

LDA(Latent Dirichlet Allocation)로 검색하다가 재미난 글을 발견하고 나도 따라해봤다. 블로그를 시작한 2007년 8월 27일부터 지금까지 작성한 총 136개 포스트를 대상으로 LDA를 돌렸다. 더 이상 직접 구현해 본답시고 삽질하지 않기로 했으므로 인터넷에서 파이썬으로 구현된 LDA 코드를 구했다. 한글 문서를 다룰 때 항상 문제가 되는 어근 추출은 국민대학교 강승식 교수님이 공개한 형태소분석기를 사용해 명사만 뽑는 방식으로 해결했다. […]