• Home
  • About
  • Bookmark
  • Library
  • Search
  •  

    LDA 실습: 이 블로그의 주제는?

    November 14th, 2010

    LDA(Latent Dirichlet Allocation)로 검색하다가 아이추판다님 블로그에서 재미난 글을 발견하고 나도 따라 해봤다.

    블로그를 시작한 2007년 8월 27일부터 지금까지 작성한 총 136개 포스트를 대상으로 LDA를 돌렸다. 더 이상 직접 구현해 본답시고 삽질하지 않기로 했으므로 인터넷에서 파이썬으로 구현된 LDA 코드를 구했다. 한글 문서를 다룰 때 항상 문제가 되는 어근 추출은 국민대학교 강승식 교수님이 공개한 형태소분석기를 사용해 명사만 뽑는 방식으로 해결했다. 이걸로 준비는 끝, 결과를 살펴보자. [계속 읽기]


    LDA(Latent Dirichlet Allocation): 겉핥기

    November 7th, 2010

    배경 설명

    정보검색 등에서 문서 모델링은 중요한 의미가 있다. 위험을 무릅쓰고 간단하게 말하자면, 문서 모델링이란 개별 문서, 더 나아가 코퍼스(=문서 컬렉션)를 표현하는 방법을 찾는 것이다. 다양한 활용분야가 있겠지만 주제 분류나 문서 간 유사도 계산 등에 많이 쓰인다. [계속 읽기]


    생각을 넓혀주는 독서법: 앗, 이건 논문 읽는법이잖아!

    October 12th, 2010

    요즘 들어서 난독증이 의심되는 나에게 스스로 선물한 책이다. 소감을 쓰기에 앞서, <How to Read a Book>이라는 점잖은 원제를 <생각을 넓혀주는 독서법>이라는 허접한 자기계발서풍의 제목으로 바꿔버린 센스에 경의를 표한다. 덕분에 밖에서 읽을 때면 자꾸 얼굴이 화끈거려서 손으로 표지를 가려야 했다.

    책을 읽는 데에는 흥미 유발이나 정보 수집 등 다양한 이유가 있겠지만 이 책은 그중에서도 읽기를 통해 이해력을 증진하고 싶은 사람을 위한 길잡이를 자처한다. 저자는 책 읽기 수준을 4가지로 구분하는데, 가장 중점적으로 다루는 것은 3수준의 ‘분석하며 읽기’다. 글의 내용을 잘 이해하기 위한 8개의 원칙과 각각의 실천 지침을 자세히 설명하고 있다. [계속 읽기]


    적인걸- 측천무후의 비밀

    October 9th, 2010

    책 사줘서 고맙다고 알라딘이 준 쿠폰 + 심야 할인 + 카드 할인의 삼단 콤보로 1,500원에 영화 <적인걸: 측천무후의 비밀>, 그것도 디지털 버전을 보고 왔다. 극장 가는 길에 사 먹은 감자튀김과 같은 가격이다. 2시간 5분의 긴 상영 시간에도 불구하고 인물의 행동 동기를 이해하고 감정 변화에 빠져들기에는 설명이 부족한 감이 있지만, 그래도 무리 없이 잘 짜인 스토리 덕분에 재미있게 볼 수 있는 영화였다. 눈에 너무 힘을 준 것 같기는 하지만 ‘정아’ 역의, 탤런트 박선영과 닮은 이빙빙에 눈이 자꾸 자동으로 초점을 맞추더라.

    PS. 적인걸이 실존 인물이라는 걸 나중에 검색해 보고서야 알았다. 물론, 영화에 나오는 것처럼 수사관은 아니고 판사(?)를 거쳐 재상에까지 오른 정치가이며, 측천무후의 총애를 받았다고 한다.


    파인만의 엉뚱 발랄한 컴퓨터 강의: 계산에 대한 물리학 강의

    October 6th, 2010

    파인만이라는 이름의 친숙함과 ‘엉뚱 발랄’이라는 단어가 풍기는 가벼움에 현혹되어 이 책을 구입하지 않았기를 바란다. <Lectures on Computation>이라는 원제에서 드러나듯이, 일반인을 대상으로 한 책이 아니라 캘리포니아 공과대학(칼텍) 학생들에게 했던 강의 내용을 묶은 것이다. 절대 쉽지 않으니 각오를 단단히 하자. 책의 내용은 크게 두 부분으로 나눌 수 있다. 일반 전산학과 커리큘럼에도 포함되는 계산이론을 다루는 전반부와 계산의 물리적 한계를 다루는 후반부다. [계속 읽기]


    Page 9 of 35« First...7891011...2030...Last »