알아가는 즐거움

Learning to think

개인주의자 선언: 어느 법률가의 따뜻한 시선

제목에서 느껴지는 어떤 냉정함과 거리감은 책 초반 몇 장을 지나면서부터 사라진다. 이후에는 마음이 따뜻할 것 같은 법률가가 들려주는 자기 경험담, 크고작은 사회 이슈에 대한 생각들이 남아 있다. 판사가 혼자 조용히 운영하는 블로그를 들여다보는 느낌이랄까. 중간에 나오는 에피소드들을 읽으면서는 가슴이 아팠다가, 코끝이 찡해지는가 하면, 희망의 이유를 발견하기도 했다. 세상에는 유명세를 타지 않아서 그렇지 여전히 좋은 사람들이 많고, 각자의 자리에서 나름의 노력을 하고 있다. 그것만으로도 위로와 격려가 된다. Read the rest of this entry »

모델 예측값 보정하기

데이터 분석을 하다 보면, 내가 모델을 만들기도 하지만, 다른 곳에서 만든 모델의 결과값을 사용해야 할 때도 있다. 남이 만든 모델을 잘 활용하기 위해서는 그 모델이 내놓은 예측값 (점수일 수도 있고 확률일 수도 있고) 의 의미를 파악하고, 필요하면 보정을 해야 한다. 이 보정하는 작업을 캘리브레이션이라고 한다.

쉽게 말해서, 어떤 분류기가 1점 만점의 점수를 내놓는다고 했을 때, 0.8점 받은 케이스를 100개 뜯어보면 실제로 80개가 맞아야 한다. 그래야 믿고 쓸 수 있다. 당연한 것 같지만 Probability calibration에서 Logistic Regression, Naive Bayes, Support Vector Machine의 Reliability Diagram을 보면, 모델의 성격에 따라서 예측값의 분포나 점수대 별 정확도가 차이남을 알 수 있다. 또, 경우에 따라서는 모델 예측값이 만점일 때에도 정확도가 100%에 못 미칠 수 있다. 이런 다양한 상황에서 믿을 만하게 캘리브레이션하는 방법이 필요하다. Read the rest of this entry »

열정은 쓰레기다: 에너지를 모아서 체계적으로 나아가기

생각이 쳇바퀴처럼 돌기만 할 때는 혼자 계속 고민하기보다 똑똑한 사람들은 어떻게 생각하는지를 찾아보는 게 도움이 된다. 지금보다 더 나아지는 길이 없을까 하는 고민은 주기적으로 찾아오는데, 그럴 땐 서점에서 자기계발 분류에 있을 만한 책을 뒤적거린다. 잘 고르면 한두 가지씩은 꼭 건지는 게 있다. 대표적으로 『시스템 관리자를 위한 시간관리 전략』에서 읽은 “결정을 미리 컴파일 해두고 그것을 반복적으로 사용”한다는 개념은 100퍼센트 실천은 못해도 계속 머릿속에 남아 영향력을 발휘하고 있다.

최근에 읽은 『열정은 쓰레기다』는 만화 『딜버트』의 작가가 쓴 책이다. 자극적인 번역 제목 때문에 놓칠 뻔했는데, 시사인에 만화를 연재하는 굽시니스트의 추천사를 보고 읽게 됐다. 원제는 How to Fail at Almost Everything and Still Win Big, 거의 모든 것에서 실패하면서도 여전히 크게 성공하는 법이라는 훨씬 점잖은 제목이다. Read the rest of this entry »

메트릭 스튜디오: 주식 투자의 계량적인 검증, 그리고 알고리즘

주식 시장은 넓다. 한쪽에서는 금융수학자들이 만든 알고리즘이 자동으로 주식을 매매하고 있지만, 여전히 TV 채널을 돌리면 주식전문가가 한 자리 잡고 앉아서 종목을 분석하고 있다. 또 한편에는 주가에는 이미 모든 정보가 반영되어 있기 때문에 시장 평균 이상의 수익을 꾸준히 얻을 수는 없다는 효율적 시장 가설을 신봉하는 사람들이 있다. 도대체 누구 말이 맞는 걸까? Read the rest of this entry »

고수의 생각법: 어디에나 적용되는

컴퓨터 알고리즘이 (아직) 사람을 넘어서지 못한 게임 바둑, 그 바둑의 고수 조훈현이 들려주는 생각법이라니, 관심이 가지 않을 수가 없다.

세계 정상급 프로 바둑기사에게서 어떤 바둑 교육을 받았는지, 타이틀을 건 대결을 하는 동안 무슨 생각을 하는지, 1등의 자리에 군림하다가 다른 사람도 아닌 제자에게 지고 왕좌에서 내려올 때 어떤 기분이었는지, 한국과 일본의 바둑 스타일이 어떻게 다른지 등의 얘기를 들을 기회는 흔치 않다. 바둑이라는 주제는 낯설지만 그만큼 에피소드는 더 흥미롭다. 게다가 저자가 경험에서 이끌어내는 통찰은 바둑에 한정되지 않는 일반성을 가졌다.

책에서 공감이 가는 문구를 몇 개 골라봤다. Read the rest of this entry »

콘텐츠 후원 서비스 Flattr

인터넷을 쓰는 사람들이 매달 정해진 금액의 돈을 내서 콘텐츠 제작자들을 후원하면 어떻게 될까?
정해진 액수 만큼 돈이 나가는 대신 사용자는 그 돈을 어떤 콘텐츠, 어떤 제작자에게 줄지 결정할 수 있다면?

클릭 낚시와 허위 리뷰가 횡횡하는 이유(중 하나)는 결국 사람들이 좋은 콘텐츠에 돈을 쓰지 않고, 쓰려고 해도 방법이 마땅치 않기 때문이라는 생각이 든다. 독자보다는 스폰서(?)를 만족시키도록 콘텐츠를 만드는 사람의 인센티브를 왜곡시키는 것이다. 하지만, 소비자가 소액이라도 실제로 돈을 내고 자신이 즐겼거나 도움을 받은 콘텐츠 제작자를 후원하기 시작하면 그런 구조에 변화가 생기지 않을까?

최근에 딱 이런 후원 모델을 가진 인터넷 서비스를 알게 됐다. Read the rest of this entry »