알아가는 즐거움

Learning to think

바이올리니스트의 엄지: DNA로 엮은 이야기

모든 사람이 인간에 대한 저마다의 관점이 있듯이 학문 분야에 따라서도 인간을 바라보는 관점이나 관심을 갖는 각도가 다를 것이다. 경제학에서는 인센티브에 반응하여 합리적인 선택을 추구하는 면을 조명하고, 사람이 쉽게 하는 일을 기계에게 가르치려는 분야에서는 도대체 사람은 그 일을 어떻게 하는지 메커니즘을 규명하는 데 관심을 가지기도 한다. 그때의 인간은 섬세하고 복잡하면서도 때로는 과감한 일종의 컴퓨터처럼 보일 수 있다. 그렇다면 생물학 그중에서도 특히 DNA와 유전자를 연구하는 관점에서 바라보는 인간은 어떤 모습일까? 어떤 흥미로운 이야기를 갖고 있을까? Read the rest of this entry »

계량경제학을 읽으면서 2

지난 글에 이어서 선형 회귀분석을 이용해 경제 변수 사이의 관계를 분석하고 있다. 그런데 변수 값의 변화량이 동일하다고 해도 그것이 갖는 의미와 효과는 상황에 따라 다를 수 있다. 가령 소득과 삶의 만족도의 관계를 연구할 때 원래 소득이 100만원일 때와 1000만원일 때 100만원의 증가를 동일하게 취급해도 될까? 안 된다면 어떻게 해야 할까? Read the rest of this entry »

계량경제학을 읽으면서 1

계량경제학에 대한 책을 읽고 있다. 경제 요소 간의 관계를 분석해서 한 요소 값의 변화가 어떤 영향을 끼치는지를 정량적으로 추정하는 것이 목표인데, 여기서 말하는 경제 요소란 학업 성취도나 범죄율, 집값 등을 포괄해서 가리킨다. 통계적인 도구로는 선형회귀분석을 이용한다. 회귀분석은 기계학습 분야에서도 쓰는 기본적인 도구지만 그쪽의 맥락에서 공부했을 때와는 조금 다른 느낌이 들었다. 예측 정확도 자체보다 개별 요소의 효과 측정과 의미 해석에 중점을 두고 있다는 점에서 배울 거리가 많았다.

개발도상국에서 농민의 살충제 사용이 가구의 의료비 지출에 미치는 영향을 연구한다고 생각해보자. 살충제 사용 여부와 의료비 데이터만 구해다가 회귀분석을 하면 될까? Read the rest of this entry »

R 노트북을 써보았다: 간단한 PCA

RStudio 1.0이 나오면서 정식으로 포함된 R 노트북을 써볼 겸 간단하게 주성분분석(PCA)을 돌려보았다. 세계 국가의 인구, 영토, GDP, 1인당 GDP 데이터에서 주성분을 뽑으면 무엇이 나올까? Read the rest of this entry »

마스터 알고리즘: 기계학습의 원리와 미래

페드로 도밍고스 교수의 『마스터 알고리즘』(원제: The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World)을 재미있게 읽었다. 저자는 자신이 “마스터 알고리즘”이라고 부르는 궁극의 기계학습 알고리즘을 만들기 위해 현존하는 접근 방식을 통합할 수 있는 방향을 제시하고, 그것이 실제로 구현되었을 때 펼쳐질 미래의 모습을 다소 낙관적인 관점에서 그려놓았다. 이 책을 읽고 얻을 수 있는 세 가지를 정리해 보았다. Read the rest of this entry »

함수형 사고

최근에 나온 번역서를 읽었는데, 찾아보니 원서는 2년 전인 2014년에 출간되었다.

명령형 방식으로 구현하던 로직, 디자인 패턴을 활용하던 설계를 함수형 프로그래밍에서는 어떻게 접근할 수 있는지 보여준다. 책의 제목이 함수형 언어가 아니라 함수형 사고라는 데서 짐작하겠지만, 언어 자체보다는 생각하는 방식의 전환과 확장에 중점을 둔다. 그래서 예제도 스칼라/그루비/클로저(Clojure)같은 함수형 프로그래밍 언어 뿐 아니라 자바8이나 함수형 자바로 구현한 코드가 나온다. Read the rest of this entry »