Weka: Explorer와의 첫만남

by SL

Weka(Waikato Environment for Knowledge Analysis)는 뉴질랜드의 University of Waikato에서 개발하여 GNU 라이센스로 공개한 기계학습 환경(A suite for machine learning software)이다. 다른 건 일단 제쳐놓고, 자바로 만들어졌기 때문에 맥 OS에서도 잘 실행된다. 홈페이지에서 프로그램을 받아서 실행하면 아래와 같은 화면이 뜨고, 여기서 Explorer를 클릭하면 된다.

UCI(University of California, Irvine)의 Machine Learning Repository에 가면 다양한 기계학습 테스트 데이터를 구할 수 있다. 여기서 가장 인기 있다는 붓꽃(Iris) 데이터를 받아서 프로그램에 입력했다. 어렵잖게 분류 알고리즘을 실행하고 결과를 확인할 수 있었다. Weka Explorer의 대략적인 사용법을 익히는 데는 10장 남짓한 매뉴얼(영어) 하나면 충분한 것 같다.

다양한 기계학습 알고리즘을 돌려보면서 결과를 쉽게 비교할 수 있다는 게 강점이지만, Weka Explorer에서 제공하는 시각화 도구도 그 못지않은 매력덩어리다. 아래 그림처럼 데이터의 분포를 그래프로 보여주는가 하면,

각 변수 간의 상관관계를 보여주는 Scatter Plot Matrix도 제공된다.

또, 분류 모델 결과를 시각적으로 제공해서 분석 및 튜닝 작업을 도와준다.


이렇게 멋진 프로그램을 여태 모르고 살았다니…