안식휴가를 맞이하여

by SL

지금 다니는 회사는 근속연수 3년마다 안식휴가를 준다. 나는 작년에 받아놓고 계속 미루다가 이번 5월에 쓰기로 했다. 학회 참석 겸 여행을 할 계획이다. 짧지 않은 시간 자리를 비우는지라 업무 공백이 생기지 않도록 문서를 정리하고 동료에게 일 처리를 설명하고 있는데, 그러다 보니 자연스레 지난 4년이 돌아봐진다.

내가 하는 일을 한마디로 요약하면, 검색결과의 품질을 높이기 위한 분석과 모델링(및 그에 필연적으로 따르는 삽질) 정도가 될 것 같다. 정보검색 수업을 들을 때만 해도 검색 랭킹은 TF-IDF와 페이지랭크가 전부인 줄 알았으나, 질의를 날린 사용자를 만족시키기 위해서는 검색어 자체에서부터 문서에 이르기까지 수많은 요소를 분석해서 모형으로 만드는 작업이 필요하다는 것을 알게 됐다.

많이들 얘기하는 “빅데이터” ((이런 표현은 왠지 간지럽지만, 원활한 소통에는 도움이 되니까)) 를 다루고 싶다면 국내에서는 검색서비스 회사도 좋은 선택이다. 하루에만 수천만 명의 사람이 방문하여 검색하고 클릭한 행위 데이터, 또 블로그나 카페를 통해서 작성되는 막대한 양의 문서를 보유한 포털사이트에는 분석할 거리가 쌓여 있다. 데이터 분석가로서는 무척 탐나는 광맥이 아닐 수 없다. (개인적으로 이런 값진 데이터를 사회 차원에서 효과적으로 활용하기 위해서는 오픈 검색 서비스 같은 게 필요하다고 본다.)

경력 정체성?

가끔 나의 직업적 정체성을 스스로에게 물어본다. 학부에서는 전산학을 공부했고, 대학원에서는 HCI 연구실에서 기계학습 관련 수업을 들으며 프로젝트 겸 연구를 했다. 검색이라는 분야에 흥미를 느껴서 첫 직장으로 검색엔진 만드는 회사를 택했고, 실제 데스크톱 검색 소프트웨어 개발을 경험했다. 그리고 두 번째 직장에서는 검색 랭킹 요소 모델링을 하고 있다.

통계학과 기계학습 알고리즘 지식을 필요로 하는 일인데, 그쪽으로 전문적인 훈련을 받은 적은 없다. 컴퓨터 공학을 전공한 개발자라고는 하나 최근 4년 동안 C++ 코드를 컴파일한 기억이 없다. 기껏해야 파이썬으로 간단한 프로토타입을 만들거나 하둡을 이용해서 데이터 처리하는 게 고작이다. 언어는 사고를 반영한다는데, 이제는 프로그래밍 언어보다 통계툴인 SAS가 더 편안하게 느껴지는 것 같다는 고민 아닌 고민도 갖고 있다.

프로그래밍에는 묘한 매력이 있다. 어떤 생각/아이디어를 구체화 혹은 추상화하여 로직을 만들고, 이를 다시 컴퓨터가 해석할 수 있는 코드로 바꾸는 과정은 그 자체만으로도 즐거움을 준다. 그럼에도 내가 직업으로서 프로그래머를 택하지 않은 이유는, 남의 문제를 해결해주는 데 별로 흥미를 느끼지 않는다는 것을 깨달았기 때문이다. 내가 공감하지 않고 가치를 찾지 못하는 문제를 그저 아름답게 해결하는 것만으로는 부족했다.

데이터 분석도 마찬가지다. 기계학습 알고리즘을 공부하면서 깨닫는 즐거움이 있고, 종종 우아한 아이디어에 감탄하기도 하지만, 기계학습 전문가가 목표냐 하면 그건 또 아니다. 프로그래밍과 마찬가지로 나에게 데이터 분석이란 내가 풀고 싶은 문제를 잘 해결하기 위한 수단이다. 그러나 도구이되 단순히 도구만은 아닌, 애정이 가는 무기라고 할까? 마치 삼국지의 관우에게 청룡언월도 같은…;

지금 나에게 해결하고 싶은 문제는 검색이다. 그런데 최근 들어서 그 검색의 범위가 확장되고 있다. 넓은 의미에서 보면 개인화 추천도 검색이고, 문맥 광고 매칭도 검색이다. 실제로도 이런 분야에 내부적으로 쓰이는 기술을 보면 검색과 크게 다르지 않다. 그런 측면에서 지금 하는 일과 사용하는 기술의 의미를 좀더 일반화해서 생각해볼 필요도 있겠다.

나는 무언가를 규정짓거나 경계선을 긋기에는 너무 소심하다. 경력 정체성이 모호한 것도 아마 이 때문일 텐데, 나는 개발자니까 혹은 분석가니까 이건 몰라도/안해도 된다며 넘어가고 싶지 않다. 그것이 필요하고 또 도움이 된다면 분야에 상관없이 해보겠다는 마음가짐으로 이 불확실성을 더 버텨보려고 한다. 이 고집이 지속가능하기 위해서는, 내가 해결하고 싶다고 느끼는 문제에 내가 왜 끌리는지에 대한 고민과, 배우고 싶은 것을 빨리 배울 수 있도록 하는 준비에도 소홀하지 말아야겠지만.