국민의 뜻

by SL

기계학습(Machine Learning)의 목적은 결국 예측(Prediction)이다. 예측이라고 해서 미래를 내다본다는 뜻이 아니라, 가령 어떤 사진이 성인 이미지인지를 기계적으로 (사람이 알려주기 전에 미리) 판단한다는 얘기다. 그러기 위해서는 컴퓨터 알고리즘에 성인 이미지를 입력해서 패턴을 학습시켜야 한다. 그래야 기존에 관찰되지 않았던 새로운 데이터가 나타났을 때에도 적절하게 분류해서 처리할 수 있다.

이 과정에서 중요한 것을 두 개만 꼽으라면, 첫 번째는 학습 알고리즘의 효율성과 정확도이다. 배우려는 능력이나 의지가 없는 학생에게는 아무리 좋은 과외교사를 붙여놔도 효과가 없다. 두 번째는 학습 데이터의 양과 질이다. 훈련용 데이터, 예를 들어 각종 이미지와 그 각각 성인성 여부가 주어지면, 기계학습 알고리즘은 이미지의 속성(Feature)을 뽑아내고, 각 속성과 성인성과의 관계를 학습하여, 속성들으로부터 성인성 여부를 판정하는 모델을 만든다. 만약 의미있는 패턴을 발견할 만큼 데이터가 충분하지 않다거나, 혹은 특정 패턴에 편향되어 있으면 아무리 알고리즘이 똑똑해도 배우는 데 한계가 있다. 훈련에 쓰인 정답셋에 오류가 있다면, 학습된 모델은 완전히 잘못된 예측을 할 것이다.

선거는 정치행위에 대한 일종의 정답셋을 만드는 과정이다. 위의 예에 적용하면, 정치인/정당은 개별 사진이며, 공약이나 과거 정치 행적은 그 사진의 속성이다. 그리고, 득표율은 국민들이 사진에 붙인 레이블이다. (성인 이미지인가, 아닌가) 한 가지 차이가 있다면, 정치인/정당은 사진인 동시에 학습하는 알고리즘이라는 점이다. 성인 이미지를 판별하는 알고리즘처럼 정치인도 데이터를 통해 학습한다. 선거 득표율에 가장 큰 영향을 끼치는 속성이 무엇인가? 소속 정당? 공약? 의정활동? 3년 전에 국회에서 던진 찬성 혹은 반대표? 과거에 어떤 삶을 살았으며, 어떤 정책을 지지/반대했는지보다 유명세나 이미지가 득표율에 더 크게 반영된다면, 그런 것이 더 중요하다고 신호를 보내는 것이다. 의도했건 아니건 모델은 정답셋을 최대한 잘 예측하고 그에 적응하려고 하기 때문에 결국 현실도 유권자들이 신호한 대로 될 공산이 크다.

학습 알고리즘을 평가할 때, 정답셋에 명백한 패턴이 있는데 왜 발견하지 못했냐고 타박할 수는 있어도, 입력 데이터에 존재하지 않았던 무언가를 찾아내지 못했다고 나무랄 수는 없다. 게다가, 정답셋은 말 그대로 정답이다. 성인 이미지의 세계를 벗어나 현실로 나오면, 주권자의 선택은 평가의 대상이 아니라 그 자체가 추구해야 할 어떤 목표라고 봐야 하지 않을까? 개개인 나름대로의 합리적인 과정을 통해 나온 판단은 존중받아야 할 의견이지, 비난의 대상이 아니다. 그럴 거면 선거는 왜 하겠는가. (심지어 투표 기권조차도 ‘나보다 더 관심있고 잘 아는 다른 사람의 선택을 믿고 따르겠다’는 의지의 표현으로 볼 수도 있다.)

그럼에도, 기계와 달리 사람은 맹목적으로 정답셋에 피팅(Fitting)하지 않는다. 왜냐하면 인간은 불완전한 존재라서, 정보의 불균형, 인지 부하 등으로 인해 언제나 합리적인 최선의 선택을 내리기는 힘들다는 걸 알기 때문이다. 마치 효율적 시장가설이 대체로 맞다가도 특정 기간 동안 무너져 내린다거나 분식회계로 기업의 주가가 잘못 평가되는 것처럼 말이다. 그래서 정치인들은 정답셋의 생성에 영향을 끼치기 위해 학습 데이터에 새로운 속성을 추가하는가 하면, 기존 속성을 더 자세히 분석한 추가 정보를 제공하기도 한다. 또는, 어떤 속성이 중요하니 가중치를 높여달라고도 한다. (이런 걸 프레임 또는 의제 설정이라고 불러도 될 텐데, 바로 언론이 중요한 이유이다.)

횡설수설하고 있는데, 하고픈 말은 이거다. 1인 1표로 정치인을 뽑는 사회에서 선거 결과는 가장 왜곡없는 민심이며, 연령/세대의 투표율/성향 탓하는 건 의미가 없다. 누가 뭐래도 선거에서 당선된 이들은 그곳 유권자들의 마음에 가장 가까웠던 인물이다. 이것을 부정하고는 말이 안 된다. 그러나 인간은 기계보다 훨씬 유연한 사고 능력을 갖고 있느니 만큼 현재의 입력 데이터에 무조건적으로 적응할 필요도 없다. 다른 사람들의 평가 기준에 동의할 수 없다면, 그 기준에 대한 논의부터 다시 시작하고, 필요하면 설득을 시도하면 된다. 결국 판단은 개개인의 몫이며, 사회는 그에 맞추어질 것이다.