햇빛과 버스운전기사, 그리고 선글라스

by SL

지난 주말에 한가로이 누워서 텔레비젼을 보고 있었습니다. 스타골든벨이라는 프로그램에서 무척 재미난 게임을 하더군요. 어떤 단어가 주어졌을 때 두 사람(갑, 을)이 그와 연관된 단어로 힌트를 줍니다. 그러면 세 번째 사람(병)이 그걸 듣고 원래 단어가 뭐였는지를 맞추는 겁니다. 프로그램에서 한 문제가 나오자 갑이 먼저 ‘햇빛’이라고 힌트를 줍니다. 을이 잠시 고민하다가 꺼낸 단어는 ‘고속버스운전기사’였습니다. 그제서야 출연자는 미소를 지으며 답을 외칩니다. 선글라스!

무척 간단해 보이지만 조금 생각해볼 거리가 있는 게임입니다. ‘선글라스’가 문제로 나왔을 때 힌트로 쓸 만한 단어는 무척 많습니다. 하지만, ‘이거 하나면 완벽해’라고 할 만한 정답 단어는 없죠. 그때 그 아이(갑)가 고른 단어는 ‘햇빛’이었습니다. 그럼 두 번째 힌트는 무엇이 되어야 할까요? ‘눈부심’ 같은 건 별로 좋은 힌트가 아닐 겁니다. ‘햇빛’과 의미적으로 겹치니까요. 반면에 ‘안경’이나 ‘버스운전기사’는 이전 단어와 의미가 중복되지 않으면서도 ‘선글라스’의 다른 특징을 잘 보여주는 단어입니다.

간단한 얘기죠? 그런데 이 게임의 법칙은 검색 결과 랭킹에도 시사하는 바가 있습니다. 사용자가 찾고 싶은 또는 알고 싶어 하는 무언가(information need)를 ‘선글라스’라고 생각해 봅시다. 그러면 검색엔진의 첫 번째 답은 가장 관련이 높은 문서, 이 문제의 경우라면 ‘햇빛’이 되어야 할 겁니다. 그럼 두 번째 답은요? ‘햇빛’을 제외하고 가장 관련이 높은 단어인 ‘눈부심’이면 될까요? 그러면 사용자가 만족할까요? 혹시 ‘안경’이나 ‘버스운전기사’가 필요한 것은 아닐까요?

사람들이 일반적으로 검색엔진에 입력하는 질의어(query)는 무척 짧다고 알려져 있습니다. 그래서 검색 키워드만 보고는 그가 무엇을 찾고 있는지 정확하게 추측하기가 어렵습니다. 또, Persona같은 동음이의어 문제도 있고요.

이렇듯 검색 결과에 다양성이 고려되어야 하는 이유는 충분히 있습니다. 찾아 보니 최근에 나온 것 중에는 이런 논문이 있군요. WSDM이라는 웹검색 관련 학회에 2009년에 나온 것입니다. 아직 읽어보지는 않았지만 제목이 참 간결하니 예쁘네요.