• Home
  • About
  • Bookmark
  • Library
  • Search
  •  

    국민의 뜻

    April 12th, 2012

    기계학습(Machine Learning)의 목적은 결국 예측(Prediction)이다. 예측이라고 해서 미래를 내다본다는 뜻이 아니라, 가령 어떤 사진이 성인 이미지인지를 기계적으로 (사람이 알려주기 전에 미리) 판단한다는 얘기다. 그러기 위해서는 컴퓨터 알고리즘에 성인 이미지를 입력해서 패턴을 학습시켜야 한다. 그래야 기존에 관찰되지 않았던 새로운 데이터가 나타났을 때에도 적절하게 분류해서 처리할 수 있다.

    이 과정에서 중요한 것을 두 개만 꼽으라면, 첫 번째는 학습 알고리즘의 효율성과 정확도이다. 배우려는 능력이나 의지가 없는 학생에게는 아무리 좋은 과외교사를 붙여놔도 효과가 없다. 두 번째는 학습 데이터의 양과 질이다. 훈련용 데이터, 예를 들어 각종 이미지와 그 각각 성인성 여부가 주어지면, 기계학습 알고리즘은 이미지의 속성(Feature)을 뽑아내고, 각 속성과 성인성과의 관계를 학습하여, 속성들으로부터 성인성 여부를 판정하는 모델을 만든다. 만약 의미있는 패턴을 발견할 만큼 데이터가 충분하지 않다거나, 혹은 특정 패턴에 편향되어 있으면 아무리 알고리즘이 똑똑해도 배우는 데 한계가 있다. 훈련에 쓰인 정답셋에 오류가 있다면, 학습된 모델은 완전히 잘못된 예측을 할 것이다. [계속 읽기]


    스팸 댓글과 홍보성 가짜 리뷰 판별

    April 6th, 2012

    이곳은 댓글이 거의 달지지 않는 블로그지만, 스팸 댓글마저 없는 것은 아니다. 매일 아침 워드프레스의 Akismet 플러그인이 격리해놓은 스팸들을 지우며 정갈한 마음으로 하루를 시작한다. 그러다 우연히 어느 블로그의 글을 읽고 생각했다. 엘리자(Eliza)에서 썼던 것과 비슷한 방법으로 본문과 관련된 척하는 글, 거기다가 각종 자연어처리 기술을 적용해서 그럴 듯하게 꾸며낸 글을 필터링할 수 있을까? [계속 읽기]


    웹 항해일지: 얼굴 인식 기술 활용

    December 16th, 2011

    얼굴 인식 기술을 다양한 분야에 활용한 사례가 보여서 소개한다.

    Face Recognition Technology Comes to Malls and Nightclubs

    얼굴 인식 기술을 활용한 광고 기법 하나. 라스베가스의 어느 카지노에는 그 앞에 가면 자동으로 고객에게 맞는 레스토랑을 추천해주는 서비스가 있다고 한다. 인텔의 Anonymous Video Analytics 기술을 사용한 것인데, 그 사람의 얼굴을 보고 성별과 나이대를 추정해서 그에 어울리는 곳을 추천해주는 것이다. 젊은 여성과 중년 남성의 취향이 같지는 않을 테니. 하나 더 재미있는 것은 센서를 써서 그 사람이 광고를 보고있는지를 판단하는 기능인데, 여러 사람이 있더라도 광고 디스플레이를 보고 있는 사람에게 타겟팅할 수 있겠구나. [계속 읽기]


    음성에 실린 감정 분석 연구

    December 9th, 2011

    기계적으로 말을 알아듣는 것에 만족하지 않고, 목소리에 담긴 감정까지 분석해서 활용하려는 다양한 연구들이 뉴욕타임스에 소개되었다. 스피드 미팅1에서 각 사람의 목소리를 분석해서 그가 호의적인지 아니면 시시껄렁한 사람인지(friendliness and flirtatiousness) 분석하려는 연구가 있고, 또 목소리만 가지고 그 사람이 취했는지를 판별하려는 연구가 있다. 화난 목소리인지를 판단하는 것은 조금 쉬울 것 같기도 한데, 이 사람이 지금 개그를 날리고 있는지 알기는 어렵다고 한다 :) [계속 읽기]

    1. 4-minute speed-dating session, CSI에서도 본 것 같은데, 남녀 여러 명이 짧은 시간 돌아가면서 얘기하고 최종 파트너를 정하는 그런 미팅인 모양 []

    테크놀러지리뷰에 올라온 인공지능 관련 기사들

    December 2nd, 2011

    테크놀러지리뷰 사이트에서 인공지능 관련 기사를 몇 개 발견했다. 나로서는 도저히 안 읽을 수 없게 만드는 제목들이다.

    Google and Microsoft Talk Artificial Intelligence

    구글의 피터 노빅(Peter Norvig)과 마이크로소프트의 에릭 호비츠(Eric Horvitz)에게 인공지능 관련 질문을 던지고 두 사람이 대답한 내용을 기사에 간단히 정리해놓았다. 두 명이 함께 인터뷰를 하다보니 일부러 다른 사람이 말한 내용과 중복되지 않게 얘기한 것 같기는 한데, 암튼 학습에 사용할 레이블링된 데이터가 없는 경우에 기계학습이 어렵지 않냐는 질문에, 한 사람은 Active Learning을, 다른 한 사람은 Reinforcement Learning을 해결책으로 제시한다. 최근에 본 인공지능 데모 중에 인상깊었던 것을 물으니, 한 사람은 Unsupervised Learning을 (구체적으로는 말하지 않았다. 근데 이것도 학습 데이터 부족에 대한 대안이 될 수 있겠다.), 다른 사람은 Apprentice Learning (learning by example)을 언급하면서, 조종사를 관찰함으로써 스스로 비행하는 법을 배우는 헬리콥터를 예로 든다. [계속 읽기]


    Page 1 of 41234