'마이크로소프트 tell me'에 해당하는 글 1건

구글이 음성 인식 기술로 만든 음성검색 서비스를 App Store를 통해 무료로 배포했다. (관련 포스트 보기)

구글은 유저들이 음성 검색을 통해 위치 정보(현재 위치에서 가까운 음식점 찾기 등)나 맵 정보등을 찾기를 희망하며 향후에 이러한 정보 검색에 광고를 삽입하여 사업화할 가능성이 커보인다.


마이크로소프트도 올해 초 TellMe라는 음성인식 기술로 블랙베리에 음성 검색 서비스를 제공한 바 있다.  야후도 on search with voice 라는 유사 서비스를 제공중이다.

(마이크로스포트 음성인식 관련 포스트보기)


구글의 음성 검색이 선발 업체들과 비교하여 우월한 점은 정확성에 있다고 한다.  유저의 음성을 정확히 인식하여 데이터베이스와 연결시켜 검색 결과를 보여주는 기술이고 보면 기술의 핵심은 사람의 각기 다른 음성을 읽어내는 능력일 것이다.

 

음성 인식을 UI로 활용하는 사례는 많다.  모바일에는 음성인식으로 주소록을 찾아 번호를 연결해주는 서비스가 있고 고속도로 교통정보를 걸어 음성으로 고속도로 통행 상태를 확인하기도 한다.  주로 모바일이나 전화에 음성인식 기술이 주로 사용되고 있다.  

 

음성 인식을 음성 검색으로 활용하려는 구글과 마이크로소프트의 노력은 모바일의 치명적인 단점은 UX 측면의 개선에서 시작된 것이다.  스마트폰계열의 터치 스크린 인터페이스라고 하여도 검색어를 입력하기 까지에는 몇번의 단계를 거쳐야 하며 검색어를 입력하기 위한 모바일 자판 터치까지에는 몇초의 시간이 소요된다.  모바일의 화면 크기나 단계대로 꾹꾹 눌러주어야하는 UX의 단점이 음성 검색의 적용 이유가 된것이다.

 

그런데 무엇보다 음성검색의 핵심은 음성 인식의 정확성일 것이다.  사람이 표현하는 음역대역과 발음의 명료함이 모두 다르다.  특히 억양과 액센트는 영어권에서는 출신 국가별로 다르다.  구글이나 마이크로소프트가 각기 쓰고 있는 검색 엔진의 기술력은 이를 매칭하는데 주력할 것이다.  
특히 모바일에서 음성 검색을 하기위해서는 단어가 아니라 문장을 이야기해야 한다.  “What is the best pizza restaurant in New York?” 에러를 줄이기 위해 “best pizza restaurant New york” 라고 줄일 수도 있겠다.  과연 이정도의 문장을 얼마나 정확하게 인식하느냐가 기술력의 차이일 것이다.

 

음성 인터페이스는 모바일 컴퓨팅의 혁신을 가져올 수 있을것으로 보인다.  특히 구글의 음성 검색은 검색과 광고를 연결시키는 키가 될 수 있을 것이며 무엇보다 모바일의 검색 트래픽을 증가시키는데 큰 역할을 할 것으로 보인다.

 

이러한 음성 검색 기술이 유용하게 쓰일 분야는 TV도 빼 놓을 수 없다.

디지털 방송의 VOD 영화 한편을 보기 위해서는 리모컨 키를 최소한 3번 이상 눌러야 한다. 만일 리모컨에 음성 검색 기능이 있다면 단순한 단어 만으로도 바로 원하는 콘텐츠를 호출 해줄 수 있을 것이다. 

“MBC”라고 리모컨에 외치면 바로 MBC 채널로 이동한다면..

(단순 음성 인식을 통해 채널 이동이 되는 음성 인식 리모컨은 상용화되어있다)

 

TV음성 인식과 유사한 Window Vista Media Center의 음성 인식 UI


스파이더맨이라는 영화를 외치면 VOD 3만편 목록 중에서 스파이더맨을 찾아 VOD를 시청할 것이지를 묻는 마지막 구매 페이지를 TV에 열어준다면..

(이는 유저의 음성을 셋톱박스가 전달받아 VOD 서버로 보내 데이터베이스와 매칭을 하여 결과를 다시 셋톱박스에 피드백해주어야 가능하다)

 

TV 콘텐츠의 메타데이터는 기본적으로 장르를 분류되어 있다.  여기에 태그 방식의 키워드를 추가하여 분류한다면 특정 문장의 음성으로도 검색결과의 정확도를 높일 수 있지 않을까.

 

유저에게 획기적인 편리함을 제공할만한 이런 아이디어가 왜 TV로 옮겨지지 못하는가?


사업자간 이해가 모두 다르기 때문이다.  가전사는 음성 인식 기술로 TV 판매가 활성화될지 분명치 않고 케이블이나 IPTV사업자들은 아직까지 음성 인식의 정확도를 신뢰할 수 없고 고객의 클레임을 모두 받아낼 자신이 없다.  또한 리모컨 가격이 상승하므로 이에 대한 부담을 원치를 않는다.


구글이 무료로 음성 검색 소프트웨어를 배포하는 이유는 그것이 만들어낼 광고 수익성의 기대에 있다.  TV 분야의 플레이어들도 적극적으로 사업성에 대한 추가적인 아디이어를 발굴하여 음성 인식 기술을 리모컨으로 옮겨야 할것이다.

신고

WRITTEN BY
jeremy797
제레미는 '업'으로는 미디어로 먹고살며 IT의 미래를 고민한다. '생'으로는 여행, 운동, 걷기, 캠핑, 커피, 독서 등등을 즐긴다. 제레미의 '생각저장소' 는 '업'에 관한 고민과 소소한 일상을 모두 담고있다. jeremy797@gmail.com / twitter : @comi10

트랙백  12 , 댓글 하나 달렸습니다.
  1. How are you! Long time no see. I left Korea a month.
    I'm fne. Everything is very good(heath,food,friends..).
    Except weather. The weather has been hot and very windy. So, I'm confused everymornig on how to dress.
    You know, A dress is very important for me. ^^
    Now,,I'm going to go my class. Take care. Bye for now~
secret