구글애드센스




2011/10/18 19:25

아이폰 음성인식 siri, 생각보다 쓸만하지 않다 애플/아이폰/아이패드





아이폰4s가 본격 출시되었습니다. 그리고 예상했던 대로의 레포트...가 계속 올라오고 있는 중입니다. 다름 아닌 애플에서 새로 아이폰에 심어놓은 음성인식 비서 프로그램, siri에 대한 레포트입니다. 아이폰4s의 가장 큰 차별점인데, 데모 영상에서 보여줬던 것만큼 뛰어나지는 않다고 합니다. are technica에 올라온 리뷰(링크)에 따르면 siri의 장단점은 아래와 같습니다.


■ 아이폰 siri의 장점

  • 생각보다 억양을 가리지 않고 그럭저럭 인식한다
  • 음성을 통한 문자 입력도 잘되는 편이다.
  • 간단한 정보를 찾기에 좋다.
  • 알람을 간단히 설정하기에 정말 좋다.


전체적으로 siri의 음성인식 기능은 생각보다는 훌륭하다고 합니다. 그래서 처음 써보는 사람들은 다들 신기하게 생각한다고 하네요. 예를 들어 "설렁탕의 칼로리는 얼마지?"라던가 "가까운 곳에 있는 주유소의 위치는?"이란 문장 정도는 쉽게 인식하고, 웹 검색을 통해 보여준다거나, 지도상의 가까운 주유소의 위치를 표시해준다거나-하는 일이 가능한 것으로 보입니다.


▲ 간단한 질문에는 제대로 대답하는 siri


때문에 사람들에게 예전에 인공지능 프로그램(맥스라던가.. 심심이라던가..)을 처음 만나봤을때의 느낌을 그대로 전해주고 있습니다. 목소리를 다른 사람 목소리로 바꿀 수 없는지 연구하는 사람도 벌써 나타났구요. 다만 단점도 예상했던대로 나타났습니다.

■ 아이폰 siri의 단점

  • 시끄러운 곳에선 인식 결과가 좋지 않다.
  • 복잡한 문장을 말하면 제대로 인식하지 못한다.
  • 몇몇 단어는 제대로 인식하지 못한다.
  • 네트웍 상태가 좋지 않으면 인식하지 못한다.


예를 들어 시저-라는 친구가 있다고 칩시다. 그런데 siri에게 시저-라고 발음했을 경우, 시스터-라고 인식할 경우가 80%는 된다고 합니다. 또 이런 말을 했다고 칩시다.

"Send a text to Jason, Clint, Sam, and Lee saying we're having dinner at Silver Cloud(제이슨, 클린트, 샘과 리에게 문자 보내서 우리는 실버 클라우드에서 저녁먹고 있는 중이라고 얘기해)"

보통 사람이라면 못이해할 것이 없는 문장이지만, siri는 이렇게 반응합니다. 그러니까, jason 한 명에게 이런 문자를 보내겠다고 합니다.

"Clint, Sam, and Lee saying we're having dinner at Silver Cloud"

이런 siri의 반응을 본 사람이 당황해서 다시 이런 명령을 내립니다.

"Edit message to say: we're at Silver Cloud and you should come find us(메세지 수정 : 우린 실버 클라우드에 있어. 와서 우리를 찾아."

그럼 siri는 다시 이렇게 반응합니다.

"Clint Sam and Lee saying we're having dinner at Silver Cloud to say we're at Silver Cloud and you should come find us."

그 다음, 문자 받는 사람 명단을 주소록에서 찾으라-라고 명령한다고 칩시다. 그때도 siri는 sam과(and) lee 를 찾지 못합니다. 엉뚱하게도 주소록에 있는 "andlee"를 찾고 있습니다. 이쯤되면 보통 사람은 그냥 소리치게 됩니다. "그냥 내가 할래~~~!!!!"



사실 이런 과정은, 대부분의 인공지능-프로그램을 대할 때 우리가 항상 겪는 과정이기도 합니다. 처음에는 반응한다는 것에 신기해 하다가, 이것저것 얘기를 해보다가, 결국 할 수 있는 대화가 얼마없음을 깨닫고 실망하게 되는 과정.

물론 예전 프로그램에 비하면 siri는 많이 발전한 것은 사실입니다. 하지만 결국 한계가 있고, 기존 음성인식 기술이 많이 이용되지 못하고 있던 이유에서 크게 벗어나 있지는 않습니다. 다시 말해, siri가 아직까지 '베타'라는 딱지를 떼지 못하고 있는 이유가 바로 여기에 있는 셈입니다.

한번에 제대로 인식되지 않으면 짜증을 불러오고, 재미로 몇번 써보다가 결국 '확실한' 텍스트 입력으로 돌아오게 됩니다. 불완전한 반응은 사람을 불안하게 만들거든요. 그리고 사람은 생각보다, 그 잠깐의 딜레이를 잘 견뎌줄만큼 느긋하지 않습니다.

...게다가 다른 음성인식앱들처럼, siri도 네트워크 접속이 불량하면 쓸모가 없기 때문에(시스템상 음성인식 데이터는 서버에 있고, 아이폰은 단순히 입력받은 데이터를 처리하는 단말기에 불과합니다. 네이버의 음악 인식 기능을 생각하시면 될 듯), 한국처럼 3G망이 불안한 나라에서는 이 점이 또 문제가 됩니다. 결국 아직까진, 그렇게 열정적으로 siri에 대해서 열광하거나 기대할 필요가 없는 셈입니다.



사실 어떤 면에서 siri는 이렇게 실패해야 맞습니다. 이런 앱들이 정말 사람처럼 반응하게 되면, 그건 그것대로 정말 위험한 것이 되거든요. 이것이 기계다-라고 느껴야 귀여운 맛도 느끼는 거지, 정말 사람처럼 행세하면 그건 공포가 될 겁니다. 여기까지는 안가더라도, 이렇게 음성을 주고 받으면서 반응하는 것은 기계에 예전보다 더한 '애착'을 느끼게 만들어줄 우려가 있습니다. 파티마도 아니면서...

그래도 베이스는 이미 깔려있다고 봅니다. 이제 음성인식기술은 예전보다 훨씬 더 진화해 나갈 것 같아요. 데모 영상에 나온 것처럼 언제 어디서나 편리한 비서가 되어주진 못하겠지만, 보조 입력 장치로서의 역할은 충실하게 수행해 줄 수 있을 정도로 발전할 것이라고 생각합니다. 그렇다면 급하게 메모할 때, 운전할 때, 요리나 샤워등 다른 일을 하고 있을 때도 스마트폰은 우리의 충실한 동반자가 되어줄 것입니다.

...거기에 한국어 인식도 포함되는 지는, 전혀 별개의 문제지만요.

덧글

  • 2011/10/18 20:02 # 비공개

    비공개 덧글입니다.
  • 자그니 2011/10/19 14:38 #

    음성 인식 기술이 그리 쉬운 것이 아니라서요.. ^^; 궁극적으론 인공지능인데, 그것이...
  • 어른아이 2011/10/18 20:43 #

    역시나 인가요..
  • 자그니 2011/10/19 14:38 #

    어쩔수 없겠지요. 단문 입력은 잘 처리해 주는 것 같습니다. 스스로 학습하는 능력도 있으니까요.
  • ova 2011/10/18 21:57 # 삭제

    욕심도 참 많으시네요
    기대 수준이 너무 높았던게 아닐까요
  • 자그니 2011/10/19 14:38 #

    보조 입력장치 정도인데, 너무 오버 하지는 말자는 글이랍니다. ^
  • 곰돌군 2011/10/18 22:06 #

    이런 경우의 장점이 있다면, 지속적으로 업데이트 가능하다는 정도 겠지요.
  • 자그니 2011/10/19 14:39 #

    옙. 그리고 자기 학습 능력도 있다고 하니...
  • 콘울프 2011/10/18 22:06 # 삭제

    얼마전 한국어 지원되는 드래곤딕테이션을 사용해 봤는데, 아이폰5에 탑제 된다는 설도 있고, 암튼 음성인식 기술 뿐만 아니라 수많은 서비스들이 더욱 빠른 발전과 진화를 더 할텐데, 말씀대로 기계는 기계다워야 한다는 말씀에 왠지 절대 동감 하고 싶어 지네요! ^^
  • 자그니 2011/10/19 14:39 #

    기계가 사람이랑 구별 안되면 무서워질 것 같아요.
  • 나르사스 2011/10/18 22:26 #

    되면 연애안하고 저거랑 노는 사람 생긴다에 한표 겁니다.
  • 자그니 2011/10/19 14:39 #

    그것도 하루 이틀이죠..(응?)
  • 엉뚱뽀이 2011/10/18 23:01 # 삭제

    확실히 과거에 비해 기술적으로 발전했지만 아직 호들갑 떨 정도로 대단한 수준은 아니다. 아직도 갈길이 멀다. 이런 늬앙스일까요? ^^

    그리고 '기계는 기계다워야 한다'라는 말씀엔 저도 전적으로 동감합니다. ^^
  • 자그니 2011/10/19 14:39 #

    한줄 요약 감사드립니다...
  • 에레드 2011/10/18 23:01 #

    한국어는 내년 중 지원이라고 애플 홈페이지 설명에 있더군요..내년 언제일지는 몰라도요..
  • 자그니 2011/10/19 14:39 #

    제대로 해줄지는.. 모르겠어요.
  • 일모리 2011/10/19 02:33 # 삭제

    ars technica 에 나온 글을 말씀하신거 같습니다.
    저는 글을 읽으면서 글의 제목에서도 분위기를 알수 있듯이 Siri-ously slick and speedy smart phone
    siri의 음성인식은 자그니님의 글과는 약간 다르게 나름 긍정적이라는 분위기의 글로 보았습니다.

    아직 한국에서는 이렇다 저렇다 미국에서 사용하는 사용기로만 접하는 중입니다만 직접 사용하는 사용자들에게는 엄청난 파장을 불러 일으키고 있다는게 중론입니다. 저또한 직접 사용해본결과 베타라고하기에는 놀라울정도였고요. ars technica 에서 말했듯이 "Apple makes clear that the product is still in beta—an appropriate label, in our opinion." 가 맞다고 봅니다.

    기계가 기계다워야 하는것은 이해는 하지만 동의하지는 않습니다. 오히려 기계를 기계이상으로 완성했을때에 더욱 기계가 사랑을 받았습니다. 아이폰글이니 애플 예를 들수 있겠네요. 잡스의 키노트에는 technology & art 의 crossroad 슬라이드가 종종 보였던게 그 이유라고 생각합니다. 사용자가 인간이기에 말이죠.. 그랬기에 컴퓨터에 typography가 발전했고 아이폰이 나왔고 아이맥이 나왔습니다. 인간의 본능적인 바램과 이상적인 목표를 철학적으로 충돌시킨다면 제가 지식도 짧고하니 드릴말씀이 많지는 않습니다만 현재로써는 기계가 기계다울수록 도태한다 가 맞는거 같습니다.

    언급하신데로 이번 siri를 통해서 음성인식 기술에 불이 붙었으니 앞으로 어떻게 될지 저도 기대가 됩니다. 삼성이 이러한 아이디어로 먼저 선수쳤으면 좋았겠지만 말이죠...
  • 자그니 2011/10/19 14:41 #

    기계가 너무 사람 같으면, 다른 의미의 공포가 나올 가능성이 있습니다. 아즈 테크니카에 올라온 것은 전반적인 4s 리뷰고, 긍정적인 뉘앙스로 작성된 것은 맞지만.. 전 그 글에서, 결국 음성 입력은 보조 입력 장치에 불과하겠구나-하고 생각했거든요. ^^
  • 아싸가오리 2011/10/19 06:46 #


    한국어 지원한다는데
    말을 변칙적으로 쓰는 경우가 많은 한국어를 어떻게 할지 걱정되네요


    확실히 기계는 기계다워야죠. 니뽕덕후들이 미쿠거리는거 보면 손발이 오글거리던데
  • 자그니 2011/10/19 14:41 #

    그냥 구글 음성 입력기에서 조금 더 나아진 정도 아닐까요.
  • 2413i 2011/10/19 08:22 # 삭제

    생각외로 쓸만하다...라 보고있습니다만.
    갈길은 아직 멀지만 베타버젼이란 걸 감안하면 이 정도면 나쁘지 않다 생각됩니다.

    저 정도 장점이면 준수하다해야하지 않을까요...
  • 자그니 2011/10/19 14:42 #

    너무 열광하거나 기대할 필요는 없다는 이야기였답니다. ^^; 이런 보조 장치는 있는게 더 좋으니까요.
  • 뭘까나 2011/10/19 12:32 # 삭제

    굉장히 conservative 하면서 pessimistic 한 관점이네요 ㅋ
    Apple 의 human-computer interaction 에 다가가기 위한 일보를
    너무 첫숟갈부터 배부르려고 하는건 아닌지요...
    좀더 open-minded 하고 미래지향적인 생각을 해보는게 어떨지요
    이 글 왠지 한 10년동안 간직하다가 나중에 보고싶군여...
  • 자그니 2011/10/19 14:42 #

    음. 그러셔도 좋습니다. 제가 보기엔 10년후에도 결국 음성은 보조 입력장치로 남을 거에요.
  • 유동닉 2011/10/19 12:48 # 삭제

    앙드레김 열매를 쳐먹은 양놈인지 한국놈인지 모를 인간이 한 명 보이지만

    확실한 사실은 길거리 돌아다니면서 사람이 아니라 핸드폰이랑 이야기하는거 보면 비웃음밖에 안나올듯
  • 자그니 2011/10/19 14:42 #

    그래도 운전중이나 이럴 때는 정말 편하길 할듯요-
  • ㅌㅌㅌ 2011/10/19 13:19 # 삭제

    그래도 정말 발전은 많이 되었네요
    예전 어릴때 삼성폰 음성인식기능;;;
    우리집을 수십번씩 핸드폰에게 외치곤 했었는데
  • 자그니 2011/10/19 14:43 #

    본부! 하는 거랑 우리집! 하는 거...맞죠? ^^
  • 노을지는언덕 2011/10/19 14:14 #

    자그니는 솔직히 하고 싶은 애기가 뭔가요
    난 그게 궁금합니다
    그래서
    어쩌라고!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 자그니 2011/10/19 14:43 #

    세상이 그렇게 딱부러지게 대답할 수 있는 것이 아닐텐데요... ^^; 그냥 정보-랍니다.
  • 인게이지 2011/10/19 16:11 # 삭제

    결국 기존 음성인식기술에서 한발자국 더 나간정도 라고 보면 되는걸까요?
    네비게이션 앱이랑 결합되면 상당히 유용하겠네요
  • 자그니 2011/10/20 16:10 #

    보조 입력 장치로는 상당히 유용할 것 같습니다.
  • 관전평 2011/10/19 16:32 # 삭제

    애플이기에 아니 스티브잡스가 있었기에 가능했던 기술입니다.
    삼성? 아마 몇번 죽었다 깨어나도 못할겁니다.
    그리고 자동차와 비교해 본다면 자동차가 자동으로 갑니까?
    100년이 넘었지만 아직도 꿈의 자동차입니다.
    그러나 애플은 아이폰 출시한지 10년도 되지 않아 해냈습니다.
    대단한 발상이며 인류를 위한 봉사라고 극찬합니다.

    대한민국에는 도둑놈 심보를 가진 사람들이 좀 많습니다.
    그만한 기능을 그가격에 사서 사용할 수 있다는건 정말 저렴한것 아닙니까?

    슈퍼컴퓨터에서 할만한 기능을 바라는것은 곤란하지요.
    티코만큼 기름 덜먹고 에쿠스만큼 크고 안락하고
    가격은 티코보다 저렴한 자동차를 바라는것은 아니겠지요?
  • 유동닉 2011/10/19 16:36 # 삭제

    는 애플빠들의 뇌내망상이고 현실은 옛날 '본부!' 폰의 음성인식과 구글 음성인식과 심심이를 합쳐놓은 자폐아 또는 인생이 심심한 사람들을 위한 장난감 수준의 물건
    그리고 별로 저렴하지도 않음.
  • 자그니 2011/10/20 16:10 #

    .... 애플도 기존 기술 인수한 건데요....;;
  • 팃슈_리 2011/10/19 17:37 #

    잘 보고 갑니다
  • 자그니 2011/10/20 16:10 #

    고맙습니다-
  • 時雨 2011/10/19 22:32 #

    사실 사람도 잘못 들을 경우가 있는데 기계에 많은 것을 바라는 것은 무리겠지요.
  • 자그니 2011/10/20 16:10 #

    자기 학습 능력이 있다고는 하는데, 적절하게 이용만 하면 편할 것은 같아요-
  • 차원이동자 2011/10/19 22:43 #

    우리나라는 저거 영어로 가져와서 '완벽한 영어발음'을 하는 교육프로그램 하나 만들거 같습니다...
    잘봤습니다
  • 자그니 2011/10/20 16:11 #

    ...; 그렇죠. 한국에선 교육용 프로그램...;; 음성SW랑 결합해서 가상 대화 프로그램을 만들어도 되겠군요...
  • 계란소년 2011/10/20 02:21 #

    제 생각엔 다른 거 하다가 밖으로 나가서 전화버튼이나 문자 시작 안 해도 되는 거(하지만 문자 자체는 그냥 키보드로 치는 게 낫다고 봄), 그리고 단위환산이나 간단한 용어질문 등이 쓸모있지 다른 건 좀 애매하네요. 일정 관련은 쓴다면 도움이 될 수도 있는데 유감스럽게도 내장 캘린더의 허접함 때문에 서드를 써서...
  • 자그니 2011/10/20 16:11 #

    그냥 보조 입력장치라고 생각하시면 될 것 같아요.
  • 동원군 2011/10/25 20:58 # 삭제

    ㅎㅎㅎ전 오히려 마지막 대목

    "파티마도 아니면서.."
    FFS 를 주구장창 읽고있는 저로선 매우 와닿는 대사였습니다^^
  • 자그니 2011/10/25 21:41 #

    저도 세 번을 읽었습니다^^
  • 2011/10/30 18:24 # 삭제

    음성인식기술은 예전부터 있던게 맞습니다만.. 폰에 이렇게 넣어서 폰의 기능을
    말로 자연스럽게 실행해주고 보여줄 수 있다는 것은 대단하다고 봅니다.
    그래서 잡스이기에 가능했다고 생각합니다.. 누군가가 언젠간 했겠지만..
    지금까지 애플과 잡스라는 사람이 있었기에 이렇게 단시간에 급격하게 발전할
    수 있었다고 봅니다.
    음성인식과 얼굴인식은 변수가 워낙많기 때문에 상당히 어려운 분야입니다.;;
    그래서 이렇게 나온 자체만으로도 훌률한 겁니다.
    전 우리나라에 2년전에 어이폰이 안들어왔다면 아직도 피쳐폰수준의 폰을 쓰고
    있을지도 모른다고 생각합니다.
    삼성도 이걸보고 많이 자극받아서 더 좋은 제품을 만들겠지요;(너무 찍어낸다는건
    좀 단점이지만..)
  • .. 2011/11/01 22:57 # 삭제

    그냥.. 이 시대에 이렇게 까지 기술이 발전했구나 정도로 보고 가는게 나을듯 ㅎㅎ
  • Crispin 2011/11/05 12:41 # 삭제

    이번 시리에 열광하는 이유는, 단지 음성인식이라는 것이 아니라 인공지능이라는 것입니다. 기술학적인 차원에서는 보기가 힘듭니다. 중요한 것은, 이것의 성능보다는, 시리를 접목시킨 혁신적인 발상입니다.
  • @@ 2011/11/05 18:29 # 삭제

    사실 아직 엄청나게 정확하게 음성인식을 해서 실행을 시켜주는 게 아니더라도 음성인식으로 이러이러한 것을 할 수가 있다라는 걸 실생활에서 보여주고 비전을 제시했다라는 것 만으로도 큰 의의 인것 같아요, 사실 이런건 다른 어떤 연구소나 학자나 큰 대기업이나 다 연구는 했을 법한데 이걸 이렇게 직접 실용화 해서 슈퍼 엘리트들 몇몇만 쓰는 게 아니라 그냥 스마트폰 가지고 있는 사람이라면 누구나 접하고 생활속에서 쓸 수 있게 했다는 게 너무 대단한 듯 해요.

    솔직히 머리가 엄청 좋은 연구자나 학자라도 이런걸 이렇게 대중적으로 쓰게 할 거라곤, 이런게 우리 생활에서 구체적으로 어떤 식으로 쓰이고 도움을 주게 될런지까지 생각하지는 못할 것 같아요, 그래서 아예 그런걸 상용화 하려면 한 10년이나 걸릴거야 라고 비관하고 기대하지도 않았을텐데 애플의 대단한 점이 그렇게 복잡하고 비관적으로 생각하지 않고 그냥 생활에서 음성으로 명령해서 기기를 자동으로 실행 시키는(전혀 손을 대지 않고, 손으로 굳이 이제 터치 조차 하지 않아도) 것이 있으면 정말 편하겠다, 그걸 꼭 만들어서 대중화 시켜야 겠다 라고 생각한 것 자체가 너무 대단한듯
  • 애플이 한건 2011/11/27 15:40 # 삭제

    기존의 데이터 베이스와 그 처리 알고리즘이 내장된 대용량 서버와 휴대용 단말기를 네트워크 서비스로 연결한 것이 전부이고 아이폰은 그저 단말기에 불과하죠. 혁신적인 것은 일반 대중이 휴대할 수 있는 슬림한 기기에 탑재될 정도의 효율적이고 콤팩트한 인공지능이 아니라 마치 그런 것처럼 보이게 할 수 있는 빠른 네트워크 속도와 세련된 인터페이스 구조고, 그것을 발견한 것이 스티브 잡스라는 사실입니다. 확대해석은 금물입니다.
※ 이 포스트는 더 이상 덧글을 남길 수 없습니다.


애드센스 긴배너(세로)

구글 광고 테스트


메모장

이요훈님의 Facebook 프로필



다음 블로거 뉴스
베스트 기자

올블로그 2006~2009
탑 100 블로그

블로그어워드 2009
탑 100 블로그

월간 PC사랑 선정 2010
베스트블로그 100


Locations of visitors to this page


통계 위젯 (화이트)

40714295
30993
20901564