구글애드센스




2016/12/27 19:36

이미 다가온 미래, 구글 번역 구글/구글앱/안드로이드



미래가 현실로 가까이 다가오고 있는 걸까? 올 초 이세돌 9단과 알파고의 바둑 대결 이후, 구글 인공 지능이 조금씩 우리 마음을 흔들어 놓고 있다. 지난 11월 30일 구글 코리아 기자 간담회에서 설명한 '구글 번역'이 그 좋은 예다.



농담이 아니고, 정말로 기계가 알아서 언어를 번역 해 주는 것은 바벨탑(...) 이래 인류의 오래된 꿈이다. 이미 17세기에 수학자 라이프니치와 철학자 데카르트가 제안했던 기계 번역 모델이 있었을 정도다. 무척 오래되었지만, 실제 연구는 1950년대 컴퓨터 보급이 이뤄지기 시작하면서 진행되었다. 본격적인 연구와 상용화가 이뤄진 것은 1980년대부터고.  .


구글의 발표 내용에 따르면, 구글은 이런 기존의 기계 번역 방식을 한 단계 진화 시켰다. 인공 지능을 이용해 스스로 학습하면서 번역 기능을 강화하는 단계에 이른 것이다. 까놓고 얘기하자면 구글만 하고 있는 것은 아니다. 네이버에서 만든 통번역 앱  파파고나 한컴의 지니톡 역시 비슷한 원리를 이용하고 있다. 플리토는 조금 맥락이 다르긴 하지만.

  

시간 파리는 화살을 좋아한다


이런 진화에 환호하는 이유는, 기존의 기계 번역 서비스가 상당히 부실한, 특히 한국어 번역은 꽤 부실한 결과를 보여줬기 때문이다. 유명한 사례로 'Time flies like an arrow' 를 '시간 파리는 화살을 좋아한다.'로 번역한다거나, 'War never again!'을 '결코 다시 전쟁!'으로 번역해 반전 메시지를 전쟁 독려 메시지로 번역한다거나....하는 일이 있었다.


기계 번역이 그동안 엉터리로 이뤄진 이유는, 번역 자체가 결코 쉬운 작업이 아니기 때문이다. 기술 문서나 사무 문서처럼 문장 안에서 의미가 깔끔하게 끝나는 것들은 좀 나은 편이지만, 우리가 실제로 쓰는 말은 대부분, 우리의 사고방식이나 대화 맥락 속에서만 이해되는 여러 가지 의미가 담겨 있다. 이런 것들은 지금도 기계 번역이 해결하기 어려운 문제다.


다른 한편으로 지금까지 쓰이고 있던 통계 기반 기계 번역의 문제도 있다. 아는 사람은 다 알고 있는 이야기지만, 지금 많이 쓰이는 기계 번역은 문법을 기억해 사전으로 번역한 단어/구문을 채워 넣는 그런 형식(규칙 기반 기계 번역)이 아니다. 번역된 문장의 데이터베이스를 축적해서, 사용자의 질문이 들어오면 비슷한 문장을 비교해 결과를 뽑아내는 식이랄까. 그러니 데이터베이스가 많이 축적되어 있지 않다면, 제대로 된 번역을 할 수 없었다.


페퍼는 한국어는 모르고, 내 일본어는 이해하지 못 했다. 젠장 ㅜ_ㅜ

  

구글 번역은 스스로 성장한다


그렇다면 '구글 신경망 기계 번역(GNMT)'라 불리는, 새로운 번역기는 어떻게 다를까?  일단 딥러닝 기술을 적용해, 구글 번역 스스로 학습하는 능력이 비약적으로 증가했다. 인간이 기본적인 규칙을 가르쳐주면 인공 지능이 스스로 인터넷에 올라오는 글들을 수집해서 공부하는 형태다.


다른 하나는 문장을 단어나 구문 단위가 아니라, 문장 단위로 인식해 번역한다. 이로 인해 최대 80% 까지 번역 오류가 줄어들었다고 한다. 하지만 기존 구글 번역의 한국어 번역 정확도가 높은 편은 아니으니, 큰 기대는 하지 않는 것이 좋다. 그래도 짧은 문장은 상당히 괜찮게 번역을 해주는 편이다.


어느 정도로? 다음은 이 글의 첫 문단을 구글 번역한 결과다. 한번 비교해 보자. 고유 명사...가 들어간 두 번째 문장을 뺀다면, 꽤 깔끔하게 번역을 했다(9단을 9th stage로 번역하다니..;.

미래가 현실로 가까이 다가오고 있는 걸까? 올 초 이세돌 9단과 알파고의 바둑 대결 이후, 구글 인공 지능이 조금씩 우리 마음을 흔들어 놓고 있다. 지난 11월 30일 구글 코리아 기자 간담회에서 설명한 '구글 번역'이 그 좋은 예다.


Is the future nearing reality? Since the beginning of this year's 9th stage and Algo's Go game, Google AI is shaking our minds little by little. A good example is the "Google translation" described on November 30th at the press conference of Google Korea.


 

기계 번역은 미래를 어떻게 바꿀까?


새로운 번역 기술이 적용된 것은 일단 한국어를 비롯해, 영어, 프랑스어, 독일어, 스페인어, 중국어, 일본어 등 9개 언어로, 서로 유사한 언어로 묶는다면 대략 3개 정도의 언어 유형이라고 볼 수 있겠다. 물론 알고 있다. 몇 가지 언어를 번역할 수 있는가 보다 중요한 것은, 이런 번역을 실생활에서 써먹을 수 있는가-하는 것이다.


당연히, 가능하다. 일단 구글 크롬 브라우저의 웹 번역에 조만간 적용될 예정이다. 구글 번역 앱은 마이크를 통해 실시간으로 2개 국어를 듣고 상호 번역해서 들려주는 기능을 제공하기 때문에, 여행 시에도 유용하게 사용할 수 있다. 실제로 예전 일본 여행 때 잘 쓰기도 했다(이 빵의 유통 기한이 언제까지인가요? 비행기 짐으로 부쳐도 깨지지 않게 포장해 주실 수 있나요? 같은 말은 여행 회화 책에는 잘 안 나온다.).


SNS 등에 올라온 글들을 자동 번역해서 보는 기능은 좀 더 강력해질 전망이다(현재 페이스북 등에서 제공하는 번역은 형편없다.). 그뿐만 아니라 내가 만든 콘텐츠를 자동으로 번역해서 보여주는 기능 역시 좋아진다면, 한국에서 자동 번역을 통해 구글 애드 센스 수익을 얻을 수 있는 블로그를 만드는 것도 고려할 사람이 나타날 것이다.


텍스트 번역뿐만 아니라, 음성을 인식해 번역하는 기능과 맞물리게 되면 파괴력은 더욱 강해진다. 당장 유튜브 자동 번역 자막 기능만 강해져도, 한국어로 콘텐츠를 만들어 세계인(?)들에게 보여주는 것도, 세계 각국의 콘텐츠를 즐기는 것도 쉬워진다.


물론, 아직까진 그저 즐거운 상상에 불과하다. 기계 번역은 여전히 한계가 많다. 고유 명사는 잘 이해하지 못한다는 것, 어떤 맥락에서 이야기를 하는지를 잘 모른다는 것 등 기계 번역이 완전히 인간을 대체할 날은 쉽게 오지 않을 것이다. 하지만 인간을 도울 수는 있고, 필요한 간단한 정보를 얻기에는 충분해질 날이 머지않았다. 외국어를 몰라도 외국인 친구를 만들 수 있는 시대가, 곧 다가오는 것이다.


... 그렇다고 외국어 공부를 안 해도 된다는 말은 못하겠지만.




덧글

  • tanato 2016/12/28 02:56 #

    번역일로 밥벌어먹고 사는 사람 입장으로서, 큰일났습니다. 내년쯤으로 생각하고 있었는데, 생각보다 빨리와서 당황중(...)
    뭐, 물론 번역일이라는게, 언어만 변환하는게 아니라 여러가지 양식이나 그외 여타 고려할 사항이 많으니 사람 손은 필요하겠지만 '고급인력으로서의 번역가'의 입지는 금방 줄어들 것 같네요.
  • 요원009 2016/12/29 16:08 #

    오히려 고급 인력들의 일자리에 변화가 있지 않을까요? 기계어라는 게 결국엔 사람이 만드는거라 고급 번역가의 입지는 결코 줄어들진 않을거라 생각이 돼요.

    되려, 이런 일을 하다가 저런 일을 하게 되진 않을지요.... 전체 일자리 수는 비슷하나 업무 내용이 조금 바뀐달까..??
  • tanato 2016/12/29 17:13 #

    업무내용이 조금 바뀐다= 전문 번역가->단순 노동 작업자로 격하된다는거지요. 기계번역을 돌린 후에 오류/문법 수정만 하는 그런 일들. 그래서 기업입장에서는 중간급 보다는 밑바닥의 최저임금 노동자만 사용해도 효용을 얻을 수 있기 때문에 결국 그 전체 평균점은 내려갈 겁니다.

    물론 그 문맥에 따른 뉘앙스까지 번역해야하는 경우 사람이 처음부터 끝까지 다 해야하고 그런 부분이 남아는 있겠지만, 그 절대수치는 감소할꺼고, 지금 활동하는 번역가들(주로 기업쪽 기술번역 등)은 단순노동 작업자로 격하될겁니다. 지금도 그런 현상이 나타나고 있기도 하고요.
  • 자그니 2016/12/30 01:21 #

    번역일...을 하는 친구와 얘기를 한 적이 있는데, 몇가지 확인할 수 없는 부분들이 있었습니다.

    1. 번역일이 늘어날 것인가 줄어들 것인가
    2. 기계 번역이 필요한 분야와 그렇지 않은 분야는 어떻게 나뉠 것인가

    사실 테크 번역쪽은 기계 번역으로 많이 대체 되리라 생각합니다. 매뉴얼 같은 부분들이요. 음식점 메뉴라던가.. 이 부분들은 타나토님의 입장이 맞다고 봅니다. 다만, 학술/소설 번역..처럼, 기계 번역이 대체할 수 없는 부분도 분명히 남아있는데, 이 부분은 또 시장 수요가 생각보다 많지 않아서... 전체적으로 번역하는 량이 아예 는다면 번역가들의 입지는 더 늘어날 여지도 있지만, 현재 시장 수요 그대로라면 꽤 곤란할 부분이 생기겠더라구요...

  • 은이 2016/12/28 14:02 #

    번역기 써 보면 이게 주요언어일 수록, 언어 체계가 비슷 할 수록 잘되더군요.
    영어 <> 한국어는 애매한 반면, 일어 <> 한국어는 꽤 잘되는 편입니다.
    영어는 좀 쓰기 힘든데, 일본어 사이트는 가끔 특정 단어 오역만빼면 전반적으로 괜찮게 되더군요. +_+ㅎㅎ
  • 자그니 2016/12/30 01:22 #

    실은 중국어 <> 영어 번역도 꽤 잘됩니다. 콘텐츠 업계의 영향으로 세계의 많은 언어들과 일본어 사이의 번역이 꽤 잘된다는 소문도 있습니...
  • jimbo 2016/12/29 10:22 #

    그래서, 해외영업직은 오늘도 두려움에 떱니다... ㄷㄷㄷㄷㄷ
  • 자그니 2016/12/30 01:22 #

    에이. 사람 상대하시는 일이라면 두려워하실 필요가....
※ 이 포스트는 더 이상 덧글을 남길 수 없습니다.


애드센스 긴배너(세로)

구글 광고 테스트


메모장

이요훈님의 Facebook 프로필



다음 블로거 뉴스
베스트 기자

올블로그 2006~2009
탑 100 블로그

블로그어워드 2009
탑 100 블로그

월간 PC사랑 선정 2010
베스트블로그 100


Locations of visitors to this page


통계 위젯 (화이트)

8512690
20935
20632711