본문 바로가기

언어 장벽 넘고, 실시간 번역까지 OK! ...기계 번역, 인공 지능으로 확장하고 진화한다

반응형

외국어 한 마디 하지 못해도 세계 여행이 두렵지 않은 세상이 됐다.  스마트폰 속에 자리 잡은 번역기 덕분이다. 해외에서 직접 구매한 상품을 집으로 배송받는 것도 어려운 일이 아니다. 웹브라우저만 열면 아무리 낯선 언어도 척척 번역기가 알려주기 때문이다. 모른 것 궁금한 것을 검색할 때도 이제는 전 세계 언어로 작성된 웹 페이지를 종횡무진 누빌 수 있다. AI 번역이 언어 장벽을 없애거나 낮춰준 덕분이다.

| 자동 번역을 꿈꾸며, 기계 번역이 시작되다

사람이 아닌 기계적인 방법을 통해 언어 장벽을 해결하고자 하는 제안이 처음 나온 것은 17세기다. 이후 1933년 프랑스계 아르메니아인인 조지 아투루니(GeorgeArtsrouni)와 러시아인 표트르 스미르노프 트로얀스키(Petr Smirnov Troyanskii)가 천공 카드를 활용한 기계 번역 장치에 대한 특허를 내며 기계 번역(Machine Translation)에 대한 가능성을 제시했다.

이후 기계 번역은 여러 단계의 난관과 고비를 맞이하며 위기를 맞이하기도 하고, 새로운 방법과 기술을 적용하며 진화를 거듭해 왔다. 기계 번역의 개척기라고 할 수 있는 1933년부터 1956년까지는 기계 번역에 대한 제안과 논의가 있었고, 1949년 영국의 워렌 위버(Warren Weaver)가 번역에 컴퓨터를 활용하는 컴퓨터 번역(Computer Translation)을 제안했다.

1951년에 미국 메사추세츠 공과 대학에서 '기계 번역 컨퍼런스(Conference on Machine Translation)'를 개최하면서 기계 번역에 대한 본격적인 연구와 개발 시대가 열리게 된다. 1954년에는 미국 조지타운 대학 연구팀이 IBM과 협력해 기계 번역 시스템을 개발하고, 250개의 매우 제한된 단어를 사용해 49개의 러시아어 문장 중에서 몇 개의 샘플을 영어로 번역하게 된다.

그 이후 기계 번역은 발전, 정체, 좌절, 기대를 반복하며 인공 지능을 활용한 번역 기술이 대중화되기 까지 여러 단계의 진화 과정을 거친다. 그리고 구글이 인공 신경망 기계 번역(Neural Machine Translation)을 활용한 번역 서비스를 누구나 무료로 사용할 수 있게 한 2016년을 기점으로 AI 번역 기술은 본격적으로 성장했다. 스마트폰의 보급 및 성능 향상도 AI 번역을 생활과 업무 속에서 활용할 수 있도록 하는데 일조했다.

웹(Web)과 앱(App)으로 누구나 번역과 통역 서비스를 이용할 수 있는 구글 번역은,  신경 기계 번역 기술을 활용하는 대표적인 AI 번역 플랫폼이다. (자료 : Google)


| 기계 번역의 한계, 인공 지능으로 넘어서다

기계 번역 관련 연구나 기술 및 시스템 발전 그리고 상업적인 관점에서 살펴보면 기계 번역의 개념과 역사는 훨씬 복잡하다. 기계 번역에 대한 시도와 역사가 제법 오래된 만큼 다양한 연구와 시도가 실패와 성공을 거치며 이어졌다. 하지만 일상생활이나 일반적인 업무에서 활용하는 기계 번역이 실제로 도움이 될 수 있다고 체감할 수 있게 된 것은, 구글이 신경망 기계 번역을 개발하고 '구글 번역'에 본격적으로 적용하면서부터다.

기계 번역에 활용되는 기술이나 알고리즘은 크게 규칙 기반 번역(RBMT;Rule-Based MachineTranslation), 통계 기반 번역((SMT;Statistical Machine Translation), 그리고 인공 신경망 기계 번역 세 가지로 나눌 수 있다. 각각의 기술과 알고리즘마다 장단점이 있기 때문에 한 가지 이상을 혼합한 하이브리드 방식을 사용하기도 하고, 최근에는 AI 번역이라고 할 수 있는 신경 기계 번역을 중심으로 진화를 거듭하고 있다.

규칙 기반 번역은 언어가 가진 어법과 문법을 규칙으로 만들어 이를 기반으로 기계 번역을 수행한다. 언어학자가 중심이 되어 문법에 기초한 알고리즘을 개발하기 때문에, 많은 시간과 비용이 들어간다. 1968년 설립된 시스트란(SYSTRAN)은 이를 기반으로 한 번역 솔루션을 다양한 분야와 기업에 제공해 왔고, 인공 신경망 기계 번역을 적용한 최초의 상용 제품을 선보이기도 했다.

오랜 번역 기술 개발 역사를 가진 시스트란은 약 50개 이상의 언어에 대해 정부 기관과 다양한 기업에서 활용하고 있는 번역 서비스를 제공하고 있다. (자료 : Systran)


통계 기반 번역 기술을 도입한 것은 IBM이다. 통계 기반 번역은 방대한 양의 데이터를 기반으로 번역 규칙을 생성하고 이를 번역에 활용하는 방법이다. 통계 기반 번역은 번역의 기초가 되는 데이터가 핵심인 만큼, 데이터가 많이 쌓일수록 번역 정확도가 높아진다. 반면 데이터가 부족하거나 부정확하면 번역 품질도 떨어진다. 통계 기반 번역은 구글처럼 검색 엔진을 가진 IT 기업들이 인터넷을 통해 번역 서비스를 제공하는 본격적인 계기가 됐다.

AI 번역이라고 하는 인공 신경망 기계 번역은 이러한 두 가지 번역 기술이 가진 한계를 극복하기 위해 등장했다. 마치 사람이 사물을 인식하고 인지하는 것처럼, 사람과 사람이 대화라는 방법으로 상호작용하는 것처럼, 최대한 사람과 유사하게 만들어진 인공적인 신경을 통해 언어를 학습하고 이를 기반으로 번역하는 기술이다. 지금처럼 좀 더 자연스럽고 정확한 번역이 가능해진 것은 바로 이러한 AI 번역이 등장했기 때문이다.

| AI 번역의 핵심 키워드 세 가지

컴퓨터는 구조화된 데이터에 최적화된 작업을 수행한다. 하지만 사람의 말과 글은 그렇게 구조화된 데이터로 만드는 데 한계가 있다. 아무리 규칙을 세분화하고 잘 만들고, 방대한 양의 데이터를 가지고 있어도, 말과 글 속에 담긴 관용적 표현, 속담, 은어 등을 사람처럼 완전하게 전달하고 이해하는 것은 불가능하기 때문이다.

그래서 번역의 정확성과 품질을 높이려면 사람처럼 '정보'를 받아들일 수 있는 방법이 필요하다. 그래서 등장한 것이 인공 신경망을 활용한 기계 번역이다. 인공 신경망 기계 번역을 정의하는 핵심 키워드는 자연어(NLP;Natural Language Processing), 학습(Deep Learning), 맥락(Context)이다. 사람이 사용하는 일상적인 언어를 학습을 통해 습득하고, 단어나 문장의 앞뒤 전후 맥락을 이해해 번역하는 것이 핵심이다.

즉, AI 번역은 사람이 언어를 배우는 것처럼 일상적인 대화나 문장을 스스로 학습하면서 언어 능력을 향상한다. 이렇게 학습한 언어를 기반으로 번역을 수행하면서 앞뒤 문장이나 문맥을 고려하기 때문에 훨씬 자연스럽게 번역할 수 있다. 또한 딥 러닝이라는 학습 알고리즘을 통해 계속해서 학습을 수행하기 때문에, 사람이 외국어를 꾸준하게 학습하면 실력이 느는 것처럼 AI 번역도 능력이 향상된다.

사실 이런 관점에서 본다면 기계 번역의 역사는 인공 신경망 기계 번역이 적용되기 시작한 전과 후로 나눌 수 있다고 해도 과언이 아니다. 이를 일반 사람들이 쉽게 이해할 수 있는 현실적인 분기점이, 바로 구글 번역에 이러한 인공 지능 번역 기술이 도입된 이후다. 이전의 구글 번역은 어딘가 어색하고 왠지 낯설면서, 실제로 활용하기에는 오류가 많았다. 

하지만 인공 지능 알고리즘과 기술을 도입하면서, 구글 번역을 비롯한 많은 번역 솔루션이나 플랫폼은 하루가 다르게 발전하고 있다. 원어민 수준의 사람이 번역하는 것과 비교하면 아직은 부족한 점이 많지만, 일상생활과 업무 그리고 여행을 하면서 활용하기에는 정확성도 높고 표현도 자연스럽다. 그리고 이 시간에도 계속해서 학습 과정을 거치면서 번역 실력이 성장하고 있다는 점도 눈 여겨 볼만하다.

| AI 번역을 활용한 다양한 플랫폼과 서비스

AI 번역이 기계 번역에 빠르게 확산되면서, 다양한 번역 솔루션이나 플랫폼이 전 세계적으로 활용되고 있다. 일반 사람들에게는 웹(Web)이나 앱(App) 형태로 제공도는 무료 AI 번역이 익숙하고 널리 사용되지만 소프트웨어 형태로 판매되는 기업용 유료 번역 프로그램도 적지 않다. 각각의 AI 번역 솔루션이나 플랫폼이 가진 알고리즘과 특징이 다르기 때문에, 용도나 분야에 따라 폭넓은 시장을 형성하고 있다. 

구글 번역은 번역 품질이 뛰어나면서 무료이고, 웹이나 앱 형태로 자유롭게 활용할 수 있어, 가장 널리 사용되는 번역 플랫폼이다. 문장이나 문서를 번역할 수 있고, 다양한 언어를 지원하는 것이 장점이다. 구글 번역기는 100개 이상의 입력, 쓰기, 대화, 사진, 오프라인 번역 등을 지원하는데, 널리 사용되는 언어일수록 지원되는 기능이 많은데 '각 언어에 사용도는 기능 확인' 페이지를 방문하면 자세한 내용을 확인할 수 있다.

구글 번역 페이지를 방문하면 구글 번역기에서 지원하는 언어와 각 언어에서 사용 가능한 기능을 확인할 수 있다. (자료 : Google Translate)


빙 마이크로소프트 번역기(Bing Microsoft Translator)는 웹을 통한 다양한 번역 기능을 제공하면서, 마이크소프트 빙(Bing), 마이크로소프트 오피스(Microsoft Office) 셰어포인트(SharePoint), 마이크로소프트 에지(Microsoft Edge) 등 다양한 자사의 소프트웨어나 솔루션에 통합되어 있다. 100개 이상의 언어에 대한 번역과 12개 언어에 대한 통역을 지원한다. 

이밖에도 딥엘(DeepL), 리버소(Reverso), 메모Q(MemoQ), 시스트란(SYSTRAN), 스타트링(SMARTLING), 크라우딘(Crowdin), 아마존 번역(Amazon Translate) 등 다양한 무료 및 유료 번역 솔루션이 활용되고 있다. 이들 번역 솔루션은 특정 언어나 전문 분야에 특화된 기능, 지원하는 콘텐츠 형식, 번역 협업이나 과제 관리 등 차별화된 특징을 내 세우며 차별화를 강조하고 있다. 

네이버가 제공하는 파파고(Papago) 역시 유용하게 활용할 수 있는 인공 지능 기반의 기계 번역 서비스다. 네이버가 자체 개발한 인공 신경망 기계 번역 기술을 활용해 현재 14개 언어에 대한 번역을 지원하며, 사진 속에 있는 텍스트를 인식해 번역하는 이미지 번역과 영어와 일본어의 경우는 발음을 한국어로 보여주는 발음 보기 기능을 지원한다.

| 문자를 넘어 음성, 번역을 넘어 통역으로

번역은 글에서 글로, 통역은 말에서 말로, 언어를 변환하는 것이다. 번역은 텍스트 형태로 존재하는 단어나 문장을 다른 언어로 옮기는 것이지만 통역은 여기에 음성을 인식하는 기능까지 추가되어야 한다. 따라서 AI 번역이 통역 기능까지 수행하려면 더 높은 수준의 기술력이 필요하다. 하지만 최근에는 AI를 활용한 번역과 통역 기술이 발달하면서, 이것 역시 일상생활 속에서 어렵지 않게 이용할 수 있는 수준이 됐다. 

특히 음성 인식과 통역 등의 기술이 인공 지능 음성 인식 플랫폼 등과 결합하면서, 그 활용 범위가 더욱 다양해지고 있다. 아마존의 알렉사(Alexa), 누구(NUGU)의 아리아, 삼성의 빅스비(Bixby)가 대표적인 음성 인식 플랫폼을 활용한 서비스다. 인공 지능 음성 비서라고도 부르는 이들 서비스는 스마트 스피커나 스마트폰 앱을 통해 다양한 활용이 가능하다. 

예를 들면 NUGU를 활용하면 영어, 중국어, 일본어 번역이 필요할 때, 문자 입력 대신 음성으로 물어볼 수 있다. "아리아, 공항까지 얼마나 걸려?가 영어로 뭐야?", "아리아, 오늘 날씨 좋다가 중국어로 뭐야?", "아리아, 근처에 가까운 약국이 어디 있어요?가 일본어로 뭐야?"라고 묻기만 하면, 바로 번역된 내용을 음성으로 들을 수 있다.

SKT의 인공지능 음성 인식 서비스인 NUGU를 활용하면, 어학 사전 기능을 통해 영어, 중국어, 일본어로 번역된 내용을 음성을 확인할 수 있다. (자료:NUGU)


구글 렌즈(Google Lens)나 빅스비 비전(Bixby)에서 제공하는 이미지 번역은 외국어로 된 간판, 포스터, 인쇄물 등을 사진으로 촬영하면 자동으로 텍스트를 인식한 후 이를 번역해 준다. 특히, 구글 렌즈는 이미지에 포함된 100개 이상의 언어를 실시간으로 번역해서 보여주기 때문에, 외국 여행 중에 만나는 교통 표지판, 간판, 입장권, 경고문, 안내문 등을 스마트폰만 있다면 그 자리에서 바로 번역해서 이해할 수 있다. 

구글 번역이나 구글 어시스턴트에서 제공하는 다국어 통역 기능은 이제 해외 여행자의 필수품이라고 해도 과언이 아닐 만큼 많은 사람들이 요긴하게 활용하고 있다. 구글 번역에서는 대화(Conversation) 모드를 선택한 후 상대방과 대화를 나누면 자동으로 언어를 인식해 각각의 언어로 통역해 준다. 구글 어시스턴트에서는 마이크 버튼을 탭 하고 '통역 모드'라고 말하면 통역할 언어를 선택하고 실시간 통역 기능을 활용할 수 있다.


구글 번역 앱을 활용하면 번역과 통역 기능을 누구나 간편하게 무료로 사용할 수 있다. 오프라인 언어 파일을 다운로드하면, 인터넷이 연결되지 않은 곳에서도 사용이 가능하다. (자료 : iOS 구글 번역 앱 캡처)


| 지원 언어와 활용 범위 넓어지고, 시장은 갈수록 확대되고

AI 번역의 재주와 능력이 갈수록 일취월장하면서, 말과 글이 필요한 거의 모든 분야로 활용 범위와 시장이 넓어지고 있다. 그것은 곧 AI 번역 기술과 기능이 점점 세분화되고 전에는 불가능해 보였던 것들이 실현 가능한 현실이 되고 있다는 것을 의미한다. 기술의 발전, 다양한 기능, 시장의 확대라는 세 가지의 순환 고리가 서로 맞물려서 AI 번역의 미래에 대한 기대와 전망은 점점 더 커지고 있다. 

구글 번역에서는 스마트폰에 설치된 앱을 통해 외국어 번역과 통역뿐만 아니라, 음성을 문자로 변환해 받아 적는 트랜스크라이브(Transcribe) 기능도 지원하고 있다. 이를 테면 영어로 진행되는 회의나 강의를 앱으로 녹음하면서, 동시에 이를 스페인어로 번역한 문장을 실시간으로 볼 수 있다. 이를 활용하면 스페인어만 할 수 있는 사람도 영어로 진행되는 회의나 강의에 참석해 전반적인 내용을 무리 없이 이해할 수 있다는 뜻이다. 

아이유노SDI 미디어그룹은 자막과 더빙 시장 1위 기업으이다. 그리고 AI 번역을 전문으로 하는 XL8이라고 하는 자회사가 있는데, 구글 번역보다 높은 번역 효율을 제공하는 것으로 알려져 있다. AI 번역으로 초벌 번역을 하면, 이를 번역가가 다듬고 감수하고, 이를 기반으로 성우가 더빙 작업을 한다.

이를 기반으로 아이유노SDI 미디어그룹은 전 세계 34개 나라에 64개 지사를 두고, 임직원 2,700명과 프리랜서 번역가 3만명이 일하고 있다. 인공 지능을 활용한 우수한 기계 번역 기술을 기반으로 AI를 활용한 음성합성 기술도 개발하고 있다. 이를 기반으로 부족한 성우를 대체할 수 있는 AI 성우를 개발하면 번역과 더빙 시장에서 더욱 큰 성장이 가능하기 때문이다.

아울러 2022년 10월에는 구글이 트랜슬레이션 허브(Translation Hub)라는 AI 기반 번역 서비스 출시와 함께 2021년 4월에 선보인 구글 도큐먼트 AI에 새로운 기능을 추가하고, 이를 구글 클라우드 넥스트 컨퍼런스(Google Cloud Next)에서 공개했다. 신경 기계 번역과 오토ML(AutoML)을 융합한 한 단계 진화한 번역 기술을 트랜슬레이션 허브에 접목해 135개 언어에 대한 문서 번역 서비슬 지원한다.


이렇게 AI 번역 기술이 하루가 다르게 발전하고 적용 범위가 넓어지면서, AI 번역 시장 역시 가파르게 성장할 전망이다. 시장조사 전문기관인 테크노나비(tecnonavi)에 따르면 2021년부터 2026년까지 기계 번역 시장 규모가 8억 5,062만 달러로 성장하면서 연간 14.48% 성장할 것으로 예상했다. 콘텐츠 현지화에 대한 수요 증가가 시장 성장을 이끌고, 다국어 AI 번역에 대한 수요가 증가할 것으로 전망했다.

 

GMI는 2020년부터 2030년까지 기계 번역 시장이 연간 30% 성장할 것으로 전망했다. (자료 : Global Market Insights)


글로벌 마켓 인사이츠(Global Market Insights)가 2022년 6월에 발표한 '2030년까지 기계 번역 시장 전망(Machine Translation Market Share & Forecast, 2022 – 2030)' 보고서는 기계 번역 시장의 성장 가능성을 더욱 높게 평가하고 있다. 2020년 2030년까지 연간 30%의 성장률을 기록할 것으로 전망했으며, 미국에서의 신경 기계 번역 시장은 2030년까지 25%의 성장할 것으로 예상했다.

현재 기계 번역 시장을 선도하고 있는 주요 업체로는 AWS(Amazon.com, Inc.), 구글(Google), 클라우드워즈(Cloudwords), 마이크로소프트( Microsoft), IBM, 라이온브릿지 테크놀로지(Lionbridge Technologies), 스마트 커뮤니케이션(Smart Communications), 시스트란 인터내셔널(Systran International) 등이 있다.

SKT 음성인식 인공지능 서비스 NUGU 블로그 제공한 콘텐츠 원문입니다.

 

반응형