본문 바로가기

MS, '문서 번역' 미리보기 출시…원본 구조와 형식 유지, 사용자 정의 사전 지원

반응형

번역이 업무 프로세서에서 필수인 기업에서는, 번역 시스템을 자동화 고도화하는 것이, 업무 효율을 높이는 지름길이다. 특히, 다양한 언어를 활용해, 다양한 형태의 문서를, 대량으로 번역해야 한다면 더욱더 그렇다. 이럴 때 필요한 것이 인공지능을 활용한 클라우드 번역 서비스로, 기업용 문서 번역 서비스는 업계 전문용어를 자연스럽고 정확하게 번역하는 것이 중요하다.

 

또한, 번역 과정에서 필연적으로 발생하는 문장 구성과 길이, 페이지 분량 등의 변화에 지능적으로 대처할 수 있어야 한다. 그렇지 않으면 레이아웃이 달라진 문서를 보면서, 사람이 일일이 수작업으로 수정해야 하는 또 다른 일을 만들어내기 때문이다. 따라서 업무 자동화를 위해 자동 번역 서비스를 이용하려 한다면, 원본 구조를 유지하면서 정확한 문서 번역을 위한 사용자 용어 정의 사전을 지원하는지 살펴야 한다.

 

마이크로소프트가 '문서 번역(Document Translation)' 서비스를 미리보기(preview) 형식으로 출시했다. 문서 번역은 클라우드 서비스인 애저(Azure) 기반의 기계 번역 서비스로, 애저 인지 서비스(Azure Cognitive Services) API 제품군의 일부지만, 현재는 단일 서비스인 변환기 리소스에서만 지원된다. 문서 번역 서비스를 활용하면 문서 구조와 데이터 형식을 그대로 유지하면서, 약 70개 이상의 언어로 문서를 번역할 수 있다.

 

문서 번역은 웹이나 앱에서 제공하는 페이지 또는 문장 형태의 번역과 달리, 다양한 형태의 파일을 대상으로 번역 작업을 진행한다. 번역 해야 할 문서가 많고 용량이 클 때, 전체 문서를 비동기적으로 번역하는 대용량 파일 번역이 가능하다. 번역할 문서를 한 번에 업로드 한 후 번역 작업을 진행할 수 있기 때문에 번역 업무의 효율을 높일 수 있다.

 

마이크로소프트가 클라우드 기반 '문서 번역' 서비스를 미리보기 형식으로 출시했다. '문서 번역'은 약 70개 이상의 언어로, 다양한 형식의 파일을, 일반 번역과 사용자 정의 용어집을 적용해 번역할 수 있다. (자료:Microsoft)

 

번역 과정에서 원본 레이아웃과 형식을 최대한 유지하면서 파일을 번역하기 때문에, 번역 후 레이아웃을 다듬는 편집 과정을 최소화할 수 있는 것이 장점이다. 일반 텍스트나 HTML 형식으로 번역 파일을 저장하는 것도 가능하다. 파일 형식은 docx, pptx, txt, html, tab, xlf, msg, tmx, xlsx, pdf, tsv를 지원한다.

 

참고로 docx는 마이크로소프트 워드, pptx는 마이크로소프트 파워포인트, xlsx는 마이크로소프트 엑셀, msg는 마이크로소프트 아웃룩(Outlook) 내에서 생성 또는 저장된 이메일 메시지 파일이다. tsv와 tab는 스프레드시트에서 사용하는 탭으로 구분된 원시 데이터 파일, tmv는 CAT(Computer Aided Translation) 및 TM(Translation Memory)를 교환하는 데 사용하는 개방형 XML 표준이다.

 

특히, 사용자 지정 번역기나 사용자 정의 용어집을 활용할 수 있기 때문에, 기술 번역이나 전문 영역에 대한 번역 품질을 높일 수 있다. 사용자 정의 용어집에는 특정 단어나 구문에 대한 의미를 해당 업계나 업무에서 사용하는 용어를 정의하고, 이를 업로드해서 번역 작업에 활용함으로써 번역의 정확성을 높일 수 있도록 했다.

 

문서 번역 서비스 이용은 먼저 애저 계정으로 로그인하는 것부터 시작한다. 로그인은 기존의 애저 계정을 활용하거나 없다면 먼저 계정을 만들어야 한다. 애저에 로그인하면 '애저 블랍 스토리지(Azure blob storage)'에 번역할 문서 파일을 업로드하고, 문서 번역 서비스에서 번역 요청을 한다. 파일에 대한 번역이 진행되는 동안 작업 상태를 모니터할 수 있고, 번역이 완료된 문서는 블랍 저장소에서 검색할 수 있다.

 

사용 요금은 번역한 글자 단위로 과금이 이루어지며, 일반 번역과 사용자 지정 번역 모델에 따라 가격이 달라진다. 일반 모델의 경우는 백만 자당 15달러(Pay-as-you-go – $15 per million characters)를 받는다. 사용자 지정 변역은 종량제만 이용할 경우 백만 자당 40달러를 내고, 정액제와 종량제를 결합한 C2, C3, C4 가격 모델을 선택하는 것도 가능하다.

 

한 달에 2,055달러인 C2 요금은 최대 6,250만 자까지 번역 할 수 있고, 이를 초과하면 백만 자당 32.88달러가 과금된다. 한 달에 6,000달러인 C3는 한 달에 최대 2억 5,000만 자 까지 번역할 수 있고, 이를 초과하면 백만 자당 24달러가 부과된다. C4의 경우는 한 달 요금 4만 5,000달러로 최대 25억 자까지 번역이 가능하고, 이를 초과하면 백만 자당 18달러를 받는다.

 

 Syndicated to WWW.CIOKOREA.COM

반응형