태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.
  •MAC.i.Life | ⓩABOUT.me | RSS FEED
Digital & Analogue LifeStyle Webzine
 
🄲 • CATEGORY • 카테고리
ZOOM IN @LL (1768)N
🅘•INFORMATION•IMPROVEMENT (68)
🅝•NEWS•NOTICE (1354)N
🅢•STYLE•STORY (8)
🅘•IMAGINE•INSPIRE (19)
🅖•GOODNESS•GENUINE (6)
🅗•HEART•HEALING (15)
🅣•TREND•TECHNOLOGY (296)
🅱 • Buyer's Guide • 구매 가이드
🆃 • TODAY's PHOTO • 오늘의 사진
🅁 • RECENT ARTICLE • 최근 기사


🄿 • POPULAR ARTICLE • 인기 기사



[기획] 처음 사용자를 위한 '애플워치 구매 가이드'...5가지만 알면 한결 수월하다!
애플, 오버이어 무선헤드폰 에어팟 맥스 발표...잡음 제거, 공간 음향, 적응형 EQ 지원
먼지, 바이러스, 체온 감지하는 스마트 마스크…’소셜 마스크’, 컨셉 디자인으로 마스크 진화방향 제시
[BrandStory]시리얼 1, 할리데이비슨의 DNA 물려받은 프리미엄 전기 자전거
새로운 맥 OS 빅 서(Big Sur) 정식 출시..11월 13일부터 다운로드 및 업그레이드 가능
202더 강력하고 더 빠르고 더 오래간다...애플, M1 칩 탑재 맥북 에어/프로 & 맥미니 발표
애플, 4가지 아이폰 12 시리즈 발표...A14 바이오닉, 맥세이프, 돌비 비전으로 혁신
완전 무선이어폰도 슬립테크 시장 가세…보스, 수면전용 ‘슬립버즈 II’ 발표
배터리로 최대 2년 사용하는 스마트홈 보안 카메라 ...아마존,  '블링크 인도어 & 아웃도어' 발표
마스크? No! 웨어러블 공기청정기...LG전자, 퓨리케어 웨어러블 IFA 2020에서 공개
갈수록 똑똑해지는 스마트 스피커…아마존, 알렉사에 그룹대화 등 4가지 기능 추가
LTE 지원 윈도10 2-in-1 노트북…레노버, '요가 듀엣 7i' 및 '아이디어패드 듀엣 3i'
애플, '아이폰 SE' 128GB 62만원에 출시...성능은 높아지고 가격은 내려가고
아이패드, 노트북이 되다?!... 애플, '더 진화한 아이패드 프로와 스마트 키보드' 출시
'8GB 메모리+256GB SSD'부터 시작...애플, '성능은 업 가격은 다운' 신형 맥북 에어 출시
스마트폰, 태블릿, 노트북 충전기를 하나로...사테치, 108W PRO 데스크톱 충전기
20초면 손목에서 체성분 분석!...아우라 스트랩, 애플워치와 체성분분석기의 만남
순찰용 인공지능 & 자율비행 드론...선플라워 랩, 보안용 드론 시스템

2020. 8. 28. 04:44

마이크로소프트의 댄 패리쉬 수석 그룹 PM 관리자(Dan Parish, Principal Group PM Manager)가 애저 코그너티브(Azure Cognitive Services) 인공지능 플랫폼을 활용한, 마이크로소프트 365(Microsoft 365) 워드(Word)의 전사(transcription)와 음성 명령(Voice Commands)으로 받아쓰기' 기능을 '마이크로소프트 365 블로그'를 통해 공개했다.

 

'마이크로소프트 365'는 ‘오피스 365’의 새 이름으로, 워드, 엑셀, 파워포인트, 원노트 등으로 구성된 클라우드 서비스다. 마이크로소프트 365는 두 가지 방법으로 사용한다. 첫 번째는 PC, 태블릿, 스마트폰에 앱을 다운로드받은 후 설치해서 사용한다. 두 번째는 앱을 설치할 필요 없이 웹 브라우저로 서버에 접속한 후 사용하는 방법이 있다.

 

| 애저 코그너티브와 마이크로소프트 365의 만남

 

AI 플랫폼의 활용 방법은 무궁무진하다. 인공지능에게 스스로 재주와 실력을 키워가는 기계학습 능력을 부여하고, API(Application Programming Interface)라는 문을 달고 길을 열어주면, 만능은 아니지만 팔방미인 소리는 들을 수 있는 다양한 솔루션과 서비스를 만들어 낼 수 있다.

 

마이크로소프트의 애저 코그너티브가 그런 것 중에 하나다. 기계 학습에 대한 전문지식이 없는 개발자라도, API 호출만으로 보고, 듣고, 말하는 것과 관련된 인공지능 능력을 응용프로그램에 적용할 수 있다. 물론 마이크로소프트도 애저 코그너티브를 자사 제품에 활용한다.

 

애저 코그너티브는 음성, 언어, 비전, 앱서치 등의 인공지능 서비스를 인공지능에 관한 전문지식이 없는 개발자도 쉽게 사용할 수 있도록 API로 제공한다. (화면:Microsoft)

 

이번에 발표한 마이크로소프트 365에서 ‘음성 명령으로 받아쓰기’와 웹 버전 워드(Word)에서 사용할 수 있는 ‘전사’ 기능은, 이러한 마이크로소프트 코그너티브 서비스와 연동해서 제공하는 기능이다. 음성 인식과 분석을 코그너티브와 연동해서 처리하고, 이를 통해 음성 녹음 파일을 문서로 빠르고 간편하게 변환한다.

 

전사와 받아쓰기는 목소리에 담긴 ‘내용’을 문자, 문장, 문서로 변환해 준다는 점에서 같다. 그러나 전사는 우선 녹음 파일을 전송하면 이를 분석해서 변환하는 과정을 거치고, 받아쓰기는 마이크에 실시간으로 입력되는 목소리를 분석해 변환한다는 점이 다르다.

 

| 마이크로소프트 365 웹용 워드(Word)에서 '영어 전사’ 기능 지원

 

‘전사transcription, 轉寫)’의 사전적 의미는, 데이터나 정보의 기록 형태를 바꾸는 것이다. 마이크로소프트 365 워드에서 말하는 전사는, 사람의  음성을 문서화하는 것을 의미한다. 즉, 녹음된 사람의 음성을 분석하고 인식한 후, 문자 형태로 변환한 문서로 바꾸는 기능이다.

 

이제 웹 브라우저로 사용하는 웹 버전 워드에서는 이러한 ‘전사’ 기능을 사용할 수 있다. 다양한 언어를 지원하면 좋겠지만 지금은 ‘영어(EN-US)’만 사용할 수 있다. 영어로 녹음된 음성 메모, 회의 내용, 인터뷰, 토론, 강의 파일을, 인공지능 플랫폼을 활용해 자동으로 문자와 문장으로 변환해 준다.

 

마이크로소프트 365 워드 앱 버전을 이용하면, 음성 녹음 파일을 자동으로 문서로 변환할 수 있는, 전사 기능을 간편하게 사용할 수 있다. (화면 : Microsoft)

 

웹 기반의 마이크로소프트 365 워드에서 전사 기능을 사용하는 방법은 두 가지다. 메뉴에서 전사(Trandscribe)를 선택 한 후, 오디오 파일을 업로드하거나 직접 녹음하면 된다. 지원하는 오디오 파일 형식은 파일 확장자를 기준으로,   MP3, WAV, M4A, MP4 네 가지다.

 

웹 버전에서만 사용할 수 있는 만큼 브라우저도 호환되어야 하는데, 현재는 크롬(Chrome)과 마이크로소프트 엣지(Microsoft Edge)에서 사용할 수 있다. 한 번에 업로드할 수 있는 오디오 파일의 최대 크기는 200MB로 제한된다. 녹음 시간을 기준으로 하면 한 달에 최대 5시간 분량만 전사 기능을 제공한다.

 

전사 기능은 두 사람 이상이 대화할 때, 말하는 사람을 감지하는 기능을 갖추고 있다. 따라서 단순 대화, 인터뷰, 화상 통화나 회의 녹음 파일을 간편하고 빠르게 대본 또는 문서로 변환할 수 있다. 재택근무의 확산으로 원격 회의가 일상이 된 업무 환경에서, 회의가 끝난 후 회의 내용을 요약해 회의록을 만들 때 유용하게 활용할 수 있다.

 

| ‘음성 명령’과 ‘받아쓰기’로 키보드 필요 없는 문서작성

 

'받아쓰기(Dictate)’ 기능은 이미 지원했던 기능이다. 받아쓰기는 사람의 음성을 실시간으로 인식해, 이를 문자, 단어, 문장으로 변환하는 기능이다. 말 그대로 ‘받아 적는’ 기능을 말하는데, ‘음성 명령으로 받아쓰기’는 여기에 ‘음성 명령’ 기능을 추가한 것이다.

 

받아쓰기 기능을 활용해도, 키보드를 사용해야 하는 경우가 있다. 특정 메뉴나 기능을 호출하거나, 특수 문자 등을 입력할 때가 그렇다. 예를 들어 ‘시작 목록’처럼 문서 형식을 지정하거나, ‘마지막 굵은 문장’처럼 문장 형태를 지정할 때, 키보드가 아닌 음성으로 명령을 호출해서 적용할 수 있다.

 

‘음성 명령으로 받아쓰기’는 음성 변환뿐만 아니라, 기능 선택이나 명령 실행을 음성으로 수행할 수 있다. 실시간으로 마이크로 입력되는 목소리를 문장으로 변환하고, 음성 명령으로 키보드 사용을 최대한 줄일 수 있다. (화면:Microsoft)

 

‘&’ 기호를 입력하고 싶을 때는 "엠퍼샌드(ampersand)", ‘%’ 기호를 입력할 때는 “퍼센트 사인(percent sign)”이라고 말하면 된다. “스마일리 페이스(smiley face)”, “하트 이모지(heart emoji)”라고 말해서 이모티콘을 입력하는 것도 가능하다. 잠깐 받아쓰기를 멈춰야 할 때는 “포즈 딕테이션(pause dictation)”이라고 말하면 된다.

 

이러한 음성 명령 중에는 기존에 지원하던 것도 있지만 중요한 것은 ‘자연스러움’이다. 마이크로소프트는 사람들이 자연스럽게 말하는 방식으로 음성 명령을 사용할 수 있다고 밝혔다. 또렷하고 또박또박하게 마치 로봇처럼 발음할 필요가 없다는 의미인데, 얼마나 정확하게 인식할 수 있는지가 활용성을 좌우하는 요소가 될 것으로 보인다.

 

받아쓰기는 웹, 윈도, 맥OS, 아이폰, 안드로이드폰에서 사용할 수 있다. 다만, 윈도와 맥OS 버전은 마이크로소프트 365 구독자에게만 받아쓰기 버튼이 표시된다고 ‘워드에서 문서 받아쓰기’에 소개되어 있다. 받아쓰기에 관한 자세한 사용법은 ‘마이크로소프트 365에서 받아쓰기’를 참조하면 된다.

 

받아쓰기가 가능한 언어는 사용하는 장치와 운영체제 버전에 따라 차이가 있을 수 있다. 예를 들어 맥OS 용 워드(버전 16.40)에서는 받아쓰기 언어에 한국어가 없지만 아이폰 앱에서는 한국어를 인식한다(2020년 8월 28일 기준). 맥OS 버전에서 현재 받아쓰기 가능한 언어는 영어(미국, 영국, 캐나다), 독일어, 프랑스어, 이탈리아어, 스페인어(멕시코, 스페인) 등이다.

 

 Syndicated to WWW.CIOKOREA.COM