본문 바로가기

반응형

음성인식

매월 10억분 이상의 음성 언어 처리...구글, 스피치 AI 폭발적인 성장과 활용 소개 인간과 컴퓨터 사이의 상호 작용을 '입력'과 '출력'이라는 건조하고 기계적인 단어로 정의하던 때가 있었다. 지금도 그때와 별로 달라진 것이 없는 것 같지만 실상은 그렇지 않다. 컴퓨터, 스마트폰, 스마트 스피커나 디스플레이와 같은 컴퓨팅 도구와 '말'로 소통하는 것이, 일상적인 수준으로 가능한 세상이 열렸기 때문이다. 문자를 음성으로 변환(TTS;Text-To-Speech)하거나 음성을 문자로 변환(STT:Speech-To-Text)하는 기술은, 사람과 컴퓨팅 도구의 상호작용에서 새로운 지평을 열명 혁신의 길을 넓혀가고 있다. 특히 음성을 문자로 인식, 분석, 변환하는 STT가 AI 기술과 결합하면서, 스피치 AI 분야는 경계를 특정할 수 없을 만큼 다양한 분야로 확산되고 확대되고 있다. 엠바디드의 목시.. 더보기
[뭘까?] 인공지능 스피커는 스마트폰처럼 필수, SK텔레콤 'NUGU CANDLE' 모든 길은 인공지능으로 통한다고 해도 과언이 아닐 정도로, 4차산업혁명을 말하는 지금 ‘인공지능’은 그야말로 핫 이슈다. 다양한 인공지능 플랫폼, 서비스, 제품 등이 자고 나면 봇물 터지듯 쏟아져 나온다. 일상생활 속에서는 체감하기 힘든 것도 있고, 어떤 것은 생활 속에서 색다른 라이프 스타일을 만들어 주기도 한다. SK텔레콤의 누구(NUGU)는 라이프 스타일을 바꿔주는 대표적인 인공지능 서비스다. 누구는 인공지능 스피커를 기반으로 다양한 서비스를 이용할 수 있다. 아마존의 알렉사, 애플의 시리, 구글의 구글 어시스턴트와 기본적인 출발점은 같다. 하지만 우리나라 시장을 겨냥한 토종 브랜드인 만큼, 일상생활에서 요긴하게 활용할 수 있는 서비스와 기능이 적지 않다. 누구는 인공지능 시스템과 네트워크로 연결된.. 더보기
‘음성’ 의료 기록 ‘문자’로 변환…아마존, 의료용 자동 음성 인식 기능 출시 AWS(Amazon Web Services)가 의료 분야에 특화된 기계학습 자동 음성인식(ASR;Automatic Speech Recognition) 서비스인 '아마존 트랜스크라이브 메디컬(Amazon Transcribe Medical, 이하 ATM)’을 출시했다. ATM은 AWS가 기존에 제공해 오던 아마존 트랜스크라이브를, 의학전문용어까지 인식하고 문자로 변환할 수 있도록 확장한 관리형 서비스다. 아마존 트랜스크라이브는 음성 인식과 문자 변환을 서비스 형태로 제공하고, 사용한 만큼 비용을 지불하고 확장과 축소가 간단하다. 스마트폰, 태블릿, 컴퓨터 등에 장착된 마이크를 통해 음성을 캡처해, 웹 소켓 프로토콜 기반의 스트리밍 API로 보내면, 실시간으로 음성을 인식하고 텍스트로 변환한다. 이렇게 인식과.. 더보기
[AI 스피커 NUGU] #06 | 1인 헤어샵으로 간 AI 스피커, 스마트한 활용 방법 5가지 아무리 작은 동네 미용실이라도 두 세 명의 직원들이 있는 풍경이 이제까지는 익숙했다. 개인 미용실이라도 규모가 제법 커서 기업이라고 불러도 손색이 없는 헤어샵도 적지 않다. 그런 헤어샵 시장에 요즘 변화가 생기기 시작했다. 단 한 명의 헤어디자이너가 운영하는 개성 넘치고 트렌디한 1인 헤어샵이 새로운 트렌드로 떠오르고 있다. 여럿이 하던 일을 혼자서 해야 하는 변화가 생기면, 생각부터 시스템까지 모든 것이 바뀌어야 한다. 규모는 작아졌지만, 만족감은 높은 서비스를 제공해야 하고, 그곳을 찾게 만드는 특별한 이유나 동기도 뚜렷해야 한다. 그런 1인 헤어샵을 운영하고 싶을 때, 인공지능 스피커 누구는 비용 부담 걱정할 필요 없는 스마트한 파트너로 제격이다. 인공지능 스피커 1인 헤어샵에서 활용하기 Tip 0.. 더보기
[AI 스피커 NUGU] #05 | 어린이집으로 간 스마트 스피커, 재미있고 신기한 척척박사 아이들은 쑥쑥 자란다. 좋은 것만 골라 먹이는 엄마의 마음 따라 몸이 쑥쑥 자라고, 보고 듣고 접할 것이 많아진 세상 속에서 생각이 쑥쑥 자란다. 신나게 놀고, 재미있게 공부하고, 맛있는 꿀잠 자고, 궁금할 땐 끊임없이 물어보면서. 그렇게 아이들은 하루하루 자신의 시간표를 멋지게 채워간다. 아이들에게 세상은 신기하고 이상한 것투성이다. 편견이라는 안경 없이 세상을 마주하는 아이들 앞에서, 호기심은 생각의 나무를 무럭무럭 자라게 하는 튼튼한 뿌리와 같다. 그런 아이들에게 인공지능 스피커는 재미와 지식이라는 두 마리 토끼를 한 번에 잡을 수 있는 좋은 친구나 선생님 같은 존재로 부족함이 없다. 나의 파트너 NUGU | 01 아이들이 좋아하는 노래, 인공지능 스피커 속에 가득 있어요 아이들이 모여서 시간을 보.. 더보기
[AI 스피커 NUGU] #04 | 동아리방으로 간 스마트 스피커, 편리하고 재미있는 동아리 막내 생각이 비슷하고 마음이 맞는 사람끼리 모이면, 시간의 색과 삶의 향기가 달라진다. 때로는 주고, 때로는 받고. 그렇게 나누고 공유하는 삶 속에서, 우리는 혼자서는 살 수 없는 존재라는 것을 알게 된다. ‘동아리’라는 낱말 속에는 그런 따스함과 편안함이 스며 있다. 함께할 수 있는 사람들이 모이고, 그렇게 모인 우리가 함께하는 공간. 언제였던가, 그 때까지만 해도 동아리는 대학생만을 위한 낭만의 섬이었다. 그러나 이제는 나이, 성별, 직업과 상관없이 원하면 함께할 수 있는 모든 사람들을 위한 생활의 숲으로 자라나고 있다. 작으면 작은대로 모이고, 크면 큰 대로 함께하는 공간. 소셜네트워크 안에 마련한 방이 되기도 하고, 그들만의 아늑한 아지트를 마련해 모이기도 한다. 나의 파트너 NUGU | 01 모임부터.. 더보기
[AI 스피커 NUGU] #03 | 환우 곁에 스마트 스피커, 편하고 즐거운 간병 도우미 듣거나 보아서 아는 것과 사용하고 경험해서 아는 것에는 차이가 있다. 선입견 또는 편견이 있었거나 기대 혹은 관심이 없었다면, 그렇게 머리로만 알고 있을 때와 직접 체험한 후의 간극이 훨씬 커진다. 백 번 듣는 것 보다는 한번 보는 것이 낫고, 한번 보는 것은 직접 경험해 보는 것을 넘어설 수 없다. 인공지능 스피커가 바로 그런 물건 중에 하나다. 아는 것과 써본 것의 차이가 기대 이상이다. 생각보다 편리하고, 기대했던 것보다 쓸모가 많다. 무엇보다 똑같은 기능이라도 사용하는 사람과 놓여있는 장소에 따라 카멜레온처럼 다양한 모습으로 변신한다. 나의 파트너 NUGU | 01 날짜부터 날씨까지, 생활정보 이제 물어만 보세요 건강을 잃으면 아주 사소한 일도 버겁게 다가온다. 건강할 때는 의식조차 할 수 없었던.. 더보기
[AI 스피커 NUGU] #02 | 작은 책방 속의 AI스피커, 아날로그 지성과 디지털 감성의 만남 그 많던 동네 서점이 멸종 위기에 놓였다. 대형 서점에 눌리고 온라인 서점에 밀려서다. 위기에 놓이기는 했지만 아직은 멸종된 것은 아니다. 오히려 위기를 기회로 삼아, 새롭게 변신하기도 한다. 개성은 생존의 무기다. 독립서점, 북클럽, 북살롱, OO 책방으로 불리는 새롭게 진화한 서점들이 그렇다. 굳이 따지고 들면 조금씩 생존이나 운영 방법이 다르긴 하다. 하지만 선택과 집중을 통해 작아도 알찬 ‘책방’이라는 울림을 주며, 관심과 사랑을 받는 곳들이 하나둘씩 생겨나고 있다. 아날로그 감성이 살아 숨 쉬는 디지털 시대의 작은 책방, 그곳에 인공지능 스피커는 의외로 궁합이 잘 맞는 물건이다. 나의 파트너 NUGU | 01 소소한 일상에 어울리는 클래식으로 꾸미는 감성 공간 공간이 감성의 문을 열어주는 열쇠가.. 더보기
[AI 스피커 NUGU] #01 | NUGU와 한가족이 되고 싶을 때, 알아두면 좋은 NUGU 이야기 어떤 사람들은 인공지능에 대해 오해 또는 편견이 있다. 모든 면에서 인공지능이 인간보다 뛰어나다고 생각한다. 하지만 인공지능의 ‘지능’은 단순하게 사람의 ‘지적’ 수준과 비교할 수 있는 대상이 아니다. 인공지능은 특정한 작업에만 최적의 능력을 발휘하도록 설계되어 있고, 사람의 두뇌는 수많은 변수와 상황을 종합적으로 처리해야 한다. 인공지능이 인간의 두뇌를 능가할 수 있는 날이 올 수 있을지는 아무도 장담할 수 없다. 그렇지만 적어도 지금의 인공지능은 한 가지만 잘해도 그 능력을 인정받을 수 있을 만큼, 매력적이고 무한한 잠재력을 가지고 있다. 특히 ‘음성인식’ 분야에서는 더는 신기한 것이 아니라, 일상생활 속에서 자연스럽게 접할 수 있는 현실이 되어 있다. 나의 파트너 NUGU | 01 NUGU는 도대체.. 더보기
구글 어시스턴트 개발자가 말하는...음성 기술에 대한 다섯 가지 통찰력 말로 대화하는 것은 사람만의 특권이며 고유 영역이다. 얼마 전까지만 해도 그랬다. 그런데 불과 몇 년 사이, 사람이 사람이 아닌 것과 대화하는 것이 현실이 됐다. 아직은 ‘대화’라기 보다 ‘음성 인식’에 가깝지만, 그것으로 인해 많은 것이 변하고 달라지고 있다. 구글의 어시스턴트 역시 그런 음성 인식 서비스 중에 하나다. 구글의 엔지니어링 부사장인 스콧 허프먼(VP, Engineering, Google Assistant)이 구글 어시스턴트를 운영하며 경험한, 개발자와 운영자 관점에서 본 음성 인식과 기술에 대한 내용을 다섯 가지로 요약해 구글 공식 블로그에 소개했다. 사람들이 음성 인식을 통해 하고자 하는 것들, 음성인식을 사용하는 패턴, 그것에 대한 기대 등에 관한 내용이다. 그가 블로그를 통해 소개한.. 더보기

반응형