TTS 썸네일형 리스트형 오디오에서 추론→음성 생성→실시간 소통…구글, “대화가 AI와 소통하는 핵심적인 방법될 것” “인간의 대화는 풍부하고 미묘한 차이가 있으며, 말의 내용뿐만 아니라 말투, 억양, 심지어 웃음과 같은 비언어적 발성까지 그 의미가 전달된다. 우리는 대화가 AI와 상호 작용하는 핵심적인 방식이 될 것이라고 믿는다. 그래서 제미나이는 오디오에서 음성을 추론하고 생성하여 효과적인 실시간 커뮤니케이션을 가능하게 한다.”구글(Google)이 제미나이(Gemini)에서 제공하는 오디오 기능은 단순한 음성 합성이나 인식의 단계가 아니라 인간과 AI가 실시간으로 소통하는 가장 중요한 방법이 될 것이라고 밝혔다. 구글 I/O 2025에서 쏟아냈던 다양한 AI 서비스와 기능 중에 하나였던 AI 기반 오디오 대화 및 생성에 대한 좀 더 자세한 설명을 블로그를 통해 공개했다.구글 제미나이 2.5 플래시 미리 보기에서 지원.. 2025. 6. 13. 더보기 직접 만든 콘텐츠에 AI 성우 목소리를...머프, 사람만큼 자연스러운 AI 음성 라이브러리 기계적으로 합성한 사람의 목소리는 실제 사람의 그것과 확실하게 구별된다. 그런 때가 있었다. 내용을 알아듣는 데 문제는 없지만, 누가 들어도 사람의 목소리는 아니었다. 텍스트를 음성으로 바꿔주는 TTS(Text To Speech)를 사용하는 분야는 다양한데, 이런 로봇처럼 어색한 목소리와 함께 생활하는 시간이 제법 길었다. 하지만 인공 지능이 본격적으로 음성 합성에 활용되면서 확연히 구별 되던 그 경계가 점점 사라지고 있다. 미국 스타트업인 머프.에이아이(MURF.AI)는 2020년에 10월에 설립된 새내기 기업이다. 인공지능 기반의 음성 합성 기술을 활용해 다양한 언어의 목소리를 서비스로 제공하는데, 언어에 따라 조금씩 차이는 있지만 사람 목소리처럼 편하고 자연스럽다. 2022년 9월 기준으로 21개 .. 2022. 9. 22. 더보기 AWS, 챗봇을 위한 대화형 AI '아마존 렉스'에서 한국어 지원 AWS(Amazon Web Service)가 제공하는 대화형 챗봇 서비스인 아마존 렉스(Amazon Lex)가 한국어를 지원한다. 한국어 기반의 대화형 챗봇을 빠르고 간편하게 개발 및 구축하고, 이를 활용한 다양한 서비스를 제공할 수 있게 됐다. 다만, 아직은 서울 리전에서 제공하지 않고, 도쿄 리전에서 사용할 수 있다. AWS는 향후 서울 리전에서도 서비스를 제공할 계획이라고 밝혔다. 챗봇은 '채팅 로봇'의 줄임말로 음성 및 텍스트를 기반으로 한 대화 경험을, 스마트폰이나 태블릿과 같은 모바일 장치, 웹브라우저, SNS나 커뮤니케이션 플랫폼 등에서 제공하는 서비스다. 딥 러닝, 자연어 처리 등의 인공지능 기술과 텍스트를 음성으로 변환하는 TTS(Text To Speech) 기능 등으로 구성된다. 아마존.. 2021. 9. 14. 더보기 이전 1 다음