본문 바로가기

반응형

음성 인식

사람 말귀 더 잘 알아듣는 AI...오픈AI, 다국어 음성 인식 '위스퍼' 아키텍처 공개 '음성을 인식한다'는 하나의 문장에는 많은 의미가 들어가 있다. 사람 목소리를 알아듣고, 어떤 언어를 사용하는지 알 수 있어야 하고, 말하는 내용을 이해할 수 있어야 하며, 때로는 맥락까지 간파해야 한다. 결국 인공 지능이 '음성을 인식할 수 있다'는 것은, 궁극적으로 '인간 수준'의 정확성과 완벽함을 가진 언어 능력을 가지고 있어야 한다. 오픈AI(OpeanAI)가 공개한 위스퍼(Whisper)는 바로 그런 수준의 음성 인식 수준을 갖는 인공 지능을 개발하기 위한 오픈 소스 기반 다국어 음성 인식 아키텍처다. 음성 인식을 통한 유용한 애플리케이션을 구축하고, 강력한 음성 처리를 위한 연구에 활용할 수 있는 모델 및 추론 코드를 깃허브(github)를 통해 공개했다. 오픈AI가 공개한 위스퍼는 다국어 및.. 2022. 9. 23. 더보기
2026년까지 음성 인식 시장 21.6% 성장...스마트 기기와 인공 지능이 시장 견인 전 세계 음성 인식 시장 규모가 2026년까지 연평균 21.6% 성장할 전망이다. 2021년 약 83억 달러로 예측된 시장 규모는 2026년에 22억 달러까지 증가할 것으로 추정된다. 스마트 기기의 사용 증가와 함께 인공 지능 기술의 발전 및 적용 범위가 확대되면서, 음성 인식을 기반으로 한 서비스와 사용자 경험의 확대가 시장 성장을 이끌 것으로 예측됐다. 마켓앤마켓(MarketsandMarkets)이 '2026년까지 발화 및 음성 인식 시장(Speech and Voice Recognition Market - Global Forecast to 2026)' 보고서를 발표했다. 조사 대상 항목은 전달 방법, 배포 모드, 기술, 지역 등으로 구분해 진행했다. 배포 모드는 클라우드와 온프레미스/임베디드, 기술은.. 2021. 9. 7. 더보기

반응형