본문 바로가기

반응형

AI

사람 말귀 더 잘 알아듣는 AI...오픈AI, 다국어 음성 인식 '위스퍼' 아키텍처 공개 '음성을 인식한다'는 하나의 문장에는 많은 의미가 들어가 있다. 사람 목소리를 알아듣고, 어떤 언어를 사용하는지 알 수 있어야 하고, 말하는 내용을 이해할 수 있어야 하며, 때로는 맥락까지 간파해야 한다. 결국 인공 지능이 '음성을 인식할 수 있다'는 것은, 궁극적으로 '인간 수준'의 정확성과 완벽함을 가진 언어 능력을 가지고 있어야 한다. 오픈AI(OpeanAI)가 공개한 위스퍼(Whisper)는 바로 그런 수준의 음성 인식 수준을 갖는 인공 지능을 개발하기 위한 오픈 소스 기반 다국어 음성 인식 아키텍처다. 음성 인식을 통한 유용한 애플리케이션을 구축하고, 강력한 음성 처리를 위한 연구에 활용할 수 있는 모델 및 추론 코드를 깃허브(github)를 통해 공개했다. 오픈AI가 공개한 위스퍼는 다국어 및.. 2022. 9. 23. 더보기
직접 만든 콘텐츠에 AI 성우 목소리를...머프, 사람만큼 자연스러운 AI 음성 라이브러리 기계적으로 합성한 사람의 목소리는 실제 사람의 그것과 확실하게 구별된다. 그런 때가 있었다. 내용을 알아듣는 데 문제는 없지만, 누가 들어도 사람의 목소리는 아니었다. 텍스트를 음성으로 바꿔주는 TTS(Text To Speech)를 사용하는 분야는 다양한데, 이런 로봇처럼 어색한 목소리와 함께 생활하는 시간이 제법 길었다. 하지만 인공 지능이 본격적으로 음성 합성에 활용되면서 확연히 구별 되던 그 경계가 점점 사라지고 있다. 미국 스타트업인 머프.에이아이(MURF.AI)는 2020년에 10월에 설립된 새내기 기업이다. 인공지능 기반의 음성 합성 기술을 활용해 다양한 언어의 목소리를 서비스로 제공하는데, 언어에 따라 조금씩 차이는 있지만 사람 목소리처럼 편하고 자연스럽다. 2022년 9월 기준으로 21개 .. 2022. 9. 22. 더보기
아바타 제작도 클라우드 AI로 간편하게...엔비디아, '옴니버스 ACE' 발표 메타버스와 같은 가상세계에서 활동하고 활약하는 사람을 구현하는 것은 쉽지 않은 작업이다. 존재하지 않는 가상의 인물을 만들어낼 수도 있고, 실제로 존재하는 사람을 가상공간에 맞게 모델링할 수 있다. 어떤 경우가 되었든 가상 비서나 디지털 휴먼처럼 상호작용이 가능한 가상인물을 만들어 실제로 활용하려면, 이를 구축하고 구현해서 배포할 수 있는 기술, 장비, 인력 등이 있어야 한다. 엔비디아가 이러한 작업을 개발자가 좀 더 쉽고 간편하게 할 수 있는 클라우드 기반 AI 모델 및 서비스 모음인 '엔비디아 옴니버스 아바타 클라우드 엔진(NVIDIA Omniverse Avatar Cloud Engine, 이하 옴니버스 ACE)를 발표했다. 옴니버스 ACE를 활용하면 상호작용이 가능한 대화형 아바타를 빠르고 쉽게 구.. 2022. 8. 11. 더보기
마케팅 & 감성 & 제너레이티브 AI 등...가트너, 디지털 광고 4가지 신기술 선정 "마케팅을 위한 인공 지능(AI for marketing), 감성 인공 지능(Emotion AI), 인플루언스 엔지니어링(Influence engineering), 제너레이티브 인공 지능(Generative AI)이 디지털 광고에 혁신적 영향을 미칠 것으로 예상되는 4가지 신기술로 확인됐다. 광고에서의 인공 지능의 역할 확대는 10년 이내에 예상되지만 개인 정보 보호 문제가 진행을 방해할 수 있다." 가트너가 '2022년 디지털 광고에 대한 가트너 하이프 사이클(Gartner Hype Cycle for Digital Advertising, 2022)'을 발표하고 주목할 만한 네 가지 혁신적인 신기술을 선정했다. 마케팅을 위한 인공 지능, 감성 인공 지능, 인플루언스 엔지니어링은 향후 5-10년 안에 안정.. 2022. 8. 4. 더보기
100만 명에게 AI 이미지 생성 제공...오픈AI, DALL·E 2 베타 출시 오픈AI가 인공 지능을 활용한 이미지 생성 및 편집 AI 시스템인 DALL·E 2를 베타 버전으로 일반 사용자에게 제공한다. 앞으로 몇 주 동안에 걸쳐 대기자 명단에 등록한 사용자 100만 명을 초대하고, 이들은 무료로 제공되는 크레딧을 활용해, 이미지를 생성, 편집, 변형할 수 있다. 더 많은 이미지를 얻거나 편집하고 싶은 사람은 추가 크레딧을 유료로 구매해서 사용할 수 있다. DALL·E는 오픈AI가 지난 2021년 1월에 공개한 영어를 사용하는 자연어 처리 기반 이미지 생성 인공 지능이다. 자연어 형태의 문자(Text)와 이미지를 사용해서, 텍스트 설명을 이해하고 이를 기반으로 이미지를 생성한다. 오픈AI는 테슬라의 설립자인 일론 머스크 등이 2021년 설립한 인공 지능연구소로, GPT-3(Gene.. 2022. 7. 23. 더보기
AI 기술을 물리적 공간에 접목...아마존, 고객 경험 개선하는 4가지 기술 저스트 워크 아웃(Just Walk Out), 아마존 원(Amazon One), 아마존 대시 카트(Amazon Dash Cart), 아마존 프레시(Amazon Fresh), 아마존 스타일(Amazon Style)에는 두 가지 공통점이 있다. 첫째는 온라인 쇼핑의 공룡이라 불리는 아마존이 오프라인 매장을 운영하며 개발한 기술이나 브랜드이고, 둘째는 인공 지능과 같은 첨단 기술을 활용한 혁신으로 고객 경험을 개선한 대표적인 사례라는 점이다. 아마존 물리 소매 기술(Physical Retail and Technology) 담당 부사장인 딜립 쿠마르(Dilip Kumar)는 '아마존 리마스 2022(Amazon re:MARS 2022)'에서 이러한 내용을 소개하는 자리를 가졌다. 그리고 아마존이 오프라인 매장에.. 2022. 6. 27. 더보기
'2024년까지 금융 AI 절반 연기 또는 취소'...BPO 사용 2년 이내 40%로 증가 "현재 진행 중인 금융 인공지능 프로젝트의 절반이 2024년까지 연기되거나 취소될 것이며, AI용 비즈니스 프로세스 아웃소싱(BPO;Business Process Outsourcing) 사용은 2년 이내에 6%에서 40%로 증가할 것이다. CFO는 사내에서 AI 사용을 확대하는 데 큰 장벽에 직면해 있으며, 디지털 혁신 목표를 달성하기 위해 점점 더 비즈니스 BPO 솔루션으로 눈을 돌릴 것이다." 가트너가 CFO와 재무 담당 임원을 위한 컨퍼런스(Gartner CFO & Finance Executive Conference)에서 금융 분야에서의 디지털 자동화와 인공 지능 기술을 기반으로 한 프로젝트가, 기대했던 효과를 달성하지 못하고 중단이나 연기될 가능성이 높을 것으로 전망했다. 이렇게 자체적으로 진행하.. 2022. 6. 14. 더보기
매월 10억분 이상의 음성 언어 처리...구글, 스피치 AI 폭발적인 성장과 활용 소개 인간과 컴퓨터 사이의 상호 작용을 '입력'과 '출력'이라는 건조하고 기계적인 단어로 정의하던 때가 있었다. 지금도 그때와 별로 달라진 것이 없는 것 같지만 실상은 그렇지 않다. 컴퓨터, 스마트폰, 스마트 스피커나 디스플레이와 같은 컴퓨팅 도구와 '말'로 소통하는 것이, 일상적인 수준으로 가능한 세상이 열렸기 때문이다. 문자를 음성으로 변환(TTS;Text-To-Speech)하거나 음성을 문자로 변환(STT:Speech-To-Text)하는 기술은, 사람과 컴퓨팅 도구의 상호작용에서 새로운 지평을 열명 혁신의 길을 넓혀가고 있다. 특히 음성을 문자로 인식, 분석, 변환하는 STT가 AI 기술과 결합하면서, 스피치 AI 분야는 경계를 특정할 수 없을 만큼 다양한 분야로 확산되고 확대되고 있다. 엠바디드의 목시.. 2022. 4. 25. 더보기
스마트폰으로 건강 이상 감지...구글, 스마트폰+AI 활용 헬스 프로젝트 소개 끊임없이 진화하는 스마트폰의 요즘 진화 코드는 센서와 인공지능을 기반으로 더 똑똑하고 전문적인 영역의 능력을 갖는 것이다. 수많은 기업이 스마트폰에 적용할 수 있는 건강 관리 및 질병 진단에 활용할 수 있는 헬스케어 분야의 기술 개발과 시장 확대에 사활을 걸고 있다. 건강이나 의료 정보를 수집하고 이를 분석해서 실제 적용하려면, 다양한 기술과 기능이 결합한 인프라와 플랫폼이 마련되어 있어야 한다. 구글 역시 스마트폰과 인공 지능 기술을 결합한 기술을 개발 중이며, 구글의 건강 부문 AI(Head of Health AI) 책임자인 그렉 코라도(Greg Corrado)가 구글 블로그를 통해 현재 구글이 진행 중인 몇 가지 프로젝트를 소개했다. 이번에 공개한 연구들은 의사들이 환자 진료에 더욱 효율적으로 대응.. 2022. 3. 31. 더보기
SK하이닉스, 메모리에 연산 기능 추가한 PIM 공개...AI 연산 속도 최대 16배 증가 SK하이닉스가 인모메리(In-Memory) 컴퓨팅 기술인 PIM(Processing In Memory)을 개발하고, 이를 적용한 첫 번째 시제품 GDDR6-AiM(Accelerator in memory)을 발표했다. 인메모리는 데이터를 저장만 할 수 있었던 메모리에 연산 기능을 추가한 것으로, 차세대 메모리 반도체를 혁신할 수 있는 스마트 메모리 기술로 주목받고 있다. GDDR6-AiM은 16 Gbps의 속도로 동작하는 GDDR6(Graphics DDR 6) 메모리 칩에서 직접 데이터 연산을 수행하기 때문에, 일반적인 DRAM 대신 사용하면 특정 작업에서의 계산 속도가 16배 빨라진다고 SK하이닉스는 밝혔다. 기계 학습, 고성능 컴퓨팅, 빅 데이터 처리 등 인공 지능과 데이터 과학 분야에서 채택되면 데이.. 2022. 2. 18. 더보기
랭크브레인(RankBrain)부터 멈(MUM)까지...구글 부사장이 전하는 구글 검색 진화 스토리 "유용한 검색 결과를 제공하기 위해 많은 노력이 필요하며, 언어 이해는 가장 중요한 검색 기술 중 하나다. 인공 지능 및 기계 학습의 발전 덕분에 구글 검색 시스템은 그 어느 때보다 인간의 언어를 더 잘 이해하고 있다. 사실, 우리가 매일 보는 검색의 15%는 완전히 새로운 것이다. 인공 지능은 상상력의 가장 바깥쪽에서도 유용한 결과를 보여주는 데 중요한 역할을 한다." 구글의 판두 나약(Pandu Nayak) 부사장이 구글 검색 시스템에서 인공 지능의 역할과 발전에 대한 비하인드 스토리를 공식 블로그를 통해 소개했다. 단어 기반의 단순 검색에서 출발한 검색 시스템에 인공 지능을 활용한 알고리즘이 적용되면서, 항상 진화하고 있는 세상 사람들의 호기심에 맞춰 검색 시스템도 진화를 거듭하고 있는 것이다. R.. 2022. 2. 15. 더보기
단기 AI 트렌드 혁신을 주도하는 4가지...가트너, 'AI를 위한 하이프 사이클, 2021' "책임 있는 인공지능(Responsible AI), 작고 광범위한 데이터 접근 방식(Small and Wide Data), 인공지능 플랫폼의 운영화(Operationalization of AI Platforms), 모델 및 컴퓨팅 리소스의 효율적인 사용(Efficient Use of Resources). 이 네 가지 트렌드가 단기 인공지능 혁신을 주도하며, 빠른 속도로 인공지능 분야의 진화와 혁신이 진행되고 있다. 가트너가 '인공지능에 대한 하이프 사이클, 2021(Hype Cycle for Artificial Intelligence, 2021)'을 발표하고, 특히 눈여겨 보아아햘 네 가지 트렌드를 강조했다. 이번 보고서는 '2021 하이프 사이클: 신뢰, 성장, 변화를 통한 배달 혁신(2021 Hype.. 2021. 9. 13. 더보기
MS, 'AI, 컴퓨터 비전 및 관련 기술이 IoT 솔루션을 확장하는 4가지 방법' 백서 발표 기술의 '발전' 만큼 중요한 것이 '확장'이다. 한 가지 기술이 진화를 거듭하며 더 나은 단계로 발전하는 것은 중요하다. 하지만 두 가지 이상의 기술이 서로 다른 기술 영역으로 확장하는 것도 새로운 시대를 여는 원동력이다. 하나 더하기 하나가 단순하게 둘이 아니라 그 이상이 될 수 있는 것은, 확장으로부터 잠재적이고 무궁무진한 시너지를 기대할 수 있기 때문이다. 전기를 에너지로 사용하는 거의 모든 것이 네트워크로 연결되고, 그것 중에 많은 것들이 인터넷으로 이어지는, 사물인터넷이 기술을 넘어 일상이 됐다. 사물인터넷은 생각하지 못했거나 불가능했던 것을 현실로 만들었고, 인공지능 역시 그런 세상을 여는 데 큰 역할을 하고 있다. 그리고 그 두 가지가 만나면서 변화와 확장의 속도가 눈에 띄게 빨라지고 있다... 2021. 9. 8. 더보기
5G와 인공지능으로 진화하는 드론...퀄컴, 플라이트 RB5 5G 플랫폼 공개 퀄컴(Qualcomm)이 고성능 소형 무인 항공기를 빠르고 효율적으로 개발할 수 있는 '퀄컴 플라이트 RB5 5G 플랫폼(Qualcomm Flight RB5 5G Platform)을 공개했다. 플라이트 RB5 5G 플랫폼은 5G 및 와이파이 6(Wi-Fi 6), 고성능 저전력 컴퓨팅, 인공지능 엔진 등 최신 기술을 적용해, 다양한 용도의 드론이나 소형 무인 항공기를 제작 및 개발할 수 있는 플랫폼이다. 플라이트 RB5 5G 플랫폼과 함께 공개한 레퍼런스 디자인과 설계 사양을 보면, 기존의 드론과 비교할 때 높은 성능과 다양한 기능을 기대할 수 있다. 인공지능을 지원하는 고성능 프로세서와 결합한 고해상도 카메라를 탑재해, 촬영 및 식별할 수 있는 영상 활용 범위가 비약적으로 향상될 것이라고 퀄컴은 밝혔다... 2021. 8. 19. 더보기
2026년까지 데이터센터 가속기 시장 36.7% 성장...딥러닝 및 클라우드 수요가 견인 전 세계 데이터 센터 가속기 시장이 2021년부터 2026년까지 연평균 36.7%로 성장할 전망이다. 2021년에 137억 달로 추정되는 시장 규모는 2026년 653억 달러로 증가할 것으로 예상된다. 딥 러닝(Deep Learning) 등의 인공지능 기반 운영환경과 클라우드 서비스에 대한 수요가 급증이 시장 성장을 이끌 것으로 예측됐다. 마켓앤마켓이 '2026년까지 글로벌 데이터 센터 가속기 시장(Data Center Accelerator Market - Global Forecast to 2026)'보고서를 발표했다. 보고서는 데이터 센터 가속기 시장을 프로세서 종류, 유형, 응용 프로그램, 지역으로 나누어 분석했다. 프로세서 종류는 CPU, GPU, FPGA, ASIC으로 구분해 조사를 진행했고, 유.. 2021. 7. 20. 더보기
그래프코어, 슈퍼컴 수준의 IPU 성능 달성...MLPerf 벤치마크 결과 공개 그래프코어가 지능형 처리 장치인 IPU-POD64 시스템에 대한 첫 번째 MLPerf 벤치마크 결과를 공개했다. 이번 벤치마크에서 IPU-POD64는 BERT 학습 시간에서 9분, ResNet-50 학습 시간에서 14.5분을 기록했다. 이는 슈퍼컴퓨터에 버금가는 성능으로, 경쟁사와 대비할 때 달러당 성능 지표에서 확고한 우위를 선점한 것이라고 그래프코어는 밝혔다. 컴퓨팅 시스템의 성능은 단순하게 하드웨어의 기계적인 사양만으로는 성능을 객관적으로 평가하기 힘들다. 그래서 필요한 것이 주로 사용하는 용도와 목적에 맞도록 설계된 벤치마크 프로그램이다. 최근 들어 인공지능 처리능력을 극대화한 GPU, IPU 등의 사용 범위와 규모가 커지면서, 이들 시스템이나 플랫폼의 성능을 테스트하는 MLPerf와 같은 벤치마.. 2021. 7. 8. 더보기
AI로 정확하고 빠르게 제품 결함 콕 집어낸다...구글, '시각 검사 AI 솔루션' 발표 구글 클라우드가 사람 눈에 의존하는 전통적인 방식의 품질관리보다 정확성과 효율성을 높인, 인공지능과 컴퓨터 비전을 활용한 새로운 '시각 검사 AI 솔루션(Visual Inspection AI solution)'을 블로그를 통해 공개했다. 시각 검사 AI 솔루션은 숙련된 전문가가 일일이 눈으로 확인해 제품 결함이나 불량제품을 선별하던 작업을, 자동화 공정을 통해 빠르고 정확하게 처리할 수 있도록 한 것이 특징이다. 다양하고 복잡한 생산공정에서 결함이 있는 불량 제품이 생기는 것은 피할 수 없는 일이다. 그래서 생산 마지막 단계에서 결함이 있는 제품을 골라내는 작업은 어떤 제조 분야에서나 꼭 필요한 과정이다. 품질관리가 정확하고 빠르게 이루어지지 않으면, 작업 지연, 수율 감소, 고객 불만, 사후 서비스 발.. 2021. 6. 23. 더보기
프레젠테이션 연습도 AI와 함께...MS, 파워포인트 '프레젠터 코치' 지원 플랫폼 확대 중요한 프레젠테이션을 앞두고 있다면, 해야 할 일이 산더미처럼 많다. 아무리 작은 규모의 프레젠테이션이라도 준비하고 갖춰야 할 최소한의 것들이 있다. 게다가 시간은 대부분 촉박하며, 예상하지 못한 변수가 발생할 수 있다. 그렇게 분주하게 이어지는 타임라인 속에서, 고수와 하수를 가르는 것은 '발표 연습'이다. 진정한 고수는 리허설을 거르는 법이 없고, 영원한 하수는 리허설을 거의 하지 않는다. 프레젠테이션에서 자료 준비와 문서 작업만큼 중요한 것이 실전과 같은 '리허설'이다. 비즈니스 프레젠테이션에서는 전달되는 발표자의 모든 언어와 동작은, 사전에 치밀하고 전략적으로 계획되고 준비되어야 한다. 말하는 속도나 발음부터, 반복적으로 사용하는 단어, 손짓과 몸짓 등이, 듣고 보는 사람에게 긍정적으로 전달되어야.. 2021. 3. 19. 더보기
AI가 도로 위 포트홀 찾는다...구글, ML활용 도로 보수 사례 공개 인공지능의 존재와 활약을 접하는 것이 이제 일상이 됐다. 하지만 일상과 업무에서 접하게 되는 인공지능 보다, 보이지 않는 영역에서 활약하는 인공지능이 훨씬 많다는 것을 알아야 한다. 구글의 클라우드 파트너인 스프링ML(SpringML)과 미국 멤피스시의 협력 사례가 그런 것 중 하나다. 구글이 기계학습을 활용해 도로 유지 보수 효율을 높인 사례를 공식 블로그에 공개했다. 미국 테네시주에 있는 멤피스시는 스프링ML이 제공하는 분석 및 기계학습 솔루션을 활용해, 일 년 동안 약 6만 3,000개의 포트홀(pothole)을 찾아내고 보수한 것이다. 포트홀은 도로 위에 움푹 파인 구멍으로, 그대로 방치하면 사고 위험성을 높인다. 빗물과 과적 차량에 의한 압력이나 도로 노후 등으로 생기며, 포트홀로 인한 사고를 .. 2021. 1. 14. 더보기
'AI 소프트웨어' 기대치 보다 시장이 작다…포레스터, 2023년 이후 성장 둔화할 것 "인공지능 소프트웨어 시장은 2025년까지 370억 달러 규모로 성장할 것이다. 적지 않은 수준이지만 투자자나 분석가들이 예상한 1,500~2,000억 달러에 비하면 낮은 수치다. 인공지능 소프트웨어 시장 안에서 애플리케이션의 성장은, 인공지능을 기존 소프트웨어 제품에 포함하는 업체에 의해 제한될 것이다." 포레스터(Forrester)가 '2025년까지 인공지능 소프트웨어 시장 370억 달러로 성장(The AI Software Market Will Grow To $37 Billion Globally By 2025)' 보고서를 발표하고, 하드웨어 및 컨설팅 서비스를 제외한 인공지능 소프트웨어 시장에 대한 전망을 내놨다. 포레스터는 인공지능 소프트웨어 시장을 인공지능 생산자 플랫폼, 인공지능 촉진자 플랫폼,.. 2020. 12. 17. 더보기

반응형