본문 바로가기

반응형

생성형 AI

생성형 AI 기반 비디오 생성기…메타, 무비 젠(Movie Gen)으로 원스톱 비디오 제작 누구나 영화를 제작할 수 있는 시대가 성큼성큼 다가오고 있다. 영화를 만드는 것이 꿈이었던 사람은 막강한 조력자를 통한 새로운 기회를 맞이할 수 있게 됐고, 영화를 직접 만들겠다는 생각조차 없던 사람들은 상상하지도 않던 꿈을 현실로 맞이할 수 있게 됐다. 기대 이상으로 빠르게 진화하고 있는 AI 덕분이다.메타(Meta)가 AI를 활용한 비디오 생성기인 ‘메타 무비 젠(Meta Movie Gen)’을 공개했다. 무비 젠은 원하는 비디오를 문자로 입력하면 인공지능이 자동으로 제작하는 이름 그대로 ‘영화 생성기’다. 비디오를 생성하는 AI 도구가 새로울 것이 없지만 메타는 ‘몰입형 AI 콘텐츠에 대한 새로운 표준’이라며 무비 젠의 차별화를 선언했다.무비 젠은 그동안 메타가 멀티모달 AI 연구를 진행하며 사진,.. 2024. 10. 11. 더보기
엔지니어링 인력 80%가 숙련도 향상 필요…가트너, “AI 엔지니어 플랫폼에 투자해야” “소프트웨어 엔지니어링 및 운영에서 생성형 AI로 인해 새로운 역할이 생겨나고 있다. 이에 따라 2027년까지 80% 이상의 엔지니어링 인력이 숙련도를 높이는 기술 향상이 필요할 것으로 예상된다. 생성형 AI로 인한 소프트웨어 엔지니어링의 역할은 단기, 중기, 장기적으로 영향을 미칠 것이다.”가트너(Gartner)가 생성형 AI로 인한 소프트웨어 엔지니어링의 변화를 예고하며, AI 시대에 맞는 소프트웨어 엔지니어링과 엔지니어의 변신이 필요하다고 밝혔다. 생성형 AI로 인해 소프트웨어 엔지니어링에 단계적으로 일어날 변화에 대해 일정한 범위에서 변화가 진행된 후, 적용 범위가 확대되는 과정을 거치고, 궁극적으로는 AI 엔지니어링의 전성기를 맞이할 것으로 전망했다.우선 단기적으로는 기존 개발자의 작업 패턴과 .. 2024. 10. 11. 더보기
AI가 유튜브 요약과 분석까지…구글, ‘노트북LM’에 동영상 & 오디오 지원 인공 지능은 사람을 모방했지만 진화의 속도는 결이 다르다. 사람의 그것은 거의 체감하기 힘들지만 인공 지능은 자고 나면 달라진다. 계절이 한번 바뀌는 시간이면 수많은 인공 지능이 생겨나고 변신하고 성장한다. 인공 지능 기반 메모 작성 도구로 탄생한 구글의 ‘노트북LM(NotebookLM)’은 그중에서도 단연 돋보이는 AI 도우미다.노트북 LM이 오디오와 비디오를 분석하고 이해하며 이를 기반으로 사용자의 질문에 답변하는 수준으로 진화했다. 지난번 업그레이드에서 구글 문서, PDF 파일을 지원하면서 활용 범위를 넓히더니, 이번에는 유튜브(YouTube) 비디오와 오디오 파일까지 분석하고 요약하는 능력을 추가했다.노트북LM에서 이제 오디오 파일과 유튜브 영상을 지원한다. 스크립트가 포함된 공개 유튜브 영상 링.. 2024. 10. 7. 더보기
AI가 도우미가 웹 페이지 인쇄도 깔끔하게…HP, 지능형 인쇄 지원 ‘프린트 AI’ 공개 웹 페이지나 스프레드시트를 프린터로 인쇄하는 일은 성가시고 번거롭고 짜증 나는 일이 될 수 있다. 모니터 화면에 표시되는 내용에서 ‘필요한 것’만 골라 ‘보기 좋은 레이아웃’으로 인쇄하는 것이 쉽지 않은 까닭이다. 그래서 이런 종류의 화면이나 문서를 인쇄 작업은 업무 효율을 떨어뜨리거나 프린터 설정을 세심하게 신경 써야 한다.HP가 프린팅 작업에 AI를 접목한 ‘프린트 AI(Print AI)를 공개했다. 프린터 설정부터 최종 인쇄에 이르는 과정을 인공지능 통해 쉽고 빠르게 최적의 인쇄물을 얻을 수 있도록 지원하는 지능형 인쇄 도우미다. 대화형 프롬프트를 활용해 개인화된 인사말 카드를 제작하는 것도 가능하다.HP 프린트 AI가 지원하는 퍽펙트 아웃풋 기능을 활용하면 필요없는 부분까지 출력헤 지저분한 웹페이.. 2024. 10. 7. 더보기
판매 촉진과 쇼핑 경험에도 AI가 도우미…아마존, 진화하는 생성형 AI로 판매자 지원 ‘경험’은 비즈니스의 근간을 이루는 수많은 요소 중에서도 핵심이다. 고객 경험, 직원 경험, 판매자 경험 등 이제 ‘경험’을 고려하지 않으면 지속가능성을 기대할 수 없는 시대가 됐다. 그것은 디지털 혁신과 전환, 인더스트리 4.0 등의 시대 구분이 없을 때부터 존재했지만, 이제는 모든 변화와 변신의 선두에서 시대를 이끌고 있다.아마존(Amazon)은 다양한 방법으로 진화와 혁신의 물꼬를 트며 그런 경험을 개선하기 위해 노력하는 대표적인 기업이다. 수 많은 기업들이 생성형 AI를 비즈니스 전반에 도입하고 반영하듯, 아마존 역시 이를 활용한 고객 및 판매자 경험 향상을 위해 다양한 도구, 시스템, 솔루션을 선보이고 있다.아마존에 입점한 판매자는 대부분이 중소기업이다. 이들이 직접 공급망과 재고를 관리하고, .. 2024. 10. 7. 더보기
복잡한 추론을 더욱 효과적으로…오픈AI, o1-프리뷰 모델 공개 “우리는 이 모델들이 문제를 해결하기 전에 사람처럼 더 많은 시간을 생각하도록 훈련시켰다. 훈련을 통해 사고 과정을 개선하고 다양한 전략을 시도하며 실수를 인식하는 방법을 배운다. 테스트 결과, 물리학, 화학, 생물학 분야의 까다로운 벤치마크 과제에서 박사 과정 학생과 비슷한 능력을 보였다.”오픈AI(OpenAI)가 어려운 문제를 해결하는 데 적합한 새로운 AI 모델인 ‘o1-프리뷰'를 출시했다. 챗GPT(ChatGPT)와 API를 통해 미리 보기 형태로 공개되었으며, 정기적인 업데이트를 통해 계속해서 업데이트를 제공할 예정이다.오픈AI o1-프리뷰와 o1-미니는 유료 버전인 챗GPT 플러스와 챗GPT 팀 사용자에게 제공되며, 사용자가 직접 필요한 모델을 선택할 수 있다. (자료 : OpenAI)o1-프.. 2024. 9. 23. 더보기
2028년까지 전 세계 AI 지출 연평균 29% 성장…IDC, 2028년 6,320억 달러 시장 형성 “지난 18개월 동안 생성형 AI가 전 세계의 주목을 받았지만, 생성형 AI 솔루션에 대한 지출은 머신러닝, 딥러닝, 자동 음성 인식 및 자연어 처리와 같은 다른 모든 AI 애플리케이션을 합친 것보다 적을 것이다. 그러나 생성형 AI에 대한 투자가 빠르게 증가함에 따라 이 분야는 앞으로 5년간 59.2%의 연평균 성장률을 기록하며 전체 AI 시장을 능가할 것이다.”IDC(International Data Corporation)가 ‘전 세계 AI 및 생성형 AI 지출 가이드(Worldwide AI and Generative AI Spending Guide)’를 발표했다. 가이드는 AI 지원 애플리케이션, 인프라, AI 관련 IT 및 비즈니스 서비스를 포함한 AI 관련 지출 규모가 2028년에 6,320억 .. 2024. 8. 27. 더보기
성공하는 AI '사용자 경험, 투명성, 우선 순위'…구글, AI 솔루션 설계에서 얻은 교훈 3가지 “생성형 AI는 엄청난 잠재력을 가지고 있지만, 그 성공 여부는 사려 깊은 설계에 달려 있다. 투명성, 사용자 자율성, 설명 가능성, 실행 가능성, 개인화, 지속적인 피드백 루프를 우선시함으로써, 사용자와 비즈니스 모두에게 신뢰할 수 있고 권한을 부여하며 진정으로 유익한 생성형 AI 솔루션을 만들고 점진적으로 업데이트할 수 있다.”구글 클라우드가 생성형 AI 솔루션 구축을 위한 세 가지 핵심 요소를 ‘생성형 AI 솔루션 설계 : 주요 교훈’이라는 제목으로 블로그를 통해 공개했다. 실제 현장에서 고객들을 도와 생성형 AI의 설계와 개발을 담당했던 응용 AI 엔지니어링 부서의 쿨란 다바자브(솔루션 컨설턴트 및 UX 디자이너)와 후세인 치노이(기술 솔루션 관리자)가 경험을 공유한 것이다.그들은 생성형 AI를 .. 2024. 8. 8. 더보기
PC에서 이미지 검색, 사이트 비교, 검색 기록 검색…구글, ‘크롬’에 3가지 AI 기능 추가 구글의 크롬(Chrome) 브라우저를 활용한 인터넷 검색이 앞으로 몇 배는 빠르고 편리해진다. 무엇을 어떻게 찾느냐에 따라 그 이상의 변화도 느낄 수 있는 기능이 추가되기 때문이다. 구글 AI와 제미나이(Gemini) 모델을 기반으로 만들어진 AI 기능이 향후 진행되는 크롬 업데이트를 통해서 제공될 예정이다.이번에 크롬에 적용되는 AI 기능은 세 가지다. 이미 휴대전화에서 오래전부터 지원하고 있는 ‘구글 렌즈(Google Lens)’ 기능을 데스크톱 크롬 브라우저에서도 사용할 수 있게 되고, 사이트 간 제품을 비교하는 탭 비교(Tab Compare)’, 기억나지 않는 이전 검색 기록을 찾는 ‘검색 기록 찾기(Rediscover browsing history)’를 지원한다.구글 렌즈가 지원되는 크롬을 사용.. 2024. 8. 8. 더보기
생성형 AI 스마트폰 2024년 360% 이상 성장…IDC, 2028년까지 성장률 78.4% 예상 2024년 전 세계 생성형 AI 스마트폰이 출하량이 2억 3,420만 대에 달하며, 2023년과 비교할 때 363.6% 증가할 전망이다. 2024년 전체 스마트폰 시장에서 생성형 AI 스마트폰이 차지하는 비중은 19%로 예상된다. 스마트폰 시장이 생성형 AI를 새로운 성장 동력으로 삼아 새로운 미래는 여는 시대가 본격적으로 도래하는 것이다.IDC(International Data Corporation(IDC)가 생성형 AI 스마트폰 시장이 빠르게 성장하면서 스마트폰의 업그레이드를 주도하고 공급업체와 애플리케이션 개발자 모두에게 중요한 기회를 제공할 것으로 전망했다. 2024년부터 본격적으로 시작되는 생성형 AI 스마트폰은 2025년에도 전년 대비 출하량이 73.1% 늘어날 것으로 예측했다.IDC는 생성형.. 2024. 8. 5. 더보기
“2025년까지 최소 30% 생성형 AI 프로젝트 중단될 것”…가트너, 데이터 품질 저하, 비용 및 위험 증가 등이 원인 "경영진은 생성형 AI 투자에 대한 수익을 보고 싶어 하지만, 조직은 가치를 입증하고 실현하는 데 어려움을 겪고 있다. 이니셔티브의 범위가 확대됨에 따라 생성형 AI 모델 개발 및 배포에 대한 재정적 부담이 점점 더 커지고 있다. 조직은 생산성 향상을 위해 생성형 AI에 대한 막대한 투자를 정당화하는 데 큰 어려움을 겪고 있다.”가트너(Gartner)가 2025년 말까지 최소 30% 이상의 생성형 AI 프로젝트가 중단될 것으로 전망했다. 데이터 품질 저하, 부적절한 위험 관리, 비용 증가, 확실하지 않은 사업 가치 등의 문제에 직면하면서 개념 증명(proof of concept) 과정을 거친 프로젝트 일부가 멈출 것으로 예상한 것이다.생성형 AI의 배포 또는 도입 방식에 따라 초기 및 운영 비용이 적지 .. 2024. 8. 2. 더보기
‘찾는’ 쇼핑에서 ‘묻는’ 쇼핑으로…아마존, AI 도우미 ‘루퍼스’ 미국 고객 대상 서비스 시작 이제 미국 아마존 고객들은 루퍼스(Rufus)의 도움을 받아 좀 더 편리하고 효율적으로 쇼핑을 할 수 있다. 루퍼스는 지난 2월 선보인 아마존의 대화형 AI 쇼핑 도우미로, 챗GPT(ChatGPT)와 같은 인공지능 챗봇이다. 아마존 앱에서 루퍼스를 통해 사고 싶은 물건 찾고 있는 상품을 고를 때 도움을 받을 수 있다.루퍼스의 존재 이유는 고객에게 효율적이고 편리한 쇼핑을 제공하는 것이다. 원하는 물건을 찾을 때, 찾고 있는 제품에 대한 정보가 필요할 때, 다른 고객들의 평판은 어떤지 궁금할 때, 어떤 것을 골라야 할지 모를 때 추천을 받을 수 있다. 일일이 찾아보면 시간이 한참 걸리는 제품에 대한 세부적인 사양이나 옵션 비교도 좀 더 수월하게 할 수 있다.아마존이 미국 고객을 대상으로 대화형 AI 쇼핑 .. 2024. 7. 16. 더보기
“AI 상담원 도입하면 경쟁사로 옮길 수도”…가트너, 64%의 고객 AI 상담 원하지 않아 AI 도입과 활용에 대한 기업과 고객의 입장은 판이하다. 기업은 AI 도입과 안착을 통해 장비 빛이 실현될 것을 상상하지만, 고객은 그로 인해 생겨날 불편과 위험 때문에 거부하고 기피한다. 한 마디로 동상이몽이다. 실제로 설문조사 결과에 따르면 64%의 고객이 고객 서비스에 AI를 사용하지 않기를 바라는 것으로 나타났다.가트너(Gartner)가 2023년 12월에 5,728명의 고객을 대상으로 진행한 설문조사를 기반으로 ‘2024 가트너 고객 설문 조사 현황(2024 Gartner state of the customer survey)'을 공개했다. 설문 조사 결과에 따르면 기업의 고객 서비스 리더는 AI 도입을 원하지만, 고객은 고객 서비스에 AI를 사용하는 것에 대해 우려를 가지고 있는 것으로 조사됐다.. 2024. 7. 11. 더보기
소리 없는 영화에 AI가 사운드트랙 입힌다…딥마인드, V2A 기술 개발중 생성형 AI의 진화가 발 빠르게 진행 중이다. 이번에는 비디오 사운드 트랙이다. 영화나 드라마에 삽입되는 사운드 트랙은 선택이 아닌 필수다. 장면에 맞는 음악과 음향 효과로 의미와 감정을 전달하는 데 절대적인 역할을 하기 때문이다. 하지만 전문가가 아니라면 쉽게 다가갈 수 있는 영역이 아니다.구글 딥마인드(DeepMind)가 비디오 픽셀과 텍스트 프롬프트를 기반으로 사운드 트랙을 생성하는 V2A(video-to-audio) 기술 개발에 대한 진행 상황을 공개했다. V2A는 동영상 속의 화면(픽셀) 분석과 자연어로 입력한 텍스트 프롬프트를 결합해, 현재 장면에 어울리는 극적인 음악과 사실적인 사운드 효과 등을 생성하는 AI 기술이다.딥마인드가 연구 중인 V2A 시스템은 비디오 영상 속의 장면을 이해하고 사.. 2024. 6. 19. 더보기
“AI 교육과 활용 지침없으면 효율성 떨어져”…AI로 절약한 시간 여전히 관리 업무에 사용 AI를 ‘열심히 사용하는 것’과 ‘효과적으로 사용하는 것’은 비슷한 것 같지만 전혀 다른 얘기다. 생성형 AI 등 다양한 AI 도구와 솔루션을 활용해 업무 시간을 절약하는 것은 좋다. 문제는 그다음이다. 그렇게 절약한 시간을 좀 더 가치 있고 부가가치 놓은 일에 사용하고 있는가? 결론은 그렇지 않은 것으로 나타났다.슬랙(Slack)이 워크포스 인덱스(Workforce Index)를 통해 기업에서의 AI 사용 현황과 효과적으로 효율적인 AI 활용 방안에 대해 소개했다. 이번 발표를 위해 진행한 설문에서 AI 사용량이 2024년 연초 보다 23% 증가하고, 전 세계 직장인 중에서 거의 절반에 해당하는 47%가 일상 업무에서 AI를 사용하는 데 열의를 보인 것으로 나타났다.AI 사용 교육을 받은 사람들은 AI.. 2024. 6. 11. 더보기
이상있는 배송 상품 족집게처럼 골라낸다…아마존, 프로젝트 PI로 고객 경험 & 배송 효율 개선 “생성형 AI와 컴퓨터 비전 기술의 조합을 사용하는 프로젝트 P.I는 제품이 고객에게 전달되기 전에 손상된 제품이나 잘못된 색상 또는 크기와 같은 결함을 발견할 수 있다. 또한 문제의 근본 원인을 파악하여 문제가 다시 발생하지 않도록 업스트림에서 예방 조치를 취할 수 있도록 지원한다.”아마존이 배송하지 말아야 할 상품을 사전에 식별하고 골라내는 프로젝트 PI(Private Investigator)의 기술 요소와 작동 방식 및 적용 효과를 소개했다. 프로젝트 PI는 아마존 베드락(Amazon Bedrock), 아마존 세이지메이커(Amazon SageMaker) 등의 AWS 서비스와 생성형 AI 및 컴퓨터 비전 등 다양한 솔루션과 기술을 활용한다.아마존의 프로젝트 P.I는 OCR, 컴퓨터 비전, AI 등 다.. 2024. 6. 7. 더보기
‘상상하는 소리를 현실로 만든다’…일레븐랩, 음향 효과 생성 AI 도구 출시 찾는 것이 어렵지만 만드는 것은 더 어렵다. 무엇인가를 알리고 소개해야 하는 자료를 만들어야 할 때, 안성맞춤인 사진, 영상, 소리를 찾는 것과 만드는 것은 높은 산과 깊은 강을 건너야 하는 일이다. 하지만 하루가 다르게 진화하는 생성형 AI가 있다면 얘기가 달라진다. 그것의 등장을 우려하면서도 한편에서는 두 손을 들고 반기는 이유다.이번에는 음향 효과 ‘소리’다. 음성 AI 연구 스타트업인 일레븐랩스(ElevenLabs)가 만들고 싶고 듣고 싶은 소리를 프롬프트에 입력하면 바로 생성해 주는 음향 효과(Sound Effects) AI 도구를 선보였다. 제품이나 서비스 소개, 프로젝트 포트폴리오, 마케팅 동영상 클립 등에 필요한 소리를 AI를 통해 만들 수 있는 것이다.일레븐렙스가 생성형 음성 AI을 통해.. 2024. 6. 4. 더보기
2030년까지 대화형 AI 산업 24.9% 성장…컴퓨터 비전 & 음성 인식 통합이 성장 주도 대화형 AI 시장 규모가 2024년 132억 달러에서 2030년 499억 달러로 증가하며, 24.9%(CAGR)의 성장률을 기록하며 성장세를 이어갈 전망이다. 생성형 AI의 출현으로 촉발된 대화형 AI의 확산과 성장이 다양한 서비스에서의 챗봇 도입을 촉진하고, 컴퓨터 비전과 음성 인식 기술의 통합 증가가 성장을 이끄는 요인이다.마켓앤마켓(MarketsandMarkets)이 ‘2030년까지 대화형 AI 시장 글로벌 전망(Conversational AI Market - Global Forecast to 2030)’ 보고서를 발표했다. 대화형 AI 시장을 제공 형태(Offering), 업무 기능(Business Function), 통합 모드(Integration Mode), 대화형 에이전트 유형(Convers.. 2024. 5. 24. 더보기
D&A 리더, ‘집단 지성’에 집중해야…가트너, D&A 가치 창출위한 세 가지 영역 “D&A(Data & analytics) 리더는 비즈니스 가치와 D&A 성숙도를 높이기 위해 집단 지성에 집중해야 한다. 생성형 AI가 주도하는 집단 지성은 인간과 기계의 문제 해결 능력을 결합하여 가치를 창출하기 때문이다. 이를 위해 D&A 리더는 의사 결정과 행동을 촉진하는 역량을 제공하여, 집단 지성을 효과적으로 발휘하는 중심 역할을 수행해야 한다.”가트너(Gartner)가 데이터 및 분석 리더는 ‘가치 창출’, ‘AI 야망(AI Ambition)’, ‘집단 지성’이라는 세 가지 요소를 통해 의사 결정 행동을 촉진하고, 집단 지성을 효과적으로 발휘하는 역량을 갖춰야 한다고 밝혔다. 새로운 집단 지성의 시대의 가치 창출은 이러한 세 가지 핵심 영역에 대한 집중이 필수 요소라는 것이다.가트너는 데이터 .. 2024. 5. 21. 더보기
사람처럼 빠르게 이해하고 빠르게 답변…오픈AI, 플래그십 LLM ‘GPT-4o’ 발표 사람처럼 ‘빠르게’ 이해하고 사람처럼 ‘빠르게’ 답변하는 거대언어모델(LLM) 모델이 세상에 등장했다. 그동안 사람처럼 생각하고 사람처럼 답변하는 거대언어모델의 진화 방향에, 사람처럼 자연스러운 상호작용을 하기 위해서 필수적인 ‘빠른 속도와 자연스러움’이 본격적으로 추가되며 진화의 속도가 빨라진 것이다.오픈AI(OpenAI)가 기존의 GPT-3.5, GPT-4, GPT-4 터보의 뒤를 이은 거대언어모델인 GPT-4o(모든 것을 의미하는 ’omni’의 o)를 전격 공개하며, 새로운 플래그십(flagship) 거대언어모델을 세상에 발표했다. 기존의 거대언어모델과 비교할 때 입력과 출력 속도를 획기적으로 개선한 ‘실시간 추론’이 특징이다.오픈AI가 텍스트, 오디오, 이미지의 모든 조합을 입력으로 받아들이고 텍.. 2024. 5. 14. 더보기