AI를 위한 839명의 인간 활동 기록...메타, 멀티모달 데이터 세트 Ego-Exo4D 발표
메타가 1,422시간 이상의 분량의 인간 활동을 영상으로 기록한 이고-엑소4D(Ego-Exo4D)를 발표했다. 이고-엑소4D는 839명의 참가자가 전 세계 13개 도시에서 일상적인 생활 속에서 활동하는 '숙련된 사람의 행동'을 다채널 영상과 오디오로 담아낸 멀티모달, 멀티뷰, 비디오 데이터 세트로, AI를 위한 비디오 학습 및 다중 모드 인식에 활용할 수 있는 요긴한 자료다. 이고-엑소4D는 요리, 음악, 축구, 건강, 농구, 춤, 자전거 수리, 암벽 등반을 하는 사람과 주변에 카메라를 설치하고 다양한 각도에서 인간의 활동을 기록했다. 사람은 안경 형태의 웨어러블 카메라를 이용해 현재하고 있는 행동을 1인칭 시점에서 기록한 자기중심적(egocentric)인 영상을 촬영하도록 했고, 사람 주변에 설치한 여..
2023. 12. 8.
더보기
메타, 미국 15개 대학과 협력 & 메타 퀘스트 스토어에 교육 전용 매장 오픈 예정
메타(Meta)가 몰입형 기술을 활용한 교육 혁신을 위한 행보에 가속도를 내고 있다. 몰입형 학습에 적극적인 미국의 15개 대학과의 협력 관계를 맺고, 메타 퀘스트 스토어(Meta Quest Store)에 교육 전용 매장을 출시한다. 또한 유럽 교육 현장에서 메타버스 기술을 수용하는 사례를 소개하며, 메타버스 기반 몰입형 교육 기술의 미래 성장 가능성을 소개했다. 팬데믹은 사회, 문화, 경제, 산업 등 인간의 활동 영역 전반에 걸쳐 전에 없던 변화와 변혁을 가져왔다. 교육 역시 예외가 될 수 없었고, 경우에 따라서는 가장 큰 격변의 시간을 보내야 했다. 이 과정에서 새로운 도구와 기술을 기반으로 한 디지털 교육의 현재와 미래가 일순간에 뒤섞이며 큰 변화를 겪었고, 그 과정에서 가상현실, 증강 현실, 혼합..
2023. 9. 14.
더보기
멀티모달 음성, 문자 번역 AI 모델...메타, 최대 100개 언어 지원 '심리스M4T'
번역기는 컴퓨터, 인터넷, 스마트폰만큼이나 일상과 업무에서 자연스럽고 꼭 필요한 도구가 됐다. 인공 번역 기술의 발전은 제법 오랜 역사를 가지고 있다. 하지만 지금처럼 제법 쓸만한 번역기가 활용되기 시작한 것은, 인공 지능이 번역에 본격적으로 활용되기 시작한 이후다. 그러나 아직 한계는 있다 문자 입력을 문자 출력으로 번역하거나, 음성 입력을 음성 출력으로 번역하는 단일 모달리티에 머물러 있기 때문이다. 메타(Meta)가 싱글 모달 중심이던 AI 기반 번역 기술을 한 단계 진화시킨 멀티모달 AI 모델 심리스M4T(SeamlessM4T)를 발표했다. 문자와 음성을 동시에 지원하는 심리스M4T는 문자-문자, 음성-음성, 문자-음성, 음성-문자 형태로, 상황에 따라 편리하고 효율적인 다국어 번역 기능을 제공한..
2023. 8. 24.
더보기