본문 바로가기

'개방과 책임으로 AI 언어 모델 혁신'...메타, MS와 차세대 LLM 라마(LIama) 2 공개

반응형

"우리는 개방형 접근 방식이 오늘날의 AI 모델, 특히 기술이 빠르게 발전하는 생성 AI의 모델 개발에 적합하다고 생각한다. 기업, 신생 기업, 기업가 및 연구원에게 스스로 구축하기 어려운 규모로 개발된 도구에 대한 액세스 권한을 제공하고, 다른 방법으로는 액세스 할 수 없는 컴퓨팅 성능을 지원하면 흥미로운 방식으로 실험하고 혁신할 수 있는 기회의 세계가 열릴 것이다." 

메타(Meta)와 마이크로소프트(Microsoft)가 오픈 소스 차세대 대규모 언어 모델(LLM;Large Language Models)인 '라마(LIama) 2'를 공개했다. 오픈 소스인 만큼 연구 및 상업적 용도로 무료이기 때문에, 누구나 라마 2를 활용한 생성 AI 기술이나 기능을 개발하고 확장할 수 있다. 마이크로소프트는 애저(Azure) 및 윈도(Windows)에서 라마 2를 기반으로 한 생성 AI 도구 구축과 경험을 제공한다.

라마 2의 사전 학습 모델은 2조 개의 토큰으로 학습되었으며, 라마 1보다 콘텍스트 길이가 두 배 더 길다(위). 라마 2는 추론, 코딩, 숙련도, 지식 테스트 등 다양한 외부 벤치마크에서 다른 오픈 소스 언어 모델보다 우수한 성능을 발휘한다(아래). (자료 : Meta, Microsoft)


라마 2는 두 가지 관점에서 눈 여겨 볼만하다. 첫 번째는 누구나 사용할 수 있는 오픈 소스 정책을 선택하고, 이를 위해 AI로 인해 발생할 수 있는 위험과 부정적인 측면을 최소화하는 책임에 초점을 맞췄다는 점이다. 두 번째는 '달리 2(DALL·E 2)'나 챗GPT(ChatGPT) 등 오픈AI(OpenAI)의 AI 서비스를 이미 자사 플랫폼과 제품에 적용한 MS가 이번에는 메타의 라마 2까지 품게 되었다는 것이다. 

메타는 라마 2 출시를 알리면서 "AI 모델을 공개적으로 사용할 수 있게 함으로써 모든 사람에게 혜택을 줄 수 있다. 우리는 책임감 있게 구축하기 위해 최선을 다하고 있으며 라마 2를 사용하는 사람들도 그렇게 할 수 있도록 많은 리소스를 제공하고 있다"고 밝혔다. 한 마디로 개방형으로 더 많은 혜택을 나누며 책임에 초점을 맞춰 투명하고 안전한 AI 생태계를 만들겠다는 것이다. 

'개방'을 위해서는 개방형 혁신 AI 연구 커뮤니티를 통해 대규모 언어 모델에 대한 책임 있는 개발 및 공유에 대한 이해를 높일 수 있는 연구원들을 위한 파트너십 프로그램을 시작했다. 연구자들은 실무자 커뮤니티에 가입해 연구 내용을 공유할 수 있으며, 커뮤니티는 이를 기반으로 연구 의제를 정하게 된다. 또한 라마 임팩트 챌린지를 통해 어려운 문제 해결을 위한 혁신 커뮤니티를 활성화할 계획이다.

'책임'의 관점에서는 내부와 외부에서의 안전성 테스트(Red-Teaming)를 거치고, 미세 조정과 벤치마킹을 통해 안전에 지속적으로 투자하고, 이러한 노력을 바탕으로 업데이트된 미세 조정 모델을 출시할 계획이다. 또한 모델에 대한 미세 조정 및 평가 방법을 투명성 있게 공개할 예정이다. 아울러 책임 있는 개발 및 안전 평가를 위한 모범 사례로 개발자를 위한 '책임 있는 사용 가이드'를 만들었다. 

물론 이러한 개방과 책임은 '혁신'이라는 핵심적인 요소가 있어야 의미가 있다. 한 마디로 이전의 라마 1 보다 라마 2의 기술과 성능이 뛰어나야 한다는 의미다. 대규모 언어 모델의 '능력'을 좌우하는 가장 큰 부분은 학습인데, 라마 2는 라마 1보다 40% 더 많은 데이터로 훈련했고 콘텍스트(Context)는 2배가 길어졌다. 

사전 학습에 사용된 토큰(단어열)은 2조 개, 미세 조정에 사용된 인간 주석은 100만 개에 달한다. 라마 2는 매개 변수에 따라 7B(70억), 13B(130억), 70B(700억) 모델을 활용할 수 있으며, 이는 마이크로소프트의 애저 플랫폼에서 미세 조정과 배포가 가능하다. 또한 윈도 PC 환경에서도 실행할 수 있도록 최적화된다.

마이크포소프트는 "메타와의 파트너십을 통해 라마 2를 모델을 기반으로 개방형 모델 에코시스템과 AI를 위한 슈퍼컴퓨팅 플랫폼으로서의 위치를 더욱 확장한다"고 밝혔다. 오픈AI와의 파트너십을 통해 이미 챗GPT 등의 생성 AI 서비스 활용에 선두를 달리는 상황에서, 이번에 라마 2까지 품으면서 마이크로소프트는 대규모 언어 모델을 기반으로 한 두 개의 강력한 날개를 달게 된 것이다. 

이미 오픈AI의 챗GPT과 구글의 바드(Bard) 사례에서 보았듯이, 대규모 언어 모델을 기반으로 한 생성 AI 경쟁에서는 기술만큼이나 순발력 있고 통찰력 있는 의사 결정이 필요하다. 그런 면에서 마이크로소프트의 행보는 향후 대규모 언어 모델을 활용한 생성 AI 시장 경쟁에서 누구보다 유리한 고지를 선점한 것으로 평가할 수 있다. 

라마 2를 공개하며 메타와 마이크로소프트는 "개방형 접근 방식을 지원하여 전 세계 비즈니스의 이점을 위한 기초 AI 기술에 대한 액세스를 확대할 수 있도록 지원한다. 오늘날의 AI 모델에 대한 액세스를 민주화해야 한다고 믿는 것은 메타와 마이크로소프트뿐만이 아니다. 기업, 클라우드 제공업체, 연구 기관, 기술, 학계 및 정책 전반에 걸쳐 이점을 보고 있는 사람들 등 전 세계의 다양한 지지자들이 이 접근 방식을 믿고 있다"라고 밝혔다.

 

 Syndicated to WWW.CIOKOREA.COM

반응형