본문 바로가기

"인간 전문가를 능가하는 생성 AI 모델"...구글, 멀티모달 생성 AI 모델 '제미나이' 공개

반응형

"제미나이 울트라는 수학, 물리학, 역사, 법학, 의학, 윤리 등 57개 과목을 조합해 세계 지식과 문제 해결 능력을 테스트하는 MMLU(대규모 다중 언어 이해)에서 90.0%의 점수로 인간 전문가를 능가한 최초의 모델이다. MMLU에 대한 새로운 벤치마크 접근 방식을 통해 제미나이는 추론 기능을 사용하여 어려운 질문에 답하기 전에 더 신중하게 생각할 수 있게 되었으며, 이를 통해 훨씬 더 나은 결과를 얻을 수 있다."

구글이 대규모 언어 모델(LLM ; Large Language Model) 생성 AI인 제미나이(Gemini)를 공개하며, 오픈AI의 챗GPT와 본격적인 경쟁을 선포했다. 이번에 공개한 제미나이 1.0 처음부터 멀티 모달 생성 AI로 개발되었으며, 제미나이 울트라(Gemini Ultra), 제미나이 프로(Gemini Pro), 제미나이 나노(Gemini Nano) 세 가지 모델로 구분되어 있다.

구글이 대규모 언어 모델 기반 멀티모달 생성 AI인 제미나이를 소하며, 오픈 AI의 GPT-4와 벌인 텍스트 부문의 8가지 항목(위)과 멀티모달 부문(아래)의 10가지 항목의 비교 테스트 결과를 공개했다. (자료 : Google)


제미나이 울트라는 매우 복잡한 작업을 수행할 수 있는 가장 크고 뛰어난 모델이고, 제미나이 프로는 광범위한 작업에 걸쳐 확장 가능한 모델이라고 구글은 설명한다. 제미나이 울트라는 스마트폰이나 태블릿 등의 온디바이스 환경에서 네트워크 연결 없이 구동되는 모델이다. 구글은 이러한 세 가지 버전의 제미나이 모델을 기반으로 운영 환경과 구동 장치에 맞는 서비스를 제공하며 본격적인 시장 공략에 나선다고 밝혔다.

우선 영어 기반으로 고급 추론, 계획, 이해 등이 기능을 강화한 제미나이 프로를 바드(Bard)에 적용헀다. 내년 초에는 제미나이 울트라를 바드에 이식한 바드 어드밴스드(Bard Advanced)를 선보일 예정이다. 구글의 스마트폰 '픽셀 8 프로(Pixel 8 Pro)'에서는 제미나이 나노를 사용한 녹음 요약, 지보드(Gborad) 스마트 답장 등의 확장 기능을 사용할 수 있다.

구글은 제미나이 개발에 구글 리서치(Google Research)와 구글 딥마인드(Google DeepMind) 등 구글의 모든 역량을 동원한 '대규모 공동 노력'의 결과라고 강조했다. 제미나이 발표를 알리는 소식도 순다르 피차이(Sundar Pichai) 구글과 알파벳 CEO와 데미스 허사비스(Demis Hassabis) 구글 딥마인드 CEO 겸 공동 창업자 이름으로 공식 블로그를 통해 공개했다.

제미나이는 처음부터 문자, 음성, 사진 등을 인식, 변환, 생성할 수 있는 멀티모달(Multi Modal)로 개발했다. 따라서 사람 음성을 알아듣고 요청한 작업을 수행할 수 있고, 그림이나 사진의 내용을 음성으로 설명하고, 어렵고 복잡한 문제를 풀어주고, 서로 다른 언어도 역시 문자나 음성으로 번역을 할 수 있다. 이러한 특징을 기반으로 구글은 구글 애즈(Ads), 크롬(Chrome), 듀엣 AI(Duet AI) 등의 다양한 제품과 서비스의 기능을 강화한다.

구글은 제미나이를 공개하면서 제미나이와 오픈AI의 GPT-4와의 벤치마크 결과를 공개했다. 텍스트 기반에서 제미나이 울트라와 오픈AI의 GPT-4가 일반, 추론, 수학, 코딩 분야의 8개 항목에 대해 대결한 결과를 보면, 제미나이 울트라가 GPT-4 보다 7개 항목에서 앞서는 것으로 되어 있다. 10개 항목에 달하는 멀티모달 성능 비교에서 제미나이 울트라와 GPT-4V의 대결에서는 9개 항목에서 제미나이 울트라가 앞섰다고 구글은 밝혔다.

구글은 "우리는 제미나이를 기본적으로 다중 모드로 설계했으며 처음부터 다양한 양식에 대해 훈련시켰다. 그런 다음 추가 다중 모드 데이터를 사용하여 이를 미세 조정하여 효율성을 더욱 개선했다. 이를 통해 제미나이는 기존 다중 모드 모델보다 훨씬 더 나은 방식으로 모든 종류의 입력을 처음부터 원활하게 이해하고 추론할 수 있으며 그 기능은 거의 모든 영역에서 최첨단이다"라고 강조했다.

하지만 벤치마크 결과가 좋다고 해서 실제 성능이 좋다고 단정할 수는 없다. 생성 AI는 학습에 사용된 데이터의 품질과 정확성이 그대로 반영되기 때문에 실제 사용환경에서는 엉뚱한 답으로 인해 사용자들에게 부정적인 평가를 받고 외면당할 수 있다. 그래서 경쟁 상대가 다른 생성 AI든 사람이든 상관없이 도출된 답변이 정확해야 한다. 앞으로도 생성 AI의 두뇌 싸움은 결국 이 부분에서 중요한 만큼 섣부른 자신감은 금물이다.

제미나이와 관련해 보다 자세한 내용은 구글이 공식 블로그를 통해 공개한 '제미나이 소개:가장 크고 유능한 AI 모델(Introducing Gemini: our largest and most capable AI model)', '바드, 제미나이를 통해 사상 최대 규모의 업그레이드(Bard gets its biggest upgrade yet with Gemini)', '픽셀 8 프로에서 제미나이 나노 실행(Pixel 8 Pro...is now running Gemini Nano,..)'를 참고하면 된다.

 

Syndicated to WWW.CIOKOREA.COM

반응형