본문 바로가기

AI가 만든 가짜, AI가 잡는다...MS, 가짜 콘텐츠 식별 기술 공개

반응형

모순도 이런 모순이 없다. 저쪽에서는 인공지능이 가짜 콘텐츠를 만드는 데 악용되고, 이쪽에서는 그런 가짜 콘텐츠를 구별하는 데 활용된다. 무고한 사람들을 공격하는 데 사용되는 기술, 그리고 선량한 사람들을 지키는데 사용되는 기술. 똑 같은 기술이 서로 극과 극인 얼굴을 마주하고, 보이지 않는 거대한 전쟁을 치르고 있다.

 

이제 사람의 감각이나 인지 능력으로는 구분조차 할 수 없는 것들이 넘쳐 난다. 글, 소리, 사진, 영상이 광속의 속도로 세상과 시간을 휘젓고 다니는 시대. 가짜같은 진짜는 무시당하고, 진짜 같은 가짜에 농락당하는 사람들. 이제 ‘가짜’와 ‘진짜’를 구별하는 것은, 인간의 존엄과 생존이 달린 문제에 가까워지고 있다.

 

마이크로소프트가 ‘가짜 콘텐츠’의 구별과 확산에 대응하기 위해 연구해 온 두 가지 새로운 기술을 공식 블로그를 통해 공개했다. 첫 번째는 사진과 영상 속에서 조작되거나 합성된 부분이 있는지를 식별하는 MVA(Microsoft Video Authenticator)고, 두 번째는 진짜 콘텐츠임을 증명하는 인증 기술이다.

 

마이크로소프트가 공개한 비디오 인증 도구는 사진이나 동영상을 실시간으로 분석한 후, 조작되었을 가능성을 신뢰도 점수를 통해 알려준다. (사진:Microsoft)

 

정교하게 조작되거나 합성된 콘텐츠로 인한 피해 사례가 갈수록 많아지고 있다. 사람의 손을 통해 조작이 이루어지던 전통적인 방식에, 인공지능이 가세하면서 양상이 달라졌다. 인공지능으로 조작되거나 합성된 사진, 영상, 오디오 파일은, 기존의 탐지 기술로는 식별이 거의 불가능하고, 인공지능을 사용한다 해도 알아내기가 쉽지 않다.

 

MVA는 이러한 문제점을 보완하기 위해 개발된 기술로, 사진이나 영상을 분석한 후 조작 가능성을 알려준다. 동영상의 경우는 각각의 프레임을 분석하면서, 실시간으로 가짜일 가능성을 판별한다. 사람의 눈으로 감지할 수 없는 딥 페이크(deepfake), 미묘한 페이딩(fading), 그레이 스케일 요소 등이 혼합된 경계를 감지하는 방식으로 작동한다. 

 

이 기술은 마이크로소프트 연구소(Microsoft Research)의 인공지 능 연구팀(Responsible AI)과 AETHER(Microsoft AI, Ethics and Effects in Engineering and Research)의 협력으로 개발됐다. 페이스 포렌식(Face Forensic ++)의 공개 데이터 세트를 사용했으며, 딥페이크 탐지 데이터베이스(DeepFake Detection Challenge Dataset)에서 테스트 됐다.

 

진짜 콘텐츠임을 증명하는 기술은 두 가지 요소로 구성된다. 첫 번째는 마이크로소프트 애저(Microsoft Azure)에 내장된 도구를 활용해, 콘텐츠 제작자가 콘텐츠에 디지털 해시와 인증서를 추가할 수 있도록 해주는 것이다. 이렇게 추가된 해시와 인증서는 온라인에서 이동되고 전달될 때, 메타테이터 형태로 유지되면서 진짜임을 증명하게 된다.

 

두 번째는 이렇게 해시와 인증서가 포함된 콘텐츠를 읽거나 볼 수 있는 리더(Reader)다. 인증서를 확인하고 해시와 일치하는지 확인해서, 변경이나 지위 여부를 판별할 수 있다. 리더는 브라우저 확장이나 다른 형태로 존재할 수 있으며, 제작자에 대한 세부 정보도 제공하게 된다.

 

마이스크로소프트는 “AI를 활용하는 탐지 방법은 실패 가능성이 있기 때문에, 딥페이크에 대응할 수 있는 준비가 되어 있어야 한다. 따라서 장기적으로 뉴스 기사 및 기타 매체의 진성을 유지하고 인증하는 더 강력한 방법을 모색해야 한다. 현재까지 온라인에서 보고 있는 미디어가 신뢰할 수 있고 변경되지 않았음을 독자에게 보장할 수 있는 도구는 거의 없다”고 개발 배경을 밝혔다.

 

 Syndicated to WWW.CIOKOREA.COM

반응형