본문 바로가기

4가지 과제로 4번째 챌린지...웨이모, 오픈 데이터셋 챌린지 시작

반응형

웨이모가 '2023 웨이모 오픈 데이터셋(Waymo Open Dataset) 챌린지' 과제와 일정을 발표했다. 2D 비디오 팬옵틱 세분화(2D Video Panoptic Segmentation) 챌린지, 포즈 추정(Pose Estimation Challenge) 챌린지, 동작 예측(Motion Prediction) 챌린지, 심 에이전트(Sim Agents) 챌린지가 도전 과제로 선정됐다.

2019년 처음 시작한 웨이모 오픈 데이터셋 챌린지는 이번에 네 번째를 맞이했다. 올해는 2023년 5월 23일(태평양 표준시 기준)까지 진행된다. 4개의 챌린지에서 각각 1위를 차지한 우승자는 1만 달러의 구글 클라우드(Goolge Cloud) 크레딧이, 최고의 성과를 달성한 팀에게는 2023년 6월에 CVPR(Computer Vision and Pattern Recognition) 컨퍼런스에서 발표 기회가 주어진다.

이번 도전 과제의 내용과 평가 기준은 다음과 같다. 우선 2D 비디오 팬옵틱 세분화는 카메라로 촬영한 파노라마 비디오가 주어지면, 각 이미지의 각각의 픽셀에 대해 일련의 팬옵틱 세분화 레이블을 생성하고, 장면의 각 객체는 여러 카메라와 시간 경과에 따라 추적된다. 포즈 추정은 하나 이상의 라이다(LiDAR) 범위 이미지와 관련 카메라 이미지가 주어지면, 보행자와 자전거 타는 사람에 대한 3D 키포인트를 예측한다.


동작 예측에서는 과거 1초 동안의 이력이 주어진 장면에서 여러 에이전트의 미래 위치를 예측하고, 라이디어 센서 데이터를 모델 입력으로 사용할 수 있다. 심 에이전트는 장면에서 에이전트를 제어하는 시뮬레이션 에이전트 모델을 생성하고 인간과 유사하도록 평가하며, 시뮬레이션 에이전트에 대한 경쟁은 이번이 처음이다.

웨이모는 "2019년 웨이모 오픈 데이터셋이 시작된 이후 전 세계 3만 6,000명 이상의 연구원이 이를 사용하여 새로운 접근 방식을 탐색하고, 컴퓨터 비전, 행동 예측 및 더 광범위한 기계 학습 주제에서 중요한 진전을 이루었다. 포인트 기반 3D 객체 감지, 궤적 예측을 위한 종단 간 모델링, 여러 카메라 이미지의 조감도 표현에 대한 연구를 포함하여, 1,300개 이상의 학술 논문을 발표했으며 자율 주행 이외의 분야에서 작업했다"고 밝혔다.

한편, 웨이모는 새로운 버전의 인지(Perception) 및 동작(Motion) 데이터셋을 출시하고, 모듈러 데이터셋(Modular dataset) 도입한다고 발표했다. 이제 모든 인지 세그먼트에 대한 로드 그래프 정의를 추가하고, 로드 그래프 재구성에 대한 연구를 할 수 있다. 이번 릴리스에서는 인지 및 동작 데이터셋에서 해당 로드 그래프 및 라이다를 사용할 수 있기 때문에, 예측을 위한 종단 간 학습에 대한 연구를 수행하는 것이 가능해졌다.

새로운 모듈식 데이터 형식과 함께 파이썬(Python) 라이브러리를 제공하여, 사용자가 다양한 기능을 개별적으로 다운로드하고 사용할 수 있다. 또한, 새로운 2D 비디오 팬옵틱 분할을 위한 새로운 기능을 추가했다. 모든 세그먼트에 대한 라이다 센서 데이터를 추가해 연구 가능 범위를 넓히고, 라이다가 제공하는 사용자 행동과 의도에 대한 풍부한 신호를 통해 엔드 투 엔드 인지 및 행동 모델링을 기회를 열어 준 것도 달라진 점이다.

 

 Syndicated to WWW.CIOKOREA.COM

반응형