본문 바로가기

이미지 센서와 AI 엣지를 단일칩으로…소니, AI 지원 '지능형 비전 센서' 발표

반응형

소니가 1,230만 화소의 이미지 센서(Pixel Chip)와 AI(Artificial Intelligence) 프로세서(Logic Chip)를 하나로 통합한 지능형 비전 센서(Intelligent Vision Sensors)를 선보였다. 기본형인 IMX500(Bare Chip Product)과 패키지형인 IMX501(Package Product) 두 가지 모델이 있으며, 샘플 기준으로 IMX500은 지난 4월부터 공급되고 있고 IMX501은 6월에 출시할 예정이다.

 

다양한 장치와 센서가 인터넷으로 연결되는 IoT(Internet of Things)와 장치에서 데이터를 직접 처리하는 엣지 컴퓨팅이 빠르게 성장하고 있다. 인터넷에 연결된 수많은 장치나 센서에서 수집한 데이터는, 네트워크를 통해 서버나 클라우드로 전송된 후, 이를 분석하고 분류하고 가공되는 과정을 거친다. 하지만 IoT와 엣지 컴퓨팅이 결합하면, 서버나 클라우드로 전송하지 않고, 바로 데이터를 처리할 수 있다.

 

1,230만 화소의 이미지 센서와 AI 로직 칩을 하나로 통합한 소니의 지능형 이미지 센서(Intelligent Vision Sensors). 촬영한 이미지를 실시간으로 분석해 네 가기 형태의 데이터로 출력할 수 있다. 베어 칩(Bare Chip Product)인 IMX500과 이를 패키지(Package Product)로 만든 IMX501 두 가지 모델이 있다. (자료:www.sony.net)

 

엣지 컴퓨팅 환경에 어울리는 지능형 비전 센서는 이미지 센서 아래에 AI 프로세서를 적층형으로 연결한 구조로 되어있다. 이미지 센서가 촬영한 사진이나 영상을 아래쪽에 있는 AI 프로세서가 실시간으로 분석하고 처리할 수 있다는 의미다. AI 프로세서를 기반으로 사진과 영상을 바로 처리할 수 있는, 엣지 컴퓨팅 환경을 지능형 비전 센서를 통해 구현한 셈이다.

 

이렇게 이미지 센서에서 생성된 사진과 영상 데이터를 인공지능 프로세서를 이용해 바로 처리할 수 있게 되면, 서버나 클라우드로 데이터를 전송해서 분석하고 처리해야 하는 과정이 필요 없어진다. 따라서 데이터 전송 과정에서 발생할 수 있는 전송 지연, 민감한 개인 정보가 담긴 데이터에 대한 보안 문제, 클라우드 서비스 이용에 필요한 전력과 비용 문제 등이 사라진다.

 

AI 로직 칩은 인공지능에 최적화된 소니의 DSP(Digital Signal Processor)와 메모리 등으로 구성되어 있다. 이미지 칩에서 전송된 데이터를 ISP(Image Signal Processor)와 AI 분석 처리 과정을 거치면 메타 데이터, 일반적인 이미지, ISP 출력 형식의 이미지(YUV/RGB), 특정 부분만 추출한 ROI(Region of Interest) 등 다양한 형태의 데이터로 저장할 수 있다.

 

예를 들어 잔디밭에 앉아 있는 개(Dog) 사진을 촬영했다고 가정하자. 지능형 비전 센서의 AI 로직 칩은 사진을 분석해 원래의 이미지, ‘개(Dog)’라는 메타데이터, 빛의 밝기와 2개의 색상 신호로 구성된 YUV 또는 RGB(Red Green Blue) 색상 값으로 된 ISP 이미지, 얼굴 부분만 잘라낸 ROI 이미지로 분석 또는 변환해서 데이터를 처리할 수 있다.

 

또한 카메라가 설치되어 있는 환경이나 목적에 맞도록 인공지능 모델을 설정해 서로 다른 용도로 활용하는 것이 가능하다. 이를테면 상점 진열대에 설치된 카메라로는 진열된 상품의 수량이나 종류, 매장 천장에 있는 카메라로는 고객들의 위치나 밀도, 매장 출입구에서는 들어오고 나가는 고객 파악 등의 용도로 활용할 수 있다. 기존의 카메라처럼 모든 데이터를 서버나 클라우드로 전송하지 않고, 이미지 센서에서 바로 이러한 작업을 처리할 수 있다.

 

실시간으로 촬영하는 동영상 프레임을 분석하는 경우는 더욱더 유용하다. 기존의 영상 시스템에서는 각각의 프레임을 실시간으로 서버로 전송해야 하므로, 대용량 데이터를 전송하기 위한 네트워크 대역폭이 필요하다. 하지만 지능형 이미지 센서를 활용하면, 이미지 센서로 촬영한 프레임을 실시간으로 AI 로직 칩이 바로 처리하기 때문에, 훨씬 빠르고 적은 데이터만으로 원하는 영상 분석이나 추출할 수 있다.

 

특히 개인 정보를 식별하는 데 필요한 민감한 정보를 카메라로 촬영해 전송할 경우, 데이터 전송이나 저장 과정에서 개인정보 침해나 보안 문제를 고려해야 한다. 하지만 데이터 전송 없이 지능형 이미지 칩에서 필요한 데이터만 추출할 수 있기 때문에, 이러한 문제를 최소화하거나 없앨 수 있다는 장점이 있다.

 

이미지 센서는 유효화소가 4,056X3,040화소인 1/2.3인치(대각선 길이 7.857mm) 칩을 사용했으며, 4K(4,056X2,288) 해상도로 일초에 60프레임 또는 1,080p 모드에서 일초에 240프레임으로 동영상을 촬영할 수 있다. 비디오 촬영에 AI 처리를 함께 사용하거나 메타 데이터 출력 모드에서는 일초에 최대 30프레임 촬영을 지원한다. 세금을 제외한 샘플 공급가격은 IMX500이 1만엔(약 11만 5,000원), IMX501은 2만엔(약 23만원)이다.

 

 Syndicated to WWW.CIOKOREA.COM

 

 

 

반응형