동영상 빅데이터에서 임의 다객체의 추출 및 인덱싱 기법
관련링크
본문
다양한 산업에서 축적된 데이터와 실시간으로 발생하는 데이터의 크기가 급증하고 있다. 최근에는 모바일 트래픽 중 영상 콘텐츠 비중이 40~60%를 차지하는 등 영상 데이터의 활용도가 더욱 높아지고 있다. 그뿐만 아니라, 교통 및 보안 분야에서 CCTV 및 차량 블랙박스 설치 확대에 따라 대용량의 영상 빅데이터가 축적되고 있으며, 이에 따라 축적된 대용량 동영상 데이터를 자동으로 분석하는 기술에 대한 관심이 높아졌다. 현재 표준 기술로 자리 잡은 맵리듀스 프레임워크 등 분산 병렬 처리를 지원하는 다양한 기술의 개발이 진행되고 있지만, 대부분 텍스트 빅데이터의 분석에 최적화되어 연산 복잡도가 높은 동영상과 같은 데이터의 고속 처리 기술 개발이 미흡한 상태이다. 이러한 문제를 해결하기 위한 새로운 기술적 방안이 절실히 요구되고 있다.
본 연구실에서는 다양한 환경에서 발생하는 동영상 스트림 데이터를 고속으로 분산처리할 수 있는 동영상 빅데이터 분석 플랫폼의 설계 및 구현에 관하여 연구한다. 특히, 높아진 보안의 필요성과 향상된 화질의 CCTV 및 블랙박스를 통한 차량 번호판 인식 향상 등에 기반을 두어 CCTV 및 블랙박스 영상 빅데이터를 활용한 실시간 차량 객체 검출 시스템을 개발한다. 본 시스템을 통해 실시간으로 발생하는 영상 스트림을 손실 없이 수집하여 분배하고, 분산 병렬 처리를 이용해 영상을 고속 처리하여 객체를 추출하며, 처리된 결과를 효과적으로 저장/인덱싱하는 기술의 개발을 목표로 한다.
그림 1 대용량 영상 분산처리 기술 시스템 개념도
● Coarse-grained과 Fine-grained 분류 및 유동적인 데이터 분산과 노드 할당 연구
- 대용량의 영상을 고속처리하기 위해, 영상처리 시 작업 간의 연관성을 토대로 Coarse-grained 작업과 Fine-grained 작업을 분류한다. 또한, 분류 작업을 통해 데이터 분산과 노드 할당을 유동적으로 진행하는 방법을 연구한다. 영상처리는 클러스터를 활용한 실시간 분산 처리 방식을 이용하며, 영상처리에 적합하지 않은 기존의 아파치 스파크(Apache Spark) RDD 인메모리 방식을 개선하여 영상처리에 적합하게 메모리를 사용할 수 있는 기법을 연구한다. 그리고 각 클러스터에서는 차량 번호판 인식 등 스트림 애플리케이션을 독립적으로 실행하여 처리속도 성능을 높이며, 영상 데이터의 효율적 처리를 위한 영상 샘플링을 연구한다.
● 분산 데이터베이스 시스템 및 인덱싱 기법 연구
- 추출된 객체의 정보를 저장하기 위한 분산 데이터베이스 시스템을 연구하며, 검색 속도 향상 및 효율적 관리를 위해 분산 데이터베이스의 특징과 시공간 데이터를 고려한 인덱싱 기법을 연구한다. 또한, 객체의 고른 공간 정보 분포와 중복 데이터 제거를 위해서 공간 데이터를 고정된 최근접 노드에 맵핑하는 기법을 연구한다. 그리고 빠른 쿼리 프로세싱을 위한 데이터 스트림 정렬 기술을 연구하며, 객체의 추적 결과를 효과적으로 제공할 수 있는 시각화 기법을 적용한다.
그림 2 CCTV 및 블랙박스 영상 빅데이터를 활용한 실시간 차량 객체 검출 시스템