무인감시 


목표: 연속된 이미지 시퀀스에서 움직이는 객체 (전경)를 강건하게 검출하는 알고리즘의 개발
    난제 : 눈, 비가 내리는 상황, 혹은 카메라가 일정수준 움직이는 환경에서도 전경객체 검출을 수행하여야 함
연구 방향    딥 러닝 모델에 대한 개선 및 개발
    무인감시 분야의 연구에서는 1장의 이미지가 아닌, 다수의 이미지들을 입력데이터로 사용 따라서, 공간 영역과 시간 영역의 연산을 모두 효율적으로
    수행하는 시공간 네트워크가 요구됨 공간 영역 네트워크와 시간 영역 네트워크를 분리하여 시공간 데이터를 효율적으로 연산하는 딥 러닝 네트워크의 개발 진행

    입력 데이터 튜닝을 통한 성능향상
    딥 러닝 연구에서의 중점은 학습 환경과 실제 환경에서 균일한 성능을 확보하는 것 따라서, 입력 데이터를 일반적인 딥 러닝 연구와 달리, 시공간 데이터 영역에서의 데이터를 증폭하는
    방법에 대한 연구를 수행 입력 이미지를 그대로 사용하지 않고, 고전적인 기법을 사용하여 배경 이미지 형태로 변환 후 네트워크의 입력으로 사용하는 연구를 수행


 

 주요 연구 내용
 

  

  
전경객체검출 알고리즘 개요도

전경객체검출 결과









 

 

딥강화학습을 이용한 컴퓨터 비전 연구

목표: 기존 이미지 처리 알고리즘 혹은 모델에  딥강화학습을 적용 기존 알고리즘을자동화 하거나, 기존 모델보다 우수한 모델을 구성
    난제 1: 원본 이미지와 처리된 이미지의 이미지 특성이 상이하여 기존의 강화학습 알고리즘을 그대로 적용하기 어려움
    난제 2: 별도의 라벨 데이터가 없는 경우 이미지 처리 결과에 따른 보상을 결정하는 것에 한계가 존재함
 연구 방향 : 딥강화학습 과정 일부 변경을 통한 이미지 처리 적용    이미지 처리를 위한 딥강화학습을 한번의 행동으로 끝나는 상황으로 가정 하고 알고리즘을 구성    훈련을 위하여 필요한 다음 상태에서 행동은 무작위 이미지 입력에서 행동으로 대체하여 적용    적은 수의 라벨 데이터를 이용한 평가 모델을 활용하여 별도의 라벨 데이터 생성 없이 보상을 결정


 주요 연구 내용

강화학습 적용 개요도 



 

상황이해

목표 : 로봇 혹은 차량에서 이미지를 바탕으로 주변 환경의 물체를 검출하고 그 사이의 상관관계 정보를 추론해야 함
    난제 1: 검출된 물체가 많아질 수록 상관관계의 개수가 기하급수적으로 증가함
    난제 2: 물체 사이의 상관관계에 대하여 그 개수와 정도를 결정하기 난해함 


연구 방향 : 딥강화학습 과정 일부 변경을 통한 이미지 처리 적용    이미지 처리를 위한 딥강화학습을 한번의 행동으로 끝나는 상황으로 가정 하고 알고리즘을 구성    훈련을 위하여 필요한 다음 상태에서 행동은 무작위 이미지 입력에서 행동으로 대체하여 적용    적은 수의 라벨 데이터를 이용한 평가 모델을 활용하여 별도의 라벨 데이터 생성 없이 보상을 결정

 


 주요 연구 내용

상황이해 모델 개요도






텍스트 인식


We explore the Scene Text Recognition(STR) problem, which is one of the challenging sub-fields of computer vision. Current research is focused on improving the accuracy of text model recognition. At present, the biggest challenge of scene text recognition is the irregularity of text images. For example, the variety of text shapes, including horizontal, vertical, oblique, curved, etc., as well as the quality of text images, such as blur and perspective. 

Text sequence processing method improves and develops the performance of text feature extraction network
Use CTC and Attention-guide to optimize feature extraction performance
Use CTC-guide and Attention to optimize feature extraction performance 
Use GNN to optimize the CTC processing performance 
Use unsupervised methods to reconstruct irregular images
Use GAN method to deal with irregular text images
Then, in response to the current challenges of text curved and blurring in irregular text images, develop modules in the generative network.


 주요 연구 내용


텍스트 인식 모델 개요도

  


  
 

불규칙한 텍스트 이미지 재구성 모델 개요도


 
 


Point Cloud 시맨틱 분할

목표
    로봇 혹은 차량에서 이미지를 바탕으로 주변 환경의 물체를 검출하고 그 사이의 상관관계 정보를 추론해야 함

    Point cloud 형식으로 표현되는 3D 공간상의 물체를 점 단위로 분할하는 연구 수행
    

연구 방향
    다양한 3D 데이터 입력 방식을 통한 시맨틱 분할 성능 향상 
    Point-based, Voxelization, Spherical Projection 등의 다양한 데이터 처리기법을 통해 성능과 처리속도에 최적화된 구조 설계    각각 다른 차원의 데이터 형식을 통해, 다양한 네트워크의 장점을 취합한 성능 향상 진행   
    3D 딥러닝 구조 설계를 통한 성능 향상
    이미지 처리를 위한 2D CNN, 공간 격자 처리를 위한 3D CNN, 각 점의 학습을 위한 MLP 등의 학습기법을 융합한 강인 모델 설계    공간좌표 정보를 비롯한 거리 정보, 색상 정보, 반사율 등의 정보를 융합한 실제 환경에서 성능이 보장되는 딥러닝 모델    개발 

 


 주요 연구 내용






실내 3D point cloud 시맨틱 분할


Lidar 3D point cloud Projection



3D network module 설계