Search
Duplicate

Data Preprocessing

zero-centering

데이터의 모든 feature마다 평균으로 나누고, 위의 그림처럼 zero-centered 데이터로 만드는 과정이다.
전처리 과정은 전체 평균 이미지를 빼거나, 3개 채널(RGB)의 각각 평균을 구해서 각 채널별로 평균을 빼서 진행한다.
이미지의 경우 전처리로 zero-centering 정도만 사용하고 normalization 까지는 사용 하지 않는다. → 이미지의 모든 픽셀들의 scale은 [0, 255]로 같기 때문
더 낮은 차원으로 감소시키는 PCA나 whitened data 와 같은 방법도 이미지 처리에선 사용하지 않는다. → CNN에서는 원본 이미지 자체의 spatial 정보를 이용해서 이미지의 spatial structure를 얻을 수 있도록 한다.
Validation과 test 단계에서도 train set의 평균, 표준편차를 사용하여 전처리한다.