'Computer Vision/Deep learning' 카테고리의 글 목록

26. 객체 탐지

하나의 이미지에서 여러 물체를 분류하고 위치를 추정하는 작업을 객체 탐지(object dection)이라고 한다. 몇 년 전까지 널리 사용되던 방법은 하나의 물체를 분류하고 위치를 찾는 분류기를 훈련한 다음 그림 14-24처럼 이미지를 모두 훑는 것이다. 이 예에서는 이미지를 6x8 격자로 나누고 하나의 CNN(굵은 검정 사각형)이 모든 3x3 영역을 지나간다. 이 CNN이 이미지 왼쪽 상단을 지나갈 때 가장 왼쪽에 있는 장미꽃의 일부를 감지한다. 그다음 오른쪽으로 한 스텝 이동해서 같은 꽃을 다시 감지한다. 그다음 스텝에서 가장 위쪽에 있는 장미꽃을 감지하기 시작한다. 다시 오른쪽으로 한 스텝 이동해서 같은 꽃을 감지한다. 이런 식으로 CNN이 전체 이미지를 슬라이딩하면서 모든 3x3 영역을 본다. 또..

Computer Vision/Deep learning 2021.06.15

25. 분류와 위치 추정

사진에서 물체의 위치를 추정하는 것은 회귀 작업으로 나타낼 수 있다. 물체 주위의 바운딩 박스(bounding box)를 예측하는 일반적인 방법은 물체 중심의 수평, 수직 좌표와 높이, 너비를 예측하는 것이다. 즉 네 개의 숫자를 예측해야 한다. 이 때문에 모델을 크게 바꿀 필요는 없다. (일반적으로 전역 평균 풀링 층 위에) 네 개의 유닛을 가진 두 번째 밀집 출력 층을 추가하고 MSE 손실을 사용해 훈련한다. base_model=keras.applications.xception.Xception(weights='imagenet',include_top=False) avg=keras.layers.GlobalAveragePooling2D()(base_model.output) class_output=keras..

Computer Vision/Deep learning 2021.06.15

24. 사전훈련된 모델을 사용한 전이 학습

충분하지 않은 훈련 데이터로 이미지 분류기를 훈련하려면 사전훈련된 모델의 하위층을 사용하는 것이 좋다. 예를 들어 사전훈련된 Xception 모델을 사용해 꽃 이미지를 분류하는 모델을 훈련해보겠다. import tensorflow_datasets as tfds dataset,info=tfds.load('tf_flowers',as_supervised=True,with_info=True) dataset_size=info.splits['train'].num_examples #3670 class_names=info.features['label'].names #['dandelion','daisy',...] n_classes=info.features['label'].num_classes # 5 with_info=T..

Computer Vision/Deep learning 2021.06.13

23. 케라스를 사용해 ResNet-34 CNN 구현

먼저 ResidualUnit 층을 만든다. class ResidualUnit(keras.layers.Layer): #잔차 유닛 def __init__ (self,filters,strides=1,activation='relu',**kwargs): super(). __init__(**kwargs) self.activation=keras.activations.get(activation) self.main_layers=[ keras.layers.Conv2D(filters,3,strides=strides, padding='same',use_bias=False), keras.layers.BatchNormalization(), self.activation, keras.layers.Conv2D(filters,3,str..

Computer Vision/Deep learning 2021.06.13

22. ResNet, Xception

잔차 네트워크(residual network)를 사용한다. 152개 층으로 구성된 극도로 깊은 CNN을 사용했다. 더 적은 파라미터를 사용해 점점 더 깊은 네트워크로 모델을 구성하는 일반적인 트렌드를 만들었다 이런 네트워크를 훈련시킬 수 있는 핵심 요소는 스킵 연결(skip-connetcion)이다. 어떤 층에 주입되는 신호가 상위 층의 출력에도 더해진다. 일반적인 신경망을 초기화할 때는 가중치가 0에 가깝기 때문에 네트워크도 0에 가까운 값을 출력한다. 스킵 연결을 추가하면 이 네트워크는 입력과 같은 값을 출력한다. 즉 초기에는 항등함수를 모델링한다. 목적 함수가 항등 함수에 가깝다면(대부분의 경우에 해당) 훈련 속도가 매우 빨라질 것이다. 또한 스킵 연결을 많이 추가하면 일부 층이 아직 학습되지 않았..