Tensorflow Object Detection API (Faster R-CNN with Resnet 101)
Basic Tutorial: Jupyter, 학습된 모델을 Load하여 이미지 내 물체 예측
Quick Start: Distributed Training on the Oxford-IIIT Pets Dataset on Google Cloud: object detector 학습 방법 소개, Transfer Learning
Configuring the Object Detection Training Pipeline: 학습 관련 설정 변경
1. 개요
2017.06.15월 공개
지원 모델
- Single Shot Multibox Detector (SSD) with MobileNet
- SSD with Inception V2
- Region-Based Fully Convolutional Networks (R-FCN) with ResNet 101
- Faster R-CNN with Resnet 101
- Faster RCNN with Inception Resnet v2
2. 설치
설치 환경 ubunutu 16.4, python3, tf 1.2
2.1 설치
필수 패키지 (TF)
# For CPU
pip install tensorflow
# For GPU
#pip install tensorflow-gpu
conda install tensorflow-gpu
관련 패키지 설치
sudo apt-get install protobuf-compiler python-pil python-lxml
sudo pip install matplotlib pillow lxml
소스 다운로드
git clone https://github.com/tensorflow/models.git
2.2 설정
- Protobuf 컴파일
# From tensorflow/models/
protoc object_detection/protos/*.proto --python_out=.
Protobuf : XML과 같이 데이터를 저장하는 하나의 포맷, 컴파일후 언어에 맞는 형태의 데이타 클래스 파일을 생성 [참고]
- Add Libraries to PYTHONPATH : slim 디렉터리를 append시키기 위함이다.
# From tensorflow/models/
export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim
2.3 설치 확인
python object_detection/builders/model_builder_test.py
Ran 7 tests in 0.013s
3. 모델 생성
4. Testing
[참고] 오류
- TypeError: a bytes-like object is required, not 'str'
export_inference_graph.py 파일 실행시 필요한 parameter 의 이름이 바뀌었습니다.
- checkpoint_path -> trained_checkpoint_prefix
- inference_graph_path -> output_directory
python object_detection/export_inference_graph \
가 아니라python object_detection/export_inference_graph.py \
5. Training
How to train your own Object Detector with TensorFlow’s Object Detector API
5.1 데이터 준비
TFRecord을 입력으로 사용함 (eg. PASCAL VOC datasetZ)
- images.tar.gz : 이미지(JPG, PNG)
- annotations.tar.gz : LIST(X_min, Y_min, X_max, Y_max) + (Label)

참고 : tfrecord 파일 읽고 쓰기
Step 1. 이미지 준비
- Google 이미지 검색 등
Step 2. 수작업으로 라벨링 진행
라벨링 툴(eg. LanelImg) 이용
Step 3. Convert Tools 이용 TFRecord 변경
# From tensorflow/models
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
tar -xvf VOCtrainval_11-May-2012.tar
python object_detection/create_pascal_tf_record.py \
--label_map_path=object_detection/data/pascal_label_map.pbtxt \
--data_dir=VOCdevkit --year=VOC2012 --set=train \
python object_detection/create_pascal_tf_record.py \
--label_map_path=object_detection/data/pascal_label_map.pbtxt \
--data_dir=VOCdevkit --year=VOC2012 --set=val \
- *_train.record
- *_val.record
- label_map.pbtxt
[참고] 자신만의 Convert Tool 만들기
Step 4. 작업 위치로 이동
- 저장 위치 :
- images.tar.gz
- annotations.tar.gz
+ images/
+ annotations/
+ object_detection/
... other files and directories
이미지 크기는 300~500 pixels추천(???) -> OOM문제 발생, Batch-size조절로 가능
5.2 Config 파일 수정
*.Config파일에 model parameters
, training parameters
and eval parameters
모두 포함하고 있음
주요 설정 항목
- num_class : eg. 클래스가 하나 이면 1
- PATH : Train data PATH, Test data PATH, label map PATH
- label map : *.pbtxt파일, id + name 으로 구성 (중요 : id는 항상 1부터 시작)
Configuring the Object Detection Training Pipeline, [Sample config 파일]
5.3 실행
A. Local 학습
# Recommended Directory Structure for Training and Evaluation
-label_map file
-train TFRecord file
-eval TFRecord file
+ model
-pipeline config file
Running the Training Job
# From the tensorflow/models/ directory
python object_detection/train.py \
--logtostderr \
--pipeline_config_path=${PATH_TO_YOUR_PIPELINE_CONFIG} \
: the pipeline config${PATH_TO_TRAIN_DIR}
: the directory in which training checkpoints and events will be written to.
사용자가 중단하기 전까지 계속 학습 수행
Running the Evaluation Job
# From the tensorflow/models/ directory
python object_detection/eval.py \
--logtostderr \
--pipeline_config_path=${PATH_TO_YOUR_PIPELINE_CONFIG} \
--checkpoint_dir=${PATH_TO_TRAIN_DIR} \
: the pipeline config${PATH_TO_TRAIN_DIR}
: the directory in which training checkpoints were saved${PATH_TO_EVAL_DIR}
:the directory in which evaluation events will be saved
Running Tensorboard
tensorboard --logdir=${PATH_TO_MODEL_DIRECTORY}
: The directory that contains the train and eval directories
B. Cloud 학습
5.4 Export Model
학습시 생성된
파일을Tensorflow graph proto
형태로 export가능입력 : checkpoint files
- model.ckpt-${CHECKPOINT_NUMBER}.data-00000-of-00001
- model.ckpt-${CHECKPOINT_NUMBER}.index
- model.ckpt-${CHECKPOINT_NUMBER}.meta
출력 : output_inference_graph.pb
# From tensorflow/models
python object_detection/export_inference_graph \
--input_type image_tensor \
--pipeline_config_path ${PIPELINE_CONFIG_PATH} \
--checkpoint_path model.ckpt-${CHECKPOINT_NUMBER} \
--inference_graph_path output_inference_graph.pb
6. Transfer Learning
6.1 새 학습 데이터 + 학습된(Pre Trained) 모델 준비
A. 새 학습 데이터
- [4.1] 참고
B. 학습된 모델
model.ckpt* 파일 다운 받기
-rw-r----- 1 hjlim99 hjlim99 188M Jun 12 00:58 frozen_inference_graph.pb
-rw-r----- 1 hjlim99 hjlim99 20M Jun 12 00:58 graph.pbtxt
-rw-r----- 1 hjlim99 hjlim99 426M Jun 12 01:00 model.ckpt.data-00000-of-00001
-rw-r----- 1 hjlim99 hjlim99 40K Jun 12 01:00 model.ckpt.index
-rw-r----- 1 hjlim99 hjlim99 11M Jun 12 01:00 model.ckpt.meta
: a graph protomodel.ckpt.data-00000-of-00001
: a checkpointfrozen_inference_graph.pb
: a frozen graph proto with weights baked into the graph as constants
6.2 Training Config 파일 수정
- [4.2] 참고
# 실행 단계에 필요한 파일들
+ data/
- faster_rcnn_resnet101_pets.config
- model.ckpt.index
- model.ckpt.meta
- model.ckpt.data-00000-of-00001
- pet_label_map.pbtxt
- pet_train.record
- pet_val.record
6.3 학습 실행
- [4.3] 참고
6.4 Export Model
수정 /models/object_detection/object_detection_tutorial.ipynb#
#MODEL_NAME = 'ssd_mobilenet_v1_coco_11_06_2017'
MODEL_NAME = 'faster_rcnn_resnet101_coco_11_06_2017'
PATH_TO_TEST_IMAGES_DIR = 'test_images'
TEST_IMAGE_PATHS = [ os.path.join(PATH_TO_TEST_IMAGES_DIR, 'frame{}.jpg'.format(i)) for i in range(1001, 11565) ]
import scipy.misc
image = scipy.misc.toimage(image_np)
- 결과물 저장 위치 :