近期因使用TensorFlow object detection API進行開發,而目前嘗試使用PASCAL VOC2007+2012進行訓練以及驗證,需要將PASCAL VOC2007+2012製作成TF Records的型態,再使用TensorFlow中的API進行訓練以及測試,以下紀錄如何使用TensorFlow object detection API製作出PASCAL VOC的TF Records,下一篇會詳細解說如何進行訓練。
一、下載PASCAL VOC 2007 + 2012資料集:
PASCAL VOC 2007網站: http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html
1.訓練集: http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
2.測試集: http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
PASCAL VOC 2012網站: http://host.robots.ox.ac.uk/pascal/VOC/
1.訓練集: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
二、下載完成後進行解壓縮,並依照下面所述進行檔案放置:
1.將以下三個檔案進行解壓縮。
(將檔案解壓縮於models/research下,若沒下載Tensorflow object detection API的檔案請先看步驟三,完成後應該會有models的資料夾)
2.解壓縮完成後會看到VOCdevkit:
進去VOCdevkit後會看到VOC2007以及2012,2007的資料夾中包含訓練以及測試集,而2012只有訓練集,因為2012年的測試集檔案沒有公佈,如果要測試的話,要上傳至網站進行測試。
三、利用TensorFlow object detection API進行TF Records製作。
1.若沒安裝TensorFlow object detection API,依照下面網站進行下載與安裝。
下載檔案:https://github.com/tensorflow/models
安裝步驟:
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/installation.md
2. 製作PASCAL VOC dataset的TF Records訓練檔案:
--year=中可以輸入三個參數,分別是:VOC2007、VOC2012以及merged。
--set=中可以輸入四個參數,分別是:train、val、trainval以及test。
(trainval為將train以及val合併在一起)
以下指令為製作Train的TF Records,裡面包含2007+2012的Train以及validation。
--year=merged
--set=trainval
操作路徑在models/research下,因此剛剛解壓縮的檔案VOCdevkit資料夾也放置於research下。
python object_detection/dataset_tools/create_pascal_tf_record.py \
--label_map_path=object_detection/data/pascal_label_map.pbtxt \
--data_dir=VOCdevkit --year=merged --set=trainval \
--output_path=VOC_train_07_12.record
若出現下圖錯誤需加入以下指令。
export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim
3.製作PASCAL VOC dataset的TF Records測試檔案:
以下指令為製作Test的TF Records,只有VOC 2007中有test的檔案。
--year=VOC2007
--set=test
python object_detection/dataset_tools/create_pascal_tf_record.py \
--label_map_path=object_detection/data/pascal_label_map.pbtxt \
--data_dir=VOCdevkit --year=VOC2007 --set=test \
--output_path=VOC_test_07.record
4.完成後可以在models/research的路徑下看到以下兩個檔案已經成功生成。
留言列表