reComputer Jetson 運行 YOLOv5 教學全攻略 2 – 訓練自己的模型

一、前言

上一篇文章告訴大家如何建置 YOLOv5 的環境在 Jetson Nano 上，並在最後使用官方提供的測試模型，進行推論與測試。但畢竟官方提供的模型，未必適合大家使用在自己的專案上，所以這篇文章將帶大家從蒐集自己的資料開始。

我們會透過連接在 Jetson Nano上面的網路攝影機來拍攝照片，接著使用強大且方便的 Roboflow 輔助我們標記資料，並進一步建置自己的資料集。最後使用 Google Colab，運用 Roboflow 匯出自己的資料集來訓練 YOLOv5 模型。

二、資料蒐集

我們將透過攝影機拍攝照片來蒐集自己的資料，請先構思想要透過物件辨識來辨識的目標。比方說筆者有一個紅蘿蔔布玩具，我希望透過物件辨識來辨識「紅蘿蔔」，與蘿蔔被拔掉後留下的「坑洞」這兩個目標。待會兒將會針對這些目標拍攝相關的照片，作為訓練與驗證的資料。

首先確保網路攝影機連接在 Jetson Nano 上，接著開啟終端機並輸入下列指令並按下 Enter 鍵：

gedit capture.py

reComputer J1010 運行 YOLOv5 教學全攻略2 - 訓練自己的模型

這個指令將開啟文字編輯器「gedit」，並新增一個文件名稱為「capture.py」，接著在開啟的編輯器視窗中填入下方程式碼。

從網頁複製程式碼，難免會有格式跑掉的問題，請自行調整縮排、標點符號以符合 Python 規範，避免後續執行時報錯。調整完畢後，請按下編輯視窗右上角的儲存按鈕「Save」，然後關閉視窗。

上述程式使用 OpenCV 套件幫我們從攝影機擷取影像，並讀取鍵盤指令儲存拍攝畫面。現在讓我們執行這個程式，請在終端機中輸入下方指令並按下 Enter 鍵：

python3 capture.py

輸入完指令後會跑出顯示視窗，並新增一個名為「images」的資料夾，攝影機拍攝的畫面會顯示在視窗中。請將攝影機對準您要辨識的物品，只要按下鍵盤上的「ｓ」按鍵，就會將看到的畫面儲存成照片，畫面左上角會提示目前拍攝的數量，照片則會統一存放在 images 資料夾。

images 資料夾的路徑沒意外的話，會在「Home」目錄底下。那到底要多少照片才夠呢？對於訓練來說，當然是越多例子越好囉！如果一定要有個具體的數字，筆者之前有看過一篇文章，作者建議是至少每個類別要有 250 ~ 300 多的標註數量，才能訓練出一個相對好的模型，供大家參考。這邊為了貪圖方便，筆者只拍攝了 50 張照片做示範。