人工智能——計算機視覺方面的主要任務有四個:圖像分類、目标檢測、語義分割、實例分割。每一個任務的數據格式要求都是不一樣的。
一、圖像分類。圖像分類标注是一項最基本最簡單的标注任務。用戶隻需要将屬于同一類的圖片放在同一個文件夾裡即可。它的目錄結構如下:
MyDataset/ # 圖像分類數據集根目錄
|--dog/ # 當前文件夾所有圖片屬于dog類别
| |--d1.jpg
| |--d2.jpg
| |--...
| |--...
|
|--...
|
|--cat/ # 當前文件夾所有圖片屬于cat類别
| |--c1.jpg
| |--c2.jpg
| |--...
| |--...
目标檢測數據标注可以使用labelimg或labelme标注工具。labelimg 是一個矩形标注工具,而labelme可以支持輪廓标注,可用于分割任務。
可以使用pip命令安裝:
pip install labelimg
pip install labelme
命令行下輸入命令,直接啟動:
>labelimg
>labelme
根據程序的需要,目标檢測任務的數據格式可以是PascalVOC或MSCOCO格式。
注:
1、labelme進行圖像标注後,需要根據需要進行格式轉換。
Annotations文件夾存放對應的json标注文件
JPEGImages文件夾存放要标注的圖像文件
labelme标注 文件夾
2、labelimg進行圖像标注後,可以直接保存為PascalVOC格式。
MyDataset/ # 目标檢測數據集根目錄
|--JPEGImages/ # 圖像文件夾
| |--d1.jpg
| |--d2.jpg
| |--...
| |--...
|
|--Annotations/ # 存放标注文件(xml文件或json文件)
| |--d1.xml
| |--d2.xml
| |--...
| |--...
MyDataset/ # 語義分割數據集根目錄
|--JPEGImages/ # 圖像文件夾
| |--d1.jpg
| |--d2.jpg
| |--...
| |--...
|
|--Annotations/ # 存放标注文件(png格式)
| |--d1.png
| |--d2.png
| |--...
| |--...
MyDataset/ # 實例分割數據集根目錄
|--JPEGImages/ # 圖像文件夾
| |--d1.jpg
| |--d2.jpg
| |--...
| |--...
|
|--Annotations.json #生成标注文件
注:數據标注與劃分實例:
1、4.1 目标檢測:準備數據集(采集、标注和劃分)
2、5.1 語義分割:數據集采集、轉換和劃分
3、6.1 實例分割:數據集采集、轉換和劃分
,