标注图像用于AI模型训练
fullstacker 发布于 2021-02-01

在本系列的这篇文章中,我们将标记一个人脸面罩数据集。

在这里,我们将看到如何正确地标记生成的图像,以便训练YOLO模型。

在本系列的前一篇文章中,我们为人工智能模型训练准备了面罩图像。在这一个,我们将标记这些图像。如果你不是很熟悉计算机视觉任务,你可能没有听说过LabelImg。它本质上是一个计算机视觉的图像标记工具。还有其他的-但这一个是非常容易使用,重量轻,兼容YOLOv5,免费!

这个过程可能需要几个小时

要安装应用程序,可以使用多个存储库。使用git Clone克隆此存储库。在同一终端窗口中,运行以下命令进行安装:

Ubuntu:

cd path/to/dir/LabelImg
sudo apt-get install pyqt5-dev-tools
sudo pip3 install -r requirements/requirements-linux-python3.txt
make qt5py3

MacOS (先进入 LabelImg 目录)

brew install qt
pip3 install pyqt5 lxml
make qt5py3
Windows + Anaconda (先进入 LabelImg 目录):

conda install pyqt=5
conda install -c anaconda lxml
pyrcc5 -o libs/resources.py resources.qrc
安装完成后,需要编辑预定义的自定义类。导航到labelImg/data目录并搜索预定义的_类.txt文件。打开它,然后输入要在应用程序中使用的标签。对于我们的面膜检测项目,他们应该这样看:



现在,通过发布python3启动应用程序标签mg.py. 应用程序将启动:


现在让我们用图像标签把我们的手弄脏。这需要很多耐心,但你可以做到!

用LabelImg从图像生成训练数据集

在启动标记过程之前,请打开文件资源管理器并为要保存的图像创建一个文件夹。解压在该目录中的数据扩充步骤中获得的文件,并在其中创建一个名为Labels的文件夹,我们将保存LabelImg生成的所有文本文件。

是时候给图片贴标签了。打开LabelImg,单击左侧面板上的opendir并选择包含图像数据集的文件夹。要选择标签的存储位置,请单击“更改保存目录”,然后选择上面几行创建的新标签文件夹。完成后,您将看到文件夹的第一个图像:


在开始贴标签之前,请确保在左侧面板上选择了“YOLO”模式:


单击“创建矩形框”,然后围绕图像中的每个面绘制一个正方形。尽量覆盖每个面,同时不要在正方形内留下大的空白。每次绘制正方形时,都会出现一个弹出窗口,提示您选择与正方形对应的标签:


在该过程结束时,您应该得到一个完全标记的图像:


请注意右侧的标签摘要。用它来记录你在每张图片上所做的事情。准备好后,单击左侧面板上的“保存”,然后单击“下一个图像”。

在玩了几个小时之后,你的4000多张图片的数据集被标记了。生成的g.txt文件包含什么?我们来检查其中一个:


每个.txt文件都链接到相应的图像。例如,如果有一个名为0.jpg的图像,LabelImg将生成一个名为0.txt的文件,其中包含图像中每个标签的坐标。为每个对象创建一个新行,其格式为<object class number><x><y><width><height>。这被称为YOLO标签格式。

下一步

标记数据集后,最重要部分的时机已经成熟。在下一篇文章中,我们将使用数据集来训练YOLOv5对象检测模型。敬请期待!


作者:Sergio Virahonda

原文:https://www.codeproject.com/Articles/5293072/Labelling-Images-for-AI-Model-Training



全栈者
关注 私信
文章
31
关注
0
粉丝
0