01程序员

标注图像用于AI模型训练

fullstacker 发布于 2021-02-01

在本系列的这篇文章中，我们将标记一个人脸面罩数据集。

在这里，我们将看到如何正确地标记生成的图像，以便训练YOLO模型。

在本系列的前一篇文章中，我们为人工智能模型训练准备了面罩图像。在这一个，我们将标记这些图像。如果你不是很熟悉计算机视觉任务，你可能没有听说过LabelImg。它本质上是一个计算机视觉的图像标记工具。还有其他的-但这一个是非常容易使用，重量轻，兼容YOLOv5，免费！

这个过程可能需要几个小时

要安装应用程序，可以使用多个存储库。使用git Clone克隆此存储库。在同一终端窗口中，运行以下命令进行安装：

Ubuntu:

cd path/to/dir/LabelImg
sudo apt-get install pyqt5-dev-tools
sudo pip3 install -r requirements/requirements-linux-python3.txt
make qt5py3

MacOS (先进入 LabelImg 目录)

brew install qt
pip3 install pyqt5 lxml
make qt5py3

Windows + Anaconda (先进入 LabelImg 目录):

conda install pyqt=5
conda install -c anaconda lxml
pyrcc5 -o libs/resources.py resources.qrc

安装完成后，需要编辑预定义的自定义类。导航到labelImg/data目录并搜索预定义的_类.txt文件。打开它，然后输入要在应用程序中使用的标签。对于我们的面膜检测项目，他们应该这样看：

现在，通过发布python3启动应用程序标签mg.py. 应用程序将启动：

现在让我们用图像标签把我们的手弄脏。这需要很多耐心，但你可以做到！

用LabelImg从图像生成训练数据集

在启动标记过程之前，请打开文件资源管理器并为要保存的图像创建一个文件夹。解压在该目录中的数据扩充步骤中获得的文件，并在其中创建一个名为Labels的文件夹，我们将保存LabelImg生成的所有文本文件。

是时候给图片贴标签了。打开LabelImg，单击左侧面板上的opendir并选择包含图像数据集的文件夹。要选择标签的存储位置，请单击“更改保存目录”，然后选择上面几行创建的新标签文件夹。完成后，您将看到文件夹的第一个图像：

在开始贴标签之前，请确保在左侧面板上选择了“YOLO”模式：

单击“创建矩形框”，然后围绕图像中的每个面绘制一个正方形。尽量覆盖每个面，同时不要在正方形内留下大的空白。每次绘制正方形时，都会出现一个弹出窗口，提示您选择与正方形对应的标签：

在该过程结束时，您应该得到一个完全标记的图像：

请注意右侧的标签摘要。用它来记录你在每张图片上所做的事情。准备好后，单击左侧面板上的“保存”，然后单击“下一个图像”。

在玩了几个小时之后，你的4000多张图片的数据集被标记了。生成的g.txt文件包含什么？我们来检查其中一个：

每个.txt文件都链接到相应的图像。例如，如果有一个名为0.jpg的图像，LabelImg将生成一个名为0.txt的文件，其中包含图像中每个标签的坐标。为每个对象创建一个新行，其格式为<object class number><x><y><width><height>。这被称为YOLO标签格式。

下一步

标记数据集后，最重要部分的时机已经成熟。在下一篇文章中，我们将使用数据集来训练YOLOv5对象检测模型。敬请期待！

全栈者

关注私信

文章

关注

粉丝