Coovally任务详解之实例分割任务

跑码地Coovally

2022-12-01 10:52 ·江苏

实例分割（Instance Segmentation）是视觉经典四个任务中相对最难的一个，它既具备语义分割（Semantic Segmentation）的特点，需要做到像素层面上的分类，也具备目标检测（Object Detection）的一部分特点，即需要定位出不同实例，即使它们是同一种类。

但是通过Coovally，即可轻松完成实例分割任务，让我们一起来看看吧~

说明：当前实例分割任务仅支持COCO格式数据集,请提前按要求准备好数据集，具体数据集要求可参考COCO格式数据集说明。

COCO格式数据集说明

COCO数据集简介

COCO数据集是一个可用于图像检测（image detection），语义分割（semantic segmentation）和图像标题生成（image captioning）的大规模数据集。它有超过330K张图像（其中220K张是有标注的图像），包含150万个目标，80个目标类别（object categories：行人、汽车、大象等），91种材料类别（stuff categoris：草、墙、天空等），每张图像包含五句图像的语句描述，且有250,000个带关键点标注的行人。

同样地，COCO数据也有其同名的数据格式标注规范。在Coovally平台中，COCO格式主要适用于目标检测、语义分割和实例分割任务。

COCO格式数据集准备

Coovally平台会自动切分训练集和测试集，将COCO数据集格式数据按照一下数据目录层级结构放置即可：

以instances_train2017.json为例，标签目录annotations文件夹下应包含一个名为instances_train2017.json的json格式标签文件，images文件下放置需要处理的图像数据。

下面对json格式标签文件进行介绍：

说明：

images保存图片部分信息；

file_name图片名；

Height图片高度；

Width图片宽度；

Id图片id；

annotations保存标注信息，包括bbox和segmentation；

area多边形所围成的面积；

iscrowd，0：单个物体，1：多个物体的集合体；

iscrowd=0时，segmentation将使用polygons格式;

iscrowd=1时，segmentation将使用RLE格式;

image_id图片id；

bbox标注框[x, y, width, height]；

segmentation会标注多边形所有点的x坐标，y坐标；

category_id类别id；

id标签id；

ignore，是否忽略，默认为0；

categories包含样本标签和ID的对应关系。

1. 数据上传

1.1图片上传

图片数据准备

目前Coovally支持两种数据上传方式：

·图片文件和标签文件都打包压缩成一个zip文件上传，待数据集创建成功之后，Coovally系统会自动识别并生成标签；

·先单独上传zip格式图片文件，待数据集创建成功之后，在数据集详情页再单独上传zip格式标签文件。

图片数据上传

登录Coovally点击侧边导航栏并下拉菜单点击【创建数据集】。

点击【创建数据集】，按要求填写参数，并将此前准备好的图片压缩包拖至文件上传区域，点击【确定】，等待图片数据上传并解析完成即可；

注意：需记住所填写的数据集名称，在创建标签时，需根据数据集名称找到对应的数据集。

1.2 标签上传

标签数据准备

将数据中的标签文件所在文件夹压缩为zip格式的压缩包；

标签数据上传

在【我的数据】标签页，找到刚刚上传的图片数据；点击【图标】进入数据集信息页，点击【创建标签】，再按要求填写参数，将标签压缩包拖到【文件上传】区域，最后点击【确定】，等待完成解析即可；

数据检查（非必须步骤）

待图片及标签全部完成上传及解析，即可点击【标签预览】，进行标签预览，可检测标注是否存在错标、漏标等问题。

2. 模型训练

2.1 数据建模

基于此前已完成上传的数据集，进行数据建模，点击数据建模图标，进入数据建模详情页面。

2.2 模型选择&参数设置

按要求选择模型填写模型参数；并设置训练运行参数。

点击【增强算法】进入算法增强页面，筛选所需要增强的标签类型及数据增强方法，进行据增强，此操作非选操作，但当数据量较少，或数据不均衡的情况下可尝试进行数据增强，以提高模型精度。

2.3 模型训练

点击开始训练，即可开始模型训练，待模型训练结束即可开始此后的模型转化、部署、推理等操作。

3.模型转换

注意：此处仅为模型转化步骤示例，详细信息可参考Coovally官网文档。

点击【模型转换】，进入模型转换页面，按要求选择及填写参数，点击【开始转换】即可开始进行模型转化，等待模型转化完成即可。

注意：等待模型转换期间，切勿刷新页面！

4.模型部署

在模型转化完成后转跳的界面点击击【模型部署】，开始模型部署。先按要求选择服务地址，再点击【部署】，等待部署完成。

5.模型推理

在模型部署完成后转跳的界面，点击【上传图片】按要求上传图片，系统即可对此图片进行模型推理，且实例分割结果会直观的显示出来。

实例分割与语义分割都属于图像分割的范畴，图像分割技术有助于理解图像中的内容，并确定物体之间的关系，因此常被应用于人脸识别、物体检测、医学影像、卫星图像分析、自动驾驶感知等领域。

在我们生活中，图像分割技术的应用实例也很常见，如智能手机上的抠图相机、在线试衣间、虚拟化妆、以及零售图像识别等，这些应用往往都需要使用智能分割后的图片作为操作对象。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴