全景分割新突破,创新奇智荣获MIT场景解析世界冠军

创新奇智 2020年07月22日

近日,创新奇智凭借突破性的AInnoSeg全景分割算法,刷新MIT Scene Parsing Benchmark 场景解析任务世界最好成绩,领先商汤科技(2020年3月、5月为该基准测试的世界冠军)、北京大学、南京大学、腾讯等众多知名公司和研究机构,以绝对优势获得冠军。

image.png

来源于:http://sceneparsing.csail.mit.edu/




关于ADE20K数据集



MIT Scene Parsing Benchmark 致力于为场景感知、场景解析、实例分割和语义理解等计算机视觉技术提供训练和性能标准化评估平台。该基准测试的数据来自ADE20K数据集,以场景目标复杂、目标尺度变化范围大等特点著称,共包含150个类别,覆盖人类生活各个方面的场景,里面同种类的物体在不同场景中表现出的大小、比例、姿态差别非常大,并且不同物体之间存在遮挡严重的问题,是全球范围内公认的最具挑战性、权威性、代表性的场景解析评测集,在AI相关技术领域受到广泛关注和高度认可,吸引着众多国际知名企业、学术研究机构集中参与。ADE20K数据集在图像分割领域意义重大,是世界计算机视觉三大顶级会议(CVPR、ICCV和ECCV)语义分割论文权威基准数据集。

image.png

ADE20K数据集



创新奇智AInnoSeg算法



目前最优的全景分割算法无法解决图像中物体边缘像素的分割和小物体的分割准确性。创新奇智提出的AInnoSeg算法却能有效地解决这些问题。AInnoSeg算法首先使用基于Nonlocal network修改的pixel and channel attention网络结构来嫁接在HRnet上面,这样能够精确地对图像中每个像素进行分割;然后连接一个OCRnet网络结构对图像中每个物体和属于这个物体的像素进行联系,从而能够让算法更加关注物体自身的像素和边缘像素;然后使用数据增强的方式,让算法更加关注图像中小物体的分割。同时使用多个辅助损失函数来完成训练。

 

image.png

HRNet网络

其次,AInnoSeg提供了半监督的训练模型流程,可以在数据集比较少的情况下,提升算法模型的表现力。

image.png

半监督流程训练图

AInnoSeg算法实现细节论文:https://arxiv.org/pdf/2007.10591.pdf


我们来看看AInnoSeg算法在ADE20K数据集上面的表现。

image.png

image.pngAInnoSeg算法相比较于目前最优的分割算法,能够有效地分割物体边缘和实现小物体的分割。



全景分割的落地应用


图像分割是计算机视觉领域的重要任务,有着众多的应用场景。本次大赛创新奇智夺冠的AInnoSeg全景分割算法已经应用到创新奇智ManuVision工业视觉平台MatrixVision视频智能平台,用于工业制造过程的产品质量管控,以及生产园区的车辆检测、行为分析等各类复杂现实场景。
创新奇智不仅拥有业界领先的计算机视觉技术 — 连续刷新人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC、实例分割竞赛Cityscapes、多目标跟踪竞赛MOT Challenge等多个世界顶级计算机视觉大赛的全球排行榜,以2%的概率入选计算机视觉顶会ECCV 2020 Oral论文;还注重将技术商业化落地,在IDC中国人工智能市场报告中,跻身中国人工智能市场计算机视觉应用主流供应商,市场份额位居第6,是2018-2019 YoY增速最快企业


image.png




参赛队伍


创新奇智本次MIT Scene Parsing Benchmark场景解析挑战赛夺冠队伍由CTO张发恩领衔,吴佳洪、路建飞、康欣昕、范馨予、汤寅航、宋剑飞、黄泽、贲圣兰和黄家水等技术骨干组成。
创新奇智CTO张发恩表示:“创新奇智重创新,更重实践,研发能解决实际问题的AI算法,推动人工智能与实体产业的融合发展。未来,创新奇智将探索包括图像分割在内的计算机视觉技术在更多细分场景的应用落地,助力产业智能化。”


 


返回动态列表

全景分割新突破,创新奇智荣获MIT场景解析世界冠军

创新奇智 2020年07月22日

近日,创新奇智凭借突破性的AInnoSeg全景分割算法,刷新MIT Scene Parsing Benchmark 场景解析任务世界最好成绩,领先商汤科技(2020年3月、5月为该基准测试的世界冠军)、北京大学、南京大学、腾讯等众多知名公司和研究机构,以绝对优势获得冠军。

image.png

来源于:http://sceneparsing.csail.mit.edu/




关于ADE20K数据集



MIT Scene Parsing Benchmark 致力于为场景感知、场景解析、实例分割和语义理解等计算机视觉技术提供训练和性能标准化评估平台。该基准测试的数据来自ADE20K数据集,以场景目标复杂、目标尺度变化范围大等特点著称,共包含150个类别,覆盖人类生活各个方面的场景,里面同种类的物体在不同场景中表现出的大小、比例、姿态差别非常大,并且不同物体之间存在遮挡严重的问题,是全球范围内公认的最具挑战性、权威性、代表性的场景解析评测集,在AI相关技术领域受到广泛关注和高度认可,吸引着众多国际知名企业、学术研究机构集中参与。ADE20K数据集在图像分割领域意义重大,是世界计算机视觉三大顶级会议(CVPR、ICCV和ECCV)语义分割论文权威基准数据集。

image.png

ADE20K数据集



创新奇智AInnoSeg算法



目前最优的全景分割算法无法解决图像中物体边缘像素的分割和小物体的分割准确性。创新奇智提出的AInnoSeg算法却能有效地解决这些问题。AInnoSeg算法首先使用基于Nonlocal network修改的pixel and channel attention网络结构来嫁接在HRnet上面,这样能够精确地对图像中每个像素进行分割;然后连接一个OCRnet网络结构对图像中每个物体和属于这个物体的像素进行联系,从而能够让算法更加关注物体自身的像素和边缘像素;然后使用数据增强的方式,让算法更加关注图像中小物体的分割。同时使用多个辅助损失函数来完成训练。

 

image.png

HRNet网络

其次,AInnoSeg提供了半监督的训练模型流程,可以在数据集比较少的情况下,提升算法模型的表现力。

image.png

半监督流程训练图

AInnoSeg算法实现细节论文:https://arxiv.org/pdf/2007.10591.pdf


我们来看看AInnoSeg算法在ADE20K数据集上面的表现。

image.png

image.pngAInnoSeg算法相比较于目前最优的分割算法,能够有效地分割物体边缘和实现小物体的分割。



全景分割的落地应用


图像分割是计算机视觉领域的重要任务,有着众多的应用场景。本次大赛创新奇智夺冠的AInnoSeg全景分割算法已经应用到创新奇智ManuVision工业视觉平台MatrixVision视频智能平台,用于工业制造过程的产品质量管控,以及生产园区的车辆检测、行为分析等各类复杂现实场景。
创新奇智不仅拥有业界领先的计算机视觉技术 — 连续刷新人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC、实例分割竞赛Cityscapes、多目标跟踪竞赛MOT Challenge等多个世界顶级计算机视觉大赛的全球排行榜,以2%的概率入选计算机视觉顶会ECCV 2020 Oral论文;还注重将技术商业化落地,在IDC中国人工智能市场报告中,跻身中国人工智能市场计算机视觉应用主流供应商,市场份额位居第6,是2018-2019 YoY增速最快企业


image.png




参赛队伍


创新奇智本次MIT Scene Parsing Benchmark场景解析挑战赛夺冠队伍由CTO张发恩领衔,吴佳洪、路建飞、康欣昕、范馨予、汤寅航、宋剑飞、黄泽、贲圣兰和黄家水等技术骨干组成。
创新奇智CTO张发恩表示:“创新奇智重创新,更重实践,研发能解决实际问题的AI算法,推动人工智能与实体产业的融合发展。未来,创新奇智将探索包括图像分割在内的计算机视觉技术在更多细分场景的应用落地,助力产业智能化。”


 


返回动态列表