加入收藏 | 设为首页 | 会员中心 | 我要投稿 滨州站长网 (https://www.0543zz.cn/)- CDN、边缘计算、物联网、云计算、运营!
当前位置: 首页 > 大数据 > 正文

Facebook阐述可对图像和视频进行细分的自我监督学习AI

发布时间:2021-10-18 15:41:42 所属栏目:大数据 来源:互联网
导读:传统上的细分(Segmentation)操作是在监督学习的情况下执行的,且需要投喂标注了大量注释的示例数据。 在有监督的学习中,算法会在为特定输出注释的输入数据上开展训练,直到它们可以检测到输入和输出结果之间的潜在关系为止。 但在可自我监督学习(DINO)
传统上的细分(Segmentation)操作是在监督学习的情况下执行的,且需要投喂标注了大量注释的示例数据。
 
在有监督的学习中,算法会在为特定输出注释的输入数据上开展训练,直到它们可以检测到输入和输出结果之间的潜在关系为止。
 
但在可自我监督学习(DINO)的方案下,系统能够主动对未标记的数据进行分类和处理。
 
Transformers 使得 AI 模型能够选择性地专注于其输入的一部分,从而使它们能够更有效地进行推理。
 
而在应用于语音和自然语言处理之前,转换器就已经被用于解决计算机视觉问题、以及图像的分类和检测。
 
自我专注层(Self-Attention Layers)是所谓的 Vision Transformers 的核心部分,每个空间位置都通过参考其他位置来表示。
 
这样当查看其它距离可能较远的图像时,转换器就能对整个场景建立起丰富而高级的理解。
 
Facebook介绍可对图像和视频进行细分的自我监督学习AI
 
通过在相同图像的不同视图上匹配模型输出,DINO 能够有效地发现目标对象和跨图像的共享特征。此外 DINO 可基于视觉属性来连接各种类型,以类似于生物分类的结构,来清楚地分辨不同动物物种。
 
Facebook 声称,即使不以此为目的而进行设计,DINO 也是识别图像副本的最佳工具之一。展望将来,基于 DINO 的模型,还可用于识别错误信息或版权侵犯行为。
 
Facebook 在博客中写道:通过在转换器上进行自我监督学习,DINO 为打造创造性的机器学习应用而提供了一个机遇,使得机器能够更深入地理解图像和视频。
 
目前需要人工标注的数据,已经成为了计算机视觉系统发展的一个主要瓶颈。但通过 DINO 方案,注释的效率可以更高,并将模型用于更大的任务集,且有可能扩展其可识别的概念的数量。
 
最后,Facebook 今天还详细介绍了一种被称作 PAWS 的新机器学习方案。与此前的半监督方案和新技术相比,该公司的半监督方法具有更好的分类准确度。
 
值得一提的是,其所需的训练也少了一个数量级( 1/ 4~12),意味着 PAWS 可能也适合于没有太多标记的图像领域(比如医学分析)。

(编辑:滨州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读