高科技与产业化

首页专题院士观点前沿产学研科技金融区域案例

训练10亿张图片，Facebook新AI模型可能给计算机视觉带来革命

作者：发表时间：2021年07月22日

　　近日Facebook的研究人员推出了一种新的AI模型，该模型可以从网上任何未标记图像的中学习，尽管该团队的研究仍处于早期阶段，但他们希望给计算机视觉领域带来一次“革命”。

　　该模型被称为SEER（SElf-SupERvised），被馈入了10亿张公开可用的Instagram图像，这些图像未经过手动标记。但是，即使没有通常在AI算法训练中使用的标签和注释，SEER仍能够自主地训练数据集，不断进行学习，并最终在诸如对象检测之类的任务上达到最高的准确性。这种被称为自监督学习（self-supervised learning）的方法在AI领域已经很成熟：它由可以直接从给定信息中学习的系统组成，而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

　　自监督式学习近来引起了很多关注，因为这意味着需要手工标记数据的工作要少很得，这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时，自监督模型可以处理更大，更多样化的数据集。

　　在某些领域，特别是自然语言处理中，该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。

　　相反，计算机视觉尚未完全进入自监督的学习革命。正如Facebook AI Research的软件工程师Priya Gopal解释的那样，SEER是该领域的首创。“与现有的在ImageNet数据集上训练的计算机视觉的自监督模型相比，SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。”

　　ImageNet是一个大规模数据库，包含研究人员标记的数百万张图片，并向较大的计算机视觉社区开放，以促进AI的发展。

　　该项目的数据库被Facebook的研究人员用作评估SEER性能的基准，他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。

　　借助Instagram的10亿张图片的数据集，该系统的规模很大。Facebook的团队使用了具有32GBRAM的V100NvidiaGPU，并且随着模型尺寸的增加，必须将模型放入可用的RAM中。但是Goyal解释说，进一步的研究将对确保计算功能适应新系统很有用。

　　在Facebook内部，SEER可用于各种计算机视觉任务，从自动生成图像描述到帮助识别违反政策的内容。在公司外部，该技术还可用于图像和元数据有限的领域，例如医学成像。（来源：雷锋网）

热点文章

首页投稿广告关于我们联系我们

地址：北京市海淀区中关村北四环西路33号邮编：100080

联系电话：（010）82626611-6618 传真：（010）82627674 联系邮箱：hitech@mail.las.ac.cn