首 页     看守所新闻     看守前沿     网上会见     专项工作     科技强警    
当前位置: 主页 > 网上会见 >   来源:http://www.jhchem.com.cn/wangshanghuijian/
Google行使3亿张图片大幅度改造图像辨认算法
2017-09-11 17:00

Google和CMU的研究员行使3亿张图片,在图像辨认算法的几个指标上取得了长足改造,,而往常的实习一样平常只行使一百万张图片。

许多开拓者在实习物体检测算法时会行使包括一百万张图片的ImageNet数据集。这个数据集从2011年起就没有新图片插手了。然而,在该数据集上实习的神经收集中的参数数目一日千里,实习模子的GPU算力也在增进。卡内基梅隆大学(CMU)中Google的研究职员和科学家提出:假如增进实习数据量会怎样?

于是,Google成立了一个内部数据集,含有3亿张图片,标志为18291个种别。图片标注的来历包罗原始收集信号,网页之间的接洽,以及用户的反馈。由于不是由人标注的,以是含有20%的噪音。

结论是:增大数据量公然有益。固然图片标志含有噪音,算法的精确率照旧进步了3个百分点。很明明,数据量的增进降服了标志的噪音。研究职员发明算法的示意和数据量呈对数相关上升,如图所示。论文作者以为,现有的模子是基于一百万张图片成立的:假如对模子举办调解,精确率尚有上升空间。

研究职员在微软的COCO 工具检测基准测试长举办了测试,功效喜人:均匀正确率(AP)从34.3上升到37.4。Google和CMU在ICCV集会会议上宣布了算法和评测,并宣布了论文《从头审阅深度进修期间数据的非理性结果》,可在arxiv自由获取。

查察英文原文:Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images

Copyright © 2008-2015 上海市闵行区看守所网上会见系统 http://www.jhchem.com.cn 版权所有<