人民网>>科技

中国团队在世界视觉识别大赛中击败谷歌 刷新世界纪录

2015年06月08日10:18    来源:人民网-科技频道    手机看新闻

人民网北京6月8日电 (记者 申孟哲) 近日,在视觉识别领域一年一度的“奥赛”——ImageNet中,来自中国的DeepID-Net团队(http://mmlab.ie.cuhk.edu.hk/)成功击败Google、Facebook等国际科技巨头,再次刷新该领域的世界纪录。

屡胜世界巨头的中国团队

ImageNet,是关于计算机大规模视觉识别的一项挑战,对于计算机深度学习影响深远。该竞赛的任务之一,就是对1000类、120万张互联网图像进行准确分类。

图一:ImageNet 视觉挑战中飞机、汽车、人3个类别的样图

在ImageNet视觉挑战中,物体检测是最难的任务。它要求从四万张图像中准确检测到200类物体的具体位置,并且一幅图像往往包含多个不同类别的物体。同时,这200类物体在颜色、纹理、形状、长宽比、形变等方面差异巨大;即便属于同一类别,光线、角度、遮挡、部件变形等因素也使得物体间存在显著的差异。

条件的严苛,就要求计算机通过深度学习得到的特征表达具有强大的视觉描述能力,能够区分众多的物体类别和复杂背景,同时对类内变化具有鲁棒性。

2013年,这项挑战中的最高的检测率也只有22.6%。2014年,谷歌组织了包括2013年冠军成员在内的强大团队,以43.9%的成绩赢得冠军。

但是,仅仅几个月之后,这一纪录便被来自中国的DeepID-Net团队(http://mmlab.ie.cuhk.edu.hk/index_cn.html)刷新——他们的最新检测率已经达到了50.3%。

这已经不是DeepID-Net团队首次在该项挑战中崭露头角。2014年,首次参加比赛的他们,就以40.7%的成绩位居第二;而在此前的LFW人脸识别挑战中,他们也有过战胜Facebook的经历,在全世界首次实现人脸识别算法超越人眼识别准确率的突破。

学术界团队如何击败工业领袖

图二:汤晓鸥(前排左五)、王晓刚(前排右三)教授带领的DeepID和DeepID-Net团队


计算机的前沿领域,由于数据和资源等方面的限制,一向是工业界剧透争夺的天下,如微软、谷歌、facebook、百度等。但这次击败巨头的,却恰恰是一支学术界精英团队,由香港中文大学的欧阳万里、王晓刚、汤晓鸥教授等人带队。

一般来说,ImageNet中很关键的一点,是运算数据所需要的超大计算量和漫长的测试周期。按照原有流程,基于单卡NVIDIA Tesla K40 GPU,在ImageNet完成一次完整的训练和测试大概需要三周;但对于互联网巨头们来说,基于大规模的CPU/GPU集群,会使这个周期大大缩短——前提是拥有强大的计算资源支撑。

为了和工业巨头比拼,学术科研小组走了另外一条路径。比如DeepID-Net团队,就创新了物体检测的整个流程和模型本身,通过新的形变层、提出新的特征预训练策略、缩短训练和测试周期等方式,不仅大大加快了研发速度,更提高了物体检测的准确率。

战胜谷歌、Facebook等只是一个开始。DeepID-Net的成功,证明了深度学习不仅仅是数据和计算资源的堆砌,其在理论和算法上都有着巨大的发展空间,而这恰恰是众多学术精英团队的优势所在。

IEEE模式分析与机器智能汇刊(PAMI)的前主编Rama Chellappa引用《圣经》故事形象,评价DeepID-Net团队的工说:“你们与谷歌的竞赛令我感到着迷。你们是牧羊人大卫,谷歌是巨人歌利亚。 大卫和歌利亚都有各自的优势。我们也希望这样的竞争持续进行下去,众多来自学术界和工业界的团队通过各自的努力,从不同的方面推动深度学习和计算机视觉技术的进步,不断将人工智能推上新的高峰。”

(责编:魏艳、马丽)


注册/登录
发言请遵守新闻跟帖服务协议   

使用其他账号登录: 新浪微博帐号登录 QQ帐号登录 人人帐号登录 百度帐号登录 豆瓣帐号登录 天涯帐号登录 淘宝帐号登录 MSN帐号登录 同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖