长期以来,人们误以为传统的视频摄像头就可以作为智能系统的“眼睛”。早在人工智能第一个黄金期的1967年,正在筹建人工智能实验室的美国麻省理工学院教授佩帕特曾表示:“计算机联上摄像头描绘它看到什么,这个问题一个暑期项目就能搞定”。时至今日,人工智能再次迎来黄金发展期,人脸识别突飞猛进,自动驾驶呼之欲出,计算机视觉这个问题似乎就要迎刃而解了。但是,在北京大学计算机科学技术系主任黄铁军教授看来,传统视频摄像头根本配不上新一代人工智能,他牵头研制的视网膜芯片才是真正解决这个问题的第一步。
视频的概念尽人皆知,但很少人能像黄铁军一样“面壁十年”式地思考这个问题。黄铁军自上个世纪九十年代研究文字识别和计算机视觉,2002年开始担任数字音视频编解码技术(AVS)标准工作组秘书长,视频编码和图像识别这两个概念已经在他脑子里碰撞了二十多年,最终让两者合二为一、“破壁而出”的是类脑计算。
视频就是静止图像组成的序列。利用人类视觉系统存在的视觉暂留现象,电影电视每秒播放数十幅静止图像,就能让人类产生连续的视觉感受。“电影电视就是这样蒙骗人类的”,黄铁军说:“但这并不意味就该这样继续蒙骗机器。人类眼睛把环境光线变化以神经脉冲序列形式持续不断地告诉大脑,而不是把一幅一幅的静止图像送给大脑。如果平博·(pinnacle)体育平台官方网站期望机器像人一样感知真实世界,为什么却要愚蠢地以放电影的方式给它输入一幅一幅静止的图像呢?”。
模仿生物视觉,就需要和神经科学开展交叉研究。2015年北京市科学技术委员会启动“脑科学与类脑计算”专项,黄铁军联合基础医学部视觉损伤与修复教育部重点实验室的濮鸣亮教授、生物医学中心的唐世明研究员和定量生物学中心的陶乐天研究员,获得《大脑初级视觉系统解析仿真平台研究与应用验证》重大课题的支持,开展灵长类视网膜和初级视皮层解析仿真研究,实现了灵长类视网膜中央凹神经细胞和神经环路的精细建模,提出了模拟视网膜机理的脉冲编码模型。2017年,在滚动课题《脉冲阵列式仿视网膜芯片研制及验证》支持下,经过一年多的紧张攻关,仿视网膜芯片一次流片成功。
仿视网膜芯片对传统视频芯片的主要颠覆在于“超速”和“全时”。眼睛是亿万年进化而成的精密器官,信息处理机制优越,但是受限于生理限制,视网膜发放神经脉冲的频率不可能超过一百赫兹。仿视网膜芯片采用光电技术,发放频率达到了4万赫兹,“超速”人眼百倍,能够“看清”高速旋转叶片的文字。“全时”是个新概念,是指从芯片采集的神经脉冲序列中重构出任意时刻的画面,这是实现真正机器视觉的基础。相比之下,传统摄像头每秒采集数十幅画面,两幅画面之间的视觉信息实际上丢失了,采用传统摄像头的自动驾驶系统高速运行时,就必然存在时域盲区。因此,无人驾驶、机器人、视频监控等需要实时视觉的智能系统,都需要配备这种新型芯片。
在我国去年发布的新一代人工智能规划中,“智能芯片和系统”部分明确规划了新型感知芯片。超速全时仿视网膜芯片的研制成功,开创了新一代人工智能创新突破的新时代。作为新一代人工智能产业技术创新战略联盟的秘书长,黄铁军表示,仿视网膜超速全时芯片仅仅是开始,好戏还在后头。“到2030年,人工智能理论、技术和应用总体达到世界领先水平,这个目标一定要实现,也一定能够实现”。
来源:中国经济网