清华大学跨领域集成电机与生科团队,研发出教无人机、机器人及自动驾驶汽车像昆虫一样“看”的仿生物视觉技术,打造仿视神经AI智能芯片,未来只要一枚低功耗的芯片搭配镜头,就能在高速行进间识别、关注,并避开障碍物,可应用在自动搜救与勘灾、无人巡检、智能监控、智能医疗及智能农业领域。
仿生视觉团队的研究成果除发布在多项国际顶尖期刊,如《自然电子学》(Nature Electronics)、IEEE固态电路期刊(JSSC),并获得科技部2021未来科技奖的肯定。
主持这项大型研究计划的清华电机系教授郑桂忠表示,目前的“计算机动态视觉”就像拍电影一样,是由一张张连续拍摄的静态图片组成,计算机必须完整存储所有数字图片,再计算每帧图片与前一帧的差异,不仅速度慢、耗电且很占用内存,应用在无人机上则因太重,飞不快又飞不远。
为取得突破,清华电机团队邀请生科院教授罗中泉合作。罗中泉研究昆虫的视觉与空间感知,从小小的果蝇、蜜蜂得到启发,推演出“光流法”,也就是从光的流动来判断周边物体的远近及移动速度,只截取所见景物的轮廓及几何特征,来辨认障碍物及移动中的物体。
罗中泉解释,这就像我们走在路上,不需太费力看清楚并记忆眼前所有建筑物、招牌、人物特征、车牌号码,只用少许的注意力来看是否有车形或人形物体快速靠近就,新的技术可以让镜头专注于画面中的“变化”,如有人招手、球飞过来,只抓取必要资料,就能加快图片处理速度、减少耗电。
左起为清华跨领域仿生视觉团队教授吕仁硕、谢志成、罗中泉、郑桂忠。 (Source:清华大学)
郑桂忠让计算机算法向生物大脑神经网络学习,正是所谓的“剪枝”及“稀疏化”,把不重要的部分运算权重调为零,进行忽视,零越多,算得愈快,耗电也越少,并取得重大突破,可在内存内直接进行计算,不必在内存与CPU之间来回搬运资料计算、存储,可节省9成的功耗与时间。
团队中的电机系教授谢志成负责开发传感器内运算,如应用于智能监视或门禁系统,只需要简单的镜头就可以判断画面上是否有人出现,还是不相干的狗或猫,一旦镜头判断有人,再会将人脸资料传到计算机的识别系统比对来者是谁,由于不需要细部分析每帧画面所有信息,只需几微瓦的电力就够了,约等于一只灯泡百万分之一的用电量。
电机系副教授吕仁硕是集成软硬件的仿神经智能芯片架构设计师,携手团队与台湾IC设计领导厂商及台积电合作,开发新时代AI芯片,目前正开发无人机的关键主芯片,创建仿生无人机的必要自主技术。
这个由生科与电机教授跨领域组成的团队成军4年,已取得许多重要突破,但回想组团之初,花许多时间磨合,生科“担当”罗中泉每每讲到果蝇的某种功能多聪明,电机教授都要问一句“这个运算要多少bit(计算机位元)?”令罗中泉哭笑不得,直言“对生物来说很自然简单的事,为何变成电机工程就这么难?”
罗中泉的浪漫逐渐感染原来一心只想“这个要怎么做出来?”的电机系教授,团队计划未来运用新技术,制作出体积比无人机还小的“搜救小蜜蜂”,可当地震等灾害发生时,穿越瓦砾与险境及时救人,并运用新时代无人机体积小的特性,开发可匿踪的无人机。