2018年7月28-29日,由主办的第六期智能自动化学科前沿讲习班在湖北·武汉华中科技大学成功召开,此次讲习班由华中科技大学自动化学院院长曾志刚教授和清华大学胡晓林副教授共同担任学术主任。
第六期讲习班以“人工智能与智能控制”为主题,邀请了十余位领域相关的专家学者进行主题报告,来自全国各相关高校、科研院所及相关单位的百余位学员参加了此次讲习班,共话人工智能与智能控制的现状与前景。
讲习班伊始,学术主任曾志刚院长进行致辞。曾院长代表华中科技大学自动化学院对各位专家及学员的莅临表示热烈的欢迎。并指出,讲习班系列为专家学者提供了探讨热点方向和交流学术进展的平台,衷心希望各位学员能够通过此次讲习班碰撞出新的思想火花。
第一个进行报告的是中国科学院数学与系统科学研究院系统所所长张纪峰教授,张纪峰教授带来的报告题目为“时间非一致性与随机最优控制”。对经典的最优控制问题,相应于给定时间-状态初始对的最优控制,将沿着最优轨迹保持最优;即以最优轨迹上任何一点作为新的时间-状态初始对,原有最优控制在后续时间区间上的限制,将是相应于此新初始对的最优控制。这一性质称为最优控制的时间一致性,它可由Bellman最优性原理推得。最优控制的时间一致性虽然在经典最优控制理论中很少被提及,但事实上它是一个本质性的概念,现有的Bellman动态规划理论主要依赖于时间一致性这一性质。 然而,现实世界中存在大量动态优化问题,对它们而言,Bellman最优性原理不再成立,进而最优控制的时间一致性也将丢失,即所考虑问题是时间非一致的;如下几种情形经常被文献提及:(i) 指标泛函中的贴现函数是非指数的,(ii) 指标泛函中存在条件期望的非线性项,(iii) 指标泛函是初始状态显式依赖的。这些现象广泛存在于经济学和金融学领域,比如双曲贴现函数,准几何贴现函数,均值-方差效用函数等。张纪峰教授的报告详细介绍了时间非一致性,揭示了时间非一致性自Adam Smith以来的定性分析和概念萌芽,阐述其在金融学和经济学中的定量分析和成功运用,描述了系统控制领域的相关研究进展,强调了研究随机最优控制领域内时间非一致的必要性。
随后由清华大学类脑计算研究中心主任施路平教授带来了题为“类脑计算及类脑计算系统”的报告。类脑计算系统是借鉴人脑信息处理方式,打破“冯•诺依曼”架构束缚,适于实时处理非结构化信息、具有学习能力的超低功耗新型计算系统。当前欧盟、美国等均斥巨资长期支持此研究,但是这项研究目前均处于起步阶段,尚未形成公认技术方案。施路平教授的报告分别从为什么(why)?做什么(what)?和怎样做(how)?三方面来分析类脑计算系统研究,分析发展类脑计算的挑战和前景。
下午第一个为大家带来报告的是副理事长、澳门大学讲座教授陈俊龙,陈俊龙教授的报告题目为“智能控制算法”。智能控制是来解决传统控制方法难以解决的非线性、高度不确定性、信息不完全性、或者因人而产生复杂性等的具有复杂控制任务的问题。陈俊龙教授此次报告是讨论基于人工神经网络理论、模糊数学理论、计算智能理论、及模式识别理论等为基础而衍生出来的智能控制方法。课题包括:(1)神经网络控制;(2)模糊控制;(3)强化学习控制;(4)智能自适应控制;(5)基于遗传算法的智能控制;(6)混合智能的控制。
?
下午第二个报告为清华大学孙富春教授作题为“基于视触觉融合的目标识别与灵巧操作”的报告。为实现机器人柔和灵巧的操作能力,下一代机器人需装备多模态的分布式感知与融合模块,有望突破像人一样的跨模态信息感知、表征/融合和动作行为。孙富春教授的报告介绍了清华大学课题组研制的高分辨率四模态传感装置和装备有四模态人工皮肤/类肌肉驱动的五指灵巧手,该灵巧手的分布式传感装置包含了微视觉、压力觉/滑觉和温度觉传感器。报告同时给出了研究团队在跨模态的视触觉信息的处理方面取得理论成果,包括基于视触觉信息的目标识别以及感知-动作映射问题的深度学习和经验学习方法。报告的最后,孙富春教授为大家展示了实验结果分析和未来的研究展望。
28日最后为大家带来报告的是来自中国科学院自动化研究所的王亮研究员,王亮研究员的报告题目为“AI时代视觉大数据的智能分析”。报告首先简要介绍了人工智能的概念和现状,然后介绍其重要的一个分支领域-计算机视觉。视觉大数据分析是模式识别的前沿方向。近年来,深度学习已经在语音、视觉、自然语言处理等领域取得了很大成功,接下来重点回顾了深度学习历史及其在视觉大数据分析中的应用进展。针对深度神经网络在结构、功能、泛化性等存在的问题,进一步探索模拟认知过程中的注意、记忆等机制,研究深度认知神经网络理论和方法。报告的最后,王亮研究员对几个未来可能的研究方向进行了展望。
29日第一位进行报告的是清华大学微纳电子系副系主任吴华强教授,吴华强教授为大家带来的报告题目为“基于新型电子突触器件的类脑计算研究”。人工智能的研究和应用已经取得了突飞猛进的发展,但是运行人工智能深度神经网络算法的计算平台主要是超级计算机群(成百上千个CPU和GPU),不但需要巨大的硬件投入,而且占用的空间和消耗的能源也非常可观。受限于存储计算分离对芯片性能的限制,同时CMOS工艺微缩速度放缓,以及人工智能应用对计算存储需求的不断提升,当前的技术将面临诸多新的挑战。在这一背景下,新器件的出现变得至关重要,通过引入新原理的半导体器件,不但可以拓展芯片的功能,甚至可以颠覆传统电路理论,突破当前芯片面临的能效、速度瓶颈,大幅提升芯片性能。基于过渡族金属氧化的忆阻器件显示出了优越的存算一体的特性,能够规避存储和计算之间数据搬运的功耗并且能够实现大规模集成,进而实现高性能计算。展望未来,智能社会即将来临,吴华强教授也指出了面向未来的智能芯片,最底层的器件需要具备特性。
上午第二个为大家带来报告的是清华大学胡晓林副教授,胡晓林副教授为大家带来的报告题目为“神经网络的攻击与防御”。神经网络在各种任务上取得了巨大的成功,但是人们发现它很脆弱:对输入数据做一点微小的扰动,就会导致输出结果完全不同。这种特殊扰动后的输入数据称为对抗样本,而这种操作被称为对神经网络的攻击。有攻击就应该有防御。防御的意思是构造方法使得神经网络不被对抗样本欺骗。胡晓林副教授的报告介绍了这个领域的历史和最新进展,并对未来进行展望。
下午第一个为大家带来报告的是华中科技大学电子信息与通信学院副院长白翔教授,白翔教授为大家带来的报告题目为“任意形状的场景文本检测与识别”,报告指出随着深度学习技术的不断进步,场景文本检测与识别领域已经取得了显著的进展。然而,对于曲形或者任意形状排列的文本的检测与识别,仍然是一个极其有挑战性的问题。在本次报告中,白翔教授首先对近年来场景文本检测与识别主流技术进行了简要的回顾;接着,介绍了场景文本检测与识别(Photo OCR)领域的最新研究进展,具体内容包括面向任意形状文本的检测与识别方法,及端到端识别神经网络;报告的最后,白翔教授对此领域的未来研究趋势做出展望。
下午第二个报告为清华大学自动化系赵明国副教授作题为“利用机器人的自然动力学来实现高能效的移动”的报告。报告介绍了清华大学机器人控制实验室在这方面做的一些研究工作,即先利用被动步行原理实现高能效的双足运动,然后通过反馈控制进一步提高机器人的稳定性,报告的另外一部分也展示了如何通过车把转向控制实现无人驾驶自行车的高能量效率。在这些例子中,实验室采用了一种非常简单但非常规的控制方法,它们的共同特点是寻找并利用系统的自然动力学。
最后进行报告的是清华大学电子工程系汪玉副教授,汪玉副教授的报告题目为“基于FPGA的深度学习处理器”。深度学习的应用日益广泛。相比于传统的CPU/GPU平台,针对定制计算结构能够提供更高的计算能效。但是,基于FPGA的深度学习加速器面临开发周期长,性能受限等问题。汪玉副教授的报告通过总结已有工作,结合实际设计经验,总结针对深度学习加速器的设计思路,并介绍了基于FPGA的高能效、快速部署的深度学习处理器结构和部署流程[FPGA 2016+2017]。其中压缩和量化技术可以去除算法中的冗余操作,减少系统计算和存储的需求,同时量化还能够提升FPGA系统的峰值计算能力。由于CNN和DNN/RNN在计算和存储模式的本质差异,针对CNN、DNN/RNN分别设计了两种体系结构与相应的指令、编译系统。基于赛林思的平台,CNN和LSTM的平台均取得了比嵌入式和桌面GPU更好的能量效率(>60GOPS/W)。
学会秘书处 供稿