在数字经济高速增长的背景下,特别是伴随着“数据二十条”政策的实施,人工智能的可信度和安全性以及数据应用方法已经成为了工业界和学术界的关注焦点。
为了研究如何在数据隐私保护等受限场景下优化人工智能技术的应用效果,并探寻可信人工智能在更广泛领域的实际应用,联合联邦数据与联邦智能专业委员会(筹)将以“联邦智能及应用”为主题,于2023年5月13日-5月14日在北京·中国科学院自动化研究所举办2023年度第1期『智能自动化学科前沿讲习班』。
此次讲习班由中国石油大学教授,山东省可信人工智能生态实验室主任张卫山老师和北京市大数据中心数据管理部负责人贾晓丰博士共同担任学术主任,邀请业界6位知名专家作主题报告,深入探讨可信人工智能技术的前沿进展,并分享其在工业领域的落地应用案例,旨在激发讲习班人员的思维,以便更好地应对未来人工智能发展的挑战。
主题:联邦智能及应用
时间:2023年5月13-14日
地点:中国科学院自动化研究所智能化大厦三层第二会议室
(北京市海淀区中关村东路95号智能化大厦)
*本期讲习班限报名40人,根据缴费先后顺序录取,报满为止;报名方式请看文末!
日程概览
5月13日上午
报告题目:工业数据基础制度建设思考与实践
讲者:田野,中国工业互联网研究院副总工程师兼网络所所长
摘要:在数字经济高速增长的背景下,特别是伴随着“数据二十条”政策的实施,数据基础制度的建设已经成为工业界和学术界的关注焦点。如何建立完善的数据产权、流通交易、收益分配、安全治理制度,已引起社会各界专家学者的关注。“数据二十条”将数据分为公共数据、企业数据和个人数据。深度挖掘、分析、利用企业数据的价值,提高企业参与意愿,解决工业数据分散问题,对建设工业数据基础制度具有重要的意义。社会各界广泛开展工业数据基础制度建设探索,加强工业数据专区地方工作站与中国工业数据专区协同发展,为彼此发展相互赋能。
报告题目:压缩数据直接计算数据库技术应用
讲者:张峰,中国人民大学副教授
摘要:当今快速增长的数据量在空间使用和计算时间方面对现代数据管理和分析提出了紧迫的挑战。本研究聚焦压缩数据直接计算的方法与系统问题,希望从空间和时间维度解决这一系列问题。我们从三个方面开展研究并取得阶段性进展:(1)基于语法规则的压缩数据直接计算模型,主要思路是利用语法规则对数据进行描述,并将对数据的管理与分析操作转化为对语法的解释与修改;(2)新硬件压缩数据直接计算加速与优化技术,提出了面向GPU的并行压缩数据直接计算方法,针对大规模众核资源调度等问题,在保证核与核之间数据一致性的前提下,极大提升了数据处理效率;(3)针对不同大数据系统的压缩数据直接计算嵌入机制,将数据压缩方案集成到不同系统,包括机器学习负载等。本报告将对目前成果进行汇报,并对未来研究进行展望。
5月13日下午
报告题目:城市空间数据流通关键技术探究
讲者:屈克,华为2012实验室中央研究院技术领军
摘要:城市数据空间是一个基于城市地理范围的,主要由城市公共数据组成的数据空间。城市公共数据蕴藏着巨大的经济和社会价值,引领城市数据要素市场的发展,因此打通城市内公共数据可信流通对于城市发展乃至国家整体的数据要素市场而言,重要性是毋庸置疑的。本报告从数据分层治理、数据使用控制、数据隐私保护等关键技术入手,分析探究城市空间内数据可信流通的技术诉求和发展趋势。
报告题目:面向社会治安防控复杂场景的数据智能应用
讲者:毕严先,社会安全风险感知与防控大数据应用国家工程研究中心副主任,中国电子科学研究院公安事业部总经理
摘要:围绕社会治理与公共安全领域的复杂场景,基于多源异质数据构建数据模型与算法仓,解决公共安全基层一线的痛点,将从应用场景、数据分析、算法模型构建、工程方法实施路径等方面介绍相关实践成果。
5月14日上午
报告题目:面向数据孤岛问题的高效能高安全联邦学习系统研究
讲者:马汝辉,上海交通大学计算机系副研究员
摘要:随着人工智能大数据及物联网的发展,人们所能获取到的数据越来越丰富,但是这些数据由于隐私性考量,无法直接被共享出来,进而导致数据利用率较低,无法作用这些数据进行联合模型的训练。联邦学习通过在训练过程中只传输模型更新数据,进而防止数据的直接泄漏,并保障系统能够利用模型更新完成联合训练任务。然而,随着联合训练要求的提升,联邦学习中新的问题也不断浮现,包括联邦学习效率、联邦学习安全性及联邦学习适用性三大方面。
联邦学习效率方面,本团队以减少计算传输量及并行算法来提高训练效率。我们设计了层次化模型压缩算法,根据模型参数绝对值大小提取重点训练参数并压缩低影响参数的训练需求,同时采用重要度评估参数更新重要性,以此提取需要传输的模型更新,成果被IEEE TCDS接收。我们设计了自动并行算法,通过对并行场景建模后,利用启发式算法对并行方案进行优化,以此提高数据并行和流水线并行效率,减少模型训练及模型推理延迟,成果被IEEE JSAC及IEEE TOMM接收。
联邦学习安全方面,本团队针对客户端拜占庭攻击及不可信第三方服务器均进行了研究。我们设计了双端联合检测方案, 通过客户端训练前预警及服务器端接收预警后的判别,协同排除了拜占庭攻击对整体训练效果的影响,成果被ACM SoCC 2021和IEEE TDSC接收。同时,我们利用区块链系统,替代了传统联邦学习的服务器,以提供可信的聚合平台和追溯能力,同时针对性设计了半中心化联邦学习框架以更好的利用区块链系统带来的可信性,同时提高训练效率,成果被IET Software及计算机研究与发展期刊接收。
联邦学习适用性方面,本团队设计了适应性训练方案及个性化训练模式以应对训练场景中的统计异构性和系统异构性。我们设计了适应性掩码矩阵,以区分训练参数中的全局信息和个性化信息,保证训练过程中能够在全局聚合获取全局信息时,尽可能保证个性化信息的完整性,防止聚合带来的本地准确度下降,成果被AAAI 2023接收。我们设计了基于标签蒸馏的跨域联邦学习方案,通过聚合标签信息来代替模型参数聚合,在模型间交换全局信息的同时防止不同域模型聚合破坏本地模型准确度,成果被IEEE TCE接收。我们设计了基于自蒸馏的模型大小匹配算法,根据不同设备不同客户端的计算及传输能力,适应性的调整本地模型大小及本地训练量,以保障客户端可用性及整理训练效率,成果被IEEE Network及IEEE TOSN接收。
报告题目:联邦学习的挑战
讲者:吴方照,微软亚洲研究院高级研究员
摘要:联邦学习是一种面向隐私保护的机器学习框架,可以在不收集用户数据的情况下进行AI模型的协同训练,实现隐私数据的“可用不可见”。然而联邦学习在实际应用中存在诸多严峻挑战,如模型的本地训练和与服务器的频繁交互使得用户端的计算和通信开销十分巨大、本地数据和设备的异构性会影响模型性能、上传的模型更新存在隐私风险、训练的过程易受攻击等。本报告将分享我们在构建更加高效、准确和可信赖的联邦学习上的研究和思考,包括提高联邦学习的计算和通信效率、解决联邦学习数据和设备的异构性、增强联邦学习的隐私保护能力和安全性等。
报名及注册费
1、本期讲习班限报40人,根据缴费先后顺序录取,报满为止;
2、2023年05月12日(含)前注册并缴费:自动化学会会员1200元/人,非会员1500元/人(凡注册即可成为学会会员,并免一年会费),现场缴费:会员1500元/人,非会员2000元/人 (包含提前报名现场缴费、现场报名现场缴费);在校生参会可享受学生优惠价格800元/人;
3、同一单位3人及以上团体报名,按会员标准缴费;
4、点击链接或扫描二维码进行注册报名:
https://www.cacpaper.com/register/67/user/preRegist
联系人:屈老师/田老师
电话:010-82544541/17600403526
邮箱:caa@ia.ac.cn/yonglin.tian@ia.ac.cn