导读:2024年6月2日,由、北京市科学技术协会主办,北京自动化学会、中国人工智能教育联席会、动态学习与智能医学专业委员会(筹)、集成自动化技术专业委员会、联邦数据与联邦智能专业委员会、脑机接口与脑机系统专业委员会(筹)、新质生产力&智能产业工作委员会(筹)、综合智能交通专业委员会承办,中国颗粒学会、中信银行北京分行(京城大厦支行)、达州人工智能研究院协办的2024国家新质生产力与智能产业发展会议在北京友谊宾馆举办。本次会议以“追新逐质,智创未来”为主题,邀请了10位院士及百余位长江杰青、高校和科研院所的校长、院长等学术精英与会,500余名来自学术界和产业界的本领域专家、学者、学生等参会。
北京市大数据中心数据管理部贾晓丰部长受邀在“数据要素驱动新质生产力”平行会议上作题为“联邦智能——数据治理5.0范式”的报告。数据作为新型生产要素,其基础性、系统性和活跃性对传统治理体系提出了挑战,尤其面对数源巨量分散、数据异质敏感、关系隐性多变等的超大城市复杂系统,需要新的技术框架来解决数据与场景之间的感知、连接、控制、计算和保护问题。本报告从“什么定义了当前的治理体系”和“什么定义下一代的治理体系”视角,介绍数据治理的范式演进,阐述以联邦智能为核心的数据治理5.0框架。
数据作为新型生产要素,其基础性、系统性和活跃性对传统治理体系提出了挑战。尤其面对超大城市、经济社会等复杂系统,数源巨量分散、数据异质敏感、关系隐性交叉、场景复杂多变,需要新的治理框架来解决数据与场景之间的感知、连接、控制、计算和保护问题。从“什么定义了当前的治理体系”和“什么定义下一代的治理体系”角度,数据治理范式分为五个代际的演进。
||数据治理1.0范式:分散数据-分散管理
数据治理1.0范式面向微观尺度的系统级治理(单系统),核心是以数据读写为标志的“建岛”,治理主体以B端为主,治理对象以数据为主,数据来源为“单业务”,代表性技术是MIS。
||数据治理2.0范式:分散数据-统一调度
数据治理2.0范式面向微观尺度的部门级治理(多系统),核心是以数据交换为标志的“建桥”,治理主体以B端为主,治理对象以数据为主,数据来源为“多业务”,代表性技术是“目录+交换”。
||数据治理3.0范式:集中数据-集中管理
数据治理3.0范式面向介观尺度的领域级治理(多部门),核心是以数据汇聚为标志的“灭岛”,治理主体以B端为主,治理对象以数据为主,数据来源为“类场景”,代表性技术是“云+大数据”。
||数据治理4.0范式:分布数据-分布治理
数据治理4.0范式面向宏观尺度的城市级治理(多领域),核心是以数据链通为标志的“去孤存岛”,治理主体延伸为“B端+C端”,治理对象的重心从数据转变为关系,数据来源为“多场景”,代表性技术是“区块链+隐私保护”。
“管不过来”的现实问题和“建立秩序”的愿景使命——驱动了数据治理4.0范式,其核心思想是从数据自治到数据共治。技术理念:其一,触一发而动全身(从“分布式数据治理”到“数据分布式治理”);其二,没有统一就没有分布;其三,less control, more availability。应用理念:其一,把每个机构都变成一个“大组织”(每个入口都是唯一入口),解决横向问题;其二,把每个个体都变成一个“治理员”(每次服务都是一次治理),解决纵向问题;其三,把每个需方都变成一个“供给方”(每次使用都是一次反馈),解决闭环问题。
||数据治理5.0范式:复杂场景-智能治理
数据治理5.0范式面向跨尺度的多空间治理(物理空间-数字空间-社会空间),核心是以数据智治为标志的“联孤强岛”,治理主体延伸为“A端+B端+C端”,治理对象的重心从关系转变为语义,数据来源为从真实场景延伸到虚拟生成,代表性技术是“联邦+AGI”。
“无限责任”的现实问题和“无为而治”的愿景使命——驱动了数据治理5.0范式,其核心思想是从数据共治到数据智治。技术理念:其一,M2M→A2A(Scene in, Scene out);其二,数据的价值在于“岛”,联邦的目的在于“强岛”;其三,可进化。应用理念:其一,每个系统(供方)都由一组AI管理,解决“铁路警察”问题(物理空间→数字空间);其二,每个场景(需方)都由一组AI服务,解决“千人千面”问题(数字空间→物理空间);其三,每次响应(供需)都在AI之间对话,解决“鸡同鸭讲”问题(物理空间↔数字空间)。
||个体智能-群体智能-联邦智能
数据治理在1.0范式中完成了电子化,其后每一个代际的范式演变,本质上是从“孤岛林立”(1.0独立→2.0分散)、到 “分久必合”(2.0分散→3.0集中)、再到 “合久必分”(3.0集中→4.0分布)、最终 “分即是合”(4.0分布→5.0分权)的过程。治理范式中的智能体现也从个体智能向群体智能、再到联邦智能演变。
(本文根据作者所作报告速记整理而成)