以下文章来源于中国网信杂志 ,作者江小涓
编者按 近日,《中国网信》学习专栏刊发江小涓教授文章《分布式合作共享是数据要素市场化配置的重要方式》。文章指出:数据要素市场化配置既要考虑各种要素配置的共性,更要关注数据要素的特征。数据具有复用性和场景化特点并搭载诸多个体信息,短期内难以形成对所有主体和数据都适用的统一市场规则。分布式合作共享是数据要素市场化配置的重要方式,具备有效的激励和约束机制,能够形成适应不同场景的局部市场,推动数据共享和快速释放价值。政府需要明确规定“必须为”正面清单和“不得为”负面清单,发出导向信号引导市场化配置更加合理与均衡。 我们特将文章分享如下,以飨读者。
摘要:数据要素市场化配置既要考虑各种要素配置的共性,更要关注数据要素的特征。数据具有复用性和场景化特点并搭载诸多个体信息,短期内难以形成对所有主体和数据都适用的统一市场规则。分布式合作共享是数据要素市场化配置的重要方式,具备有效的激励和约束机制,能够形成适应不同场景的局部市场,推动数据共享和快速释放价值。政府需要明确规定“必须为”正面清单和“不得为”负面清单,发出导向信号引导市场化配置更加合理与均衡。
关键词:数据要素;市场化配置;数据分布式配置;数据场景化配置;数据空间
中图分类号:F49
党的十八届三中全会提出,要使市场在资源配置中起决定性作用和更好发挥政府作用。党的十九届四中全会首次提出,数据可作为生产要素按贡献决定报酬。有关部门多次明确提出数据要素市场化配置的要求。然而从市场化配置资源的传统方式看,大量数据未能在一体化市场化中进行配置,工作推进也遇到诸多问题。
数据要素有一些独特性质,在传统市场化配置方式之外,要求配置方式的创新。本文提出分布式合作共享的概念,探讨数据要素市场化配置方式的创新。
传统市场化配置:有效性和受限性
市场化配置资源是指各种生产要素的配置是由各利益相关方自发决策的,最常见的是供需双方商定。市场化配置的前提是各方共同遵守一些规则,这些规则事关资源配置各方对彼方行为的预判。对即时交易例如某项数据产品而言,需要有规则来防止和处置各种不履约和欺诈行为;对长期投资例如某项数据资产而言,需要有规则来保护远期合同和跨期交易;对创新例如以新算法处理和使用数据而言,需要有规则来分散风险和为成功者提供高回报。如果各方行为没有规则约束,各种避险行为会降低资源的市场化配置,从而降低全社会资源的配置效率。“共同遵守的规则”可以内生于市场即自发规则,也可以外生于公权力即制度规则。
在市场经济中,一般具备三个原则就能进行市场化交易:可以讨价还价(市场确定价格)、各方自愿交易(企业自主决策)、能够履行合同(契约有效)。市场交易各方能遵守自愿、谈判和履约的规则,一个重要的约束力量就是市场声誉。市场声誉指通过社会成员产品与服务质量状况的披露、欺诈行为的揭露和惩罚结果的传递等信息而产生的社会评价及其影响,是其他人与之交易时要考虑的重要因素。对市场声誉的珍惜可以激励和约束市场主体行为,使之合乎市场规范和道德准则。过去多年,相当数量的数据要素和数据产品已经遵循这三个原则由市场配置,这一点与其他要素市场并无二致。
让市场配置数据资源,平台企业与平台上商户和消费者力量的极端不对称,有可能使分散的主体无法与平台进行有效谈判(商定条件和自愿交易),这是数智时代公权力需要关注的一个重要问题。不过从实践看,竞争与博弈对各方包括平台方形成的约束依然有效,一个重要方面就是市场声誉的影响更加突出。网络时代,信息传递广泛且成本低,用户反馈和公众舆论影响更大,用户更是存在十分便利的另选项,即“一键换平台”,市场各方博弈在很大程度上依然能够平衡各方利益和诉求,因此企业有及时回应各方关切的强烈意愿。
国内外都有明确的个人和商业数据保护相关法律和数据安全及伦理方面的法律法规,约束了数据市场化配置方式和配置规模。例如,许多数据生产企业并不以外部交易的方式而是以数据服务内部化的方式配置数据。再如,产业互联网头部企业通过数据交互支持产业链从供应链到客户端各个环节的业务衔接和融通,提高产业全链运行效率。然而,因为数据中有太多的商业秘密和专有知识,链主企业通常不愿意将这些数据与其他同行进行交易或交互。这是典型的要素控制型内部化行为,即为了控制关键要素、核心知识和Know-How(专有技术)而将相关市场主体组织在一个企业内部的行为,这并不是一个新现象,产业组织理论研究的纵向一体化很大程度上就是针对这类行为。只不过在当下,平台规模之大和数据之关键,使这种现象更加突显和受到关注。
分布式合作共享:数据要素市场化配置的重要方式
数据较其他生产要素如土地、资金、人力资本等有一些独特性质,主要体现在以下几个方面。一是多主体生产导致确权困难,数据的生成过程错综复杂,常常是多方主体相互协作的结果,难以确权。二是复用方便,一组数据可以被不同主体以不同方式重复利用,在使用上不具有竞争性和排他性,不易清晰主张权利。三是数据中的敏感信息多,可能承载了需要保护的个人信息和商业机密,即使匿名化和去标识化,也可能被挖掘出来。四是具有交易和交互两种类型的流通方式,交易型既有通过数据交易所完成的场内交易,也有企业之间直接发生的场外交易,交互型即数据在不同主体间的非交易型流通使用,打通各方业务联系。五是应用场景化,资金、土地、能源等要素具有普适性,数据要素的价值依据具体应用场景而定,同样一组数据,在相关场景中具有高价值,在无关场景中就无价值。
数据要素的这种特殊性、复杂性,只有具体当事者才能在数据内容、合规方式、交易方式和损益计算等方面做出恰当判断,不同数据的分发、共享和复用有不同的合规要求。因此,很难设想能形成普适化、一体化的市场交易原则和使用方式,使各种场景中的各类主体都能同意。这就提示我们在通用的市场配置方式之外,需要创新更多市场配置数据的方式。
国内外大量实践表明,只要特定场景相关的部分主体同意,数据资源和数据产品的市场化配置就能进行。例如,个人隐私保护被认为是需要政府强干预的问题,然而在数智时代,个人福利的一个重要来源就是出让个人数据交换相关服务。因为个性化精准服务需要数据支撑,数据让渡越多,获得的服务就可能越精准,关键是相关各方“同意”彼此权益的交换。政府要关注是否未经同意就使用个人数据并带来个人伤害或社会危害的情形。再如,虽然许多企业不愿意将其特有数据提供给其他企业,但却有可能同意与其他企业共享彼此数据。总之,只要各相关方有共识、能选择和行为可核查,就能产生资源有效配置。
本文使用数据要素分布式配置这个概念来解释创新配置的特质。分布式(Distributed Computing/Systems)是计算机科学的重要概念,指将计算任务、数据存储或业务功能分散到多台独立计算机(节点)上协同完成的系统架构。较常使用的有分布式能源体系(Distributed Energy System),与传统集中式能源系统(如大型火电厂)不同,它通过多节点、小规模、模块化的方式实现能源就近生产和梯级利用。还有分布式公共治理(Distributed Public Governance),其核心在于通过分散决策权,让公民、企业、社区组织等多元主体共同参与公共事务。分布式本质是构建分散的决策与运行模式,利用技术工具如区块链、大数据、人工智能等替代传统中心化机构的信用背书,从对数据要素特点的分析以及分布式配置概念的描述,可以看出数据要素适用于分布式市场化配置。
数据要素分布式配置可以简单定义为以互利及合规共识为基础,以技术手段为互信保障,形成局部市场适用的数据要素配置机制。总结国内外实践,主要有以下几种数据要素分布式配置类型。
一是多方契约明确规则的数据交互与共享。数智时代的商业模式大都涉及个人信息的多方交互,例如电商和外卖的下单、递送和收货收款,旅行全链服务等都需要多家企业分享和共享消费者数据。数据链上的各方包括顾客、商家、平台、骑手和第三方服务商,都需要遵守各方认同的契约或者合同,包括定义数据交换的条款、条件和政策,以及监控和确保遵守商定的合同义务。例如,我国医疗数据资源非常丰富,多源数据打通共享固然好,数据规模大、模态丰富就能支持更多创新。但是医疗数据含有患者隐私,共享与合规矛盾突出。我国许多医院规模很大,院内特色专病库中积累的病例数据量可以训练一个基础垂线智能医生模型。由于担心数据出院会带来不可控的患者隐私泄露风险,许多医院采取与科技公司及医药公司签约合作的方式,在医院内使用这些数据训练模型进行科研项目开发和学术研究。这种分布式数据使用虽然不是最优,但有效易行。医疗数据还有更开放的分布式配置方式。国外有一类平台叫病友网(Patients Like Me),一些罕见病的患者愿意把个人信息特别是疾病数据全息式投放进去,因为“命比数重要”,希望医药研发机构尽快研发出针对性的治疗办法,医药公司、药品研发团队、医疗机构和病患都在这个平台上。这就是利益相关者以共识达成的契约式数据交互和共享,有规则、有协议、有技术保障,遵从者入列,违规者出局。
二是技术规则形成的数据共享机制。网络空间是特定技术架构的产物,例如一套特定的程序、一种特定的算法等,它们构成了一个由特定技术规则形成的局部市场运行规则。如许多发行平台使用数字版权管理(DRM)系统和技术保护措施(TPM),只有授权客户才能访问和复制等。再如许多P2P文档在代码中嵌入共享规则,用户只有共享文件才能下载更多内容。从技术发展趋势看,还会有更多的新技术可以用来重构治理架构。区块链提供了一种安全、透明且去中心化的数据记录和交易方式;智能合约则是基于区块链的自动化执行合约条款的计算机程序,可以支撑多种形态和用途的去中心化管理、由其成员共同拥有和治理的组织形式。
三是合规协议团结和凝聚的技术社团。2023年,亚马逊、美国人工智能股份有限公司Anthropic、谷歌、美国人工智能公司Inflection、美国互联网公司Meta、微软、美国开放人工智能研究中心(OpenAI)等七家企业签订生成内容水印协议,承诺为AI生成的文本、图像、音频添加水印,确保用户可识别来源;同时承诺测试系统安全性、允许第三方审计、保护隐私与反歧视。2025年7月16日,在中国人工智能产业发展联盟第十五次全会上,阿里巴巴、百度、火山引擎等企业代表共同发布《人工智能安全承诺》实践披露成果,推动签约企业及更多企业遵守联盟共同规则。很多国际技术组织也具有这个性质,如电气电子工程师学会(IEEE)。
四是共享规则构建的数据空间。前面提到的三种方式本质上都是由共识和规则形成的多方数据共享机制,还有一种技术定义更严格的数据共享形态,即数据空间。数据空间指各方愿意共同遵守和使用的一套技术、法律、程序和组织相关的组件与服务,使得在一个或多个数据空间中进行数据交易、交互和共享成为可能的机制设计。数据空间的基本特征是,基于各方认可的规则,联接多方身份和资质确认后的主体,通过定义开放标准和治理框架,解决专有、不透明、不可互操作等技术限制,建立安全透明的数据共享生态系统,推动跨组织数据交换与共享。数据空间有多种类型,一是由政府倡导并与企业合作组建的数据空间。例如Gaia-X是一个由欧洲多个国家和公司共同发起的数字基础设施项目,旨在为欧洲创建一个联合数据基础设施,促进数据交换与共享。二是由行业组织牵头的数据空间。例如Catena-X是为促进汽车价值链(Value chain)整体的数据协作设立的数据空间,旨在为不同汽车厂商之间沟通数据制定标准提供统一的数据共享平台,提高效率、透明度和可持续性。目前Catena-X已有成员122家,目标用户1000个。三是私营企业或民间组织搭建的数据空间。例如Dawex是一家私营的数据交换平台,数据供应企业和数据需求企业可以通过这一平台进行数据交易,旨在为全球范围内的组织和企业提供数据交易和数据货币化的服务。国内也有许多尝试,2023年5月,长虹与中国信息通信研究院、深圳数据交易所、华为、数鑫等单位共同发起成立可信数据空间创新实验室,旨在实现数据在可信、可控、可追溯环境中的规模化流通利用,打造制造订单数据与客户安全共享交换的典型应用场景。各种产业互联网和以共享数据为目标的数据联盟等本质上也是数据空间,认为这些规则合意的主体就会共享与合作。
五是安全与伦理评测共识形成治理联盟。AI快速迭代发展,各方对其数据合规使用和输出内容的真实性高度关注。然而由于AI领域日益加剧的技术复杂度和动态不确定性,政府又难以及时明确评测AI合规与对齐的普遍标准,因而无法出面对各类模型进行真实评测。目前回应社会关切并采取行动的是若干AI伦理与安全评测共同体。第一类是国际技术组织牵头联合多个企业推进,例如世界数字科学院(WDTA)发布的人工智能安全、可信和负责任(AI STR)系列,其中由蚂蚁集团、清华大学、中国电信等联合谷歌、微软、OpenAI等20余家国内外机构、企业及高校共同制定的《AI智能体运行安全测试标准》,融合跨国企业诉求,将伦理要求拆解为可量化的测试项,推动行业从单点治理向生态共建演进。共识度高的评测模型具有内在商业驱动力:头部企业通过认证体系降低合规成本,如蚂蚁集团借助世界数字科学院标准通过欧盟《数据治理法案》(DGA)审计,引导产业链跟进。第二类是有影响力的科技机构牵头制定,例如上海人工智能实验室主导的创新开放评测体系司南(Open Compass),支持多语言(中英文)与多模态任务的综合评测框架,覆盖50+数据集,提供开源可复现的评估流程,支持自定义评测模块。Open Compass被阿里巴巴、百度、腾讯、华为等企业用于模型迭代优化,其开源性推动全球超过200家机构采用,评测结果在一定程度上成为行业通用基准。第三类是企业主导牵头制定,例如阿里云主导的PAI大模型评测平台,蚂蚁集团、网易、平安科技等企业接入其评测接口,用于内部模型合规审查,平台提供的一键部署和调参工具降低企业落地门槛。
上述以及更多形态市场主体间合作的分布式配置和分布式治理,不仅是目前数据要素市场化配置方式的重要形态,也将是今后很长时期的重要形态甚至主流形态。技术演进导致数据生产和使用方式加速变化,多方损益边界、场景适用边界和数据合规边界等总是处于变化与探索之中,难以形成对所有主体和数据都适用的统一规则。分布式配置资源共享数据范围和共识主体规模可大可小,在不同场景下有不同形态,数据交易交互和共享更易推进。
政府引导与规制:鼓励创新与维护底线
保障数据要素市场正常有效运转,政府的鼓励引导和规制必不可少。一方面,市场配置资源的行为经常会受到各种干扰使其不能有效运转,另一方面,有些重要问题如虚假信息对社会团结稳定的干扰等都需要政府加以规制。由此产生了对公权力的诉求,由政府发出导向信号引导市场化配置资源更加合理与合意。
首先,明确规定“必须为”正面清单和“不得为”负面清单。“必须为”正面清单主要包括允许第三方在特定情况下与平台提供的服务进行交互操作;允许用户访问在平台上业务运营产生的数据;特别是一些居于数据垄断甚至独占地位的企业,如果独占客户数据就会造成进入和竞争方面的不公平。2024年10月22日,美国消费者金融保护局(CFPB)发布一项指令,要求金融机构在消费者要求下解锁个人财务数据并将其免费转移给另一家提供商,由此解决因大企业数据垄断造成的金融市场集中度过高的问题。各国规定“不得为”负面清单主要包括不得未经同意侵犯用户隐私;不得优待平台自身或关联企业提供的服务和产品;不得发布虚假信息、恐怖主义、仇恨言论等非法内容。2023年7月10日,我国发布《生成式人工智能服务管理暂行办法》,规定包括不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益等内容;不得存在民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;不得实施垄断和不正当竞争行为等。
其次,政府发出的导向指引也非常重要。虽然严格意义上的行政和法律监管往往具有滞后性,但政府以及立法机构对数智技术头部企业行为的持续关注,对严重违规违法案件及时有效的罚处,对一些积极努力的赞许,对一些损害公共利益的行为进行批评指责、发起相关监管政策和法律制定修改的公共讨论以及发布建议、指南、行为准则、最佳实践、专业标准等软规则,对创新方向、技术应用、投资选项以及社会公众心理、社会舆情等都有显著的导向作用。中国传统社会中的许多民间传统道德良俗并非单纯依靠言传身教来推行,实际上也需要官方和社会的认可。国外实践也表明,有效的分布式自主治理需要政府和外部组织承认社区自定规则的权利,复杂问题也需要社区、区域和国家的协同。
数据是具有复用性、场景化和搭载诸多个体信息的要素,寻求普遍适用的配置和治理框架与其特点存在一定冲突,需要解放思想,创新配置方式。分布式合作共享是一种泛在的新型配置方式,是有共识者的协调行动。此时数据并没有形成全面的汇聚、流通和共享,而是分布在一个个大小不一、功能不同的共同体中,形成适应不同场景的局部市场。这个局部市场恰好处于共同体各方利益的平衡点上,激励和约束机制有效,数据能够快速释放价值,并在各方博弈和技术进步中向着更多共识和更多收益的方向演进。政府要在市场失灵的领域发挥重要作用,守底线指方向,提供促进数据要素市场化配置的基础设施和基础制度等公共品,引导市场演进方向更合理更均衡。
(作者:中国社会科学院大学教授 江小涓)
参考文献:
[1]江小涓.数智时代的秩序重构与治理合作:合理合意双重目标[J].管理世界,2025,41(5):1-14+58+241.
[2]陈郁.企业制度与市场组织:交易费用经济学文选[M].上海:上海人民出版社,三联书店,1996.
[3]朱明婷,徐崇利.人工智能伦理的国际软法之治:现状、挑战与对策[J].中国科学院院刊,2023,38(7):1037-1049.
[4]时延安.软秩序与强秩序 —对中国传统社会中礼刑关系的重新认识[J].朝阳法律评论,2010,(2):87-97.
[5]埃莉诺·奥斯特罗姆.公共事务的治理之道:集体行动制度的演进[M].余逊达,陈旭东,译.上海:上海译文出版社,2012.