茉莉花新闻网

中華青年思想與行動的聚合地

从清代旅蒙商号的“万金帐”看数据的产权属性特征

郑志刚:大盛魁万金帐作为较早的数据究竟归属谁?属于财东、掌柜或“称己掌柜”?探究上述问题对理解互联网平台数据产权属性带来积极的启发。

当人类社会进入互联网时代,大数据成为驱动新经济的核心动力。一方面,传统产业在进行数字化改造,实现万物互联互通,重塑业务流程;另一方面,平台企业直接以大数据作为生命线开展业务模式创新。大数据由此成为新经济的关键词,新经济甚至被称为数字经济。从新古典经济学的生产要素或政治经济学的生产资料(例如资本)的产权属性传统分析范式出发,在新经济时代,一个理论与实践无法绕过去的问题是,数据这一新的“生产要素”或“生产资料”究竟属于谁的问题。近期伴随监管当局互联网平台反垄断引发的基于大数据开展业务的互联网平台是否应该被国有化的争议其实是这一问题侧面的反映。

数据在企业经营管理实践中所扮演的复杂角色,至少可以追溯到在清代实行“东伙分离”(财东的所有权与掌柜的经营权分离)旅蒙商号的万金帐中。所谓万金帐是清代实行东伙分离的旅蒙商号用来专门记录财东的财股和顶生意掌柜所持身股的变化,以作为账期结束分红依据的特殊账簿。在一定意义上,描述股权结构和基本治理构架的万金帐可以被视为现代股份公司IPO时发布的招股说明书的前身。

我们以清代旅蒙第一商号大盛魁的万金帐为例。在获得身股“顶生意”的掌柜中,大盛魁进一步将其区分为称己掌柜和不称己掌柜。那些在万金帐中的姓名前加“己”字的掌柜才是称“己”掌柜。按照大盛魁的号规,只有那些称己掌柜才可以查看万金帐,参加号会,和过问“厚存”(公积金),所谓“生意好顶,‘己’字难得”。那么,大盛魁的万金帐作为较早的数据究竟属于谁的呢?是属于财东,还是属于掌柜,甚至仅仅属于“称己掌柜”?

也许通过清代旅蒙商号万金帐的归属探究能够为我们今天理解互联网平台数据的产权属性特征带来积极的启发和思考。

数据的产权属性特征

清代旅蒙商号的万金帐无疑与今天互联网平台公司开展业务采用的大数据有很多类似的地方。其一,它是不同当事人之间交易完成或契约签订的历史记录,同时涉及财东、掌柜等多方当事人;其二,万金帐涉及财东和掌柜个人信息隐私。例如,万金帐不仅记录着财东的财股和掌柜的身股分配和调整状况,而且会将财东掌柜账期的分红状况记录在案。

在隐私保护意识并不十分强烈的清代,容易理解,对于清代旅蒙商号东伙而言,万金帐的价值仅仅在于成为东伙未来分红的书面法律凭据和契约意志基础,它的丢失、恶意篡改和非法使用将为未来预期正常开展的交易活动带来某种不确定性。正是由于上述原因,清代旅蒙商号把万金帐看作比金银更加珍贵的资料,严加保管。在大盛魁即使一个顶生意的掌柜如果不称己都无法查看万金帐。

然而,如果给定东伙对万金帐主体内容意志认同(隐式或显式)一致,换一种相对极端的说法,万金帐对于包括东伙在内的任何人不具有实质的价值,甚至与一卷废纸无异。一个有力的逻辑证据是,现代股份公司对于在性质上与万金帐类似的招股说明书则反其道而行之,彻底公开透明,“让更多人见证”,以此避免未来相关当事人交易活动开展中“不确定性”的发生。

无论从清代旅蒙商号的万金帐,还是从现代股份公司的招股说明书,我们看到,数据的本质是交易(契约签订)过程的历史记录。作为交易过程的历史记录,万金帐显然既不属于出资入股的财东(股东),也不属于“东伙分离”下负责日常经营的掌柜(经理人)。这就如同涉及多方当事人权利与义务的履行和承诺的招股说明书的出现本身就是为了方便市场上的投资者了解一家企业,投资者并不需要为获得相关数据而特别付费。因而,我们把包括万金帐和招股说明书在内的数据的基本功能概括为服务交易的完成和提高交易的效率并不为过。

数据多方当事人交易记录的属性和服务交易完成的功能决定了其具有十分明显的“非独占性”和“非排他性”。例如,对于一个在互联网平台记录的一笔交易数据,我们并不能像界定一件产品或一项服务那样简单将其归为所有者,因为它的生成离不开提供产品和服务的企业,购买产品和服务的消费者,以及提供“虚拟的市场”帮助他们完成交易的互联网平台中的任何一方。

而这种“非独占性”和“非排他性”是多方当事人为了交易实现必须付出的“代价”。这如同为了正常的社会交往和业务往来,一个人从出生起要完成户口登记,一家企业设立时需要完成工商注册登记一样。之所以在代价两字上加了引号,这里仅仅用来表明代价对于不同的时代和对于不同的人是不同的。例如,强调隐私保护的今天与清代相比,同样记录交易的数据对于当事人的“代价”可能是不同的;与普通公民相比,作为公众人物的政治家将要承担成为除了诽谤之外街头巷尾茶余饭后评头论足的谈资的“代价”。

数据的价值来源

理论上,作为交易历史记录,用来服务交易完成和提高交易效率的数据如同车辙和足迹一样原本没有价值。现实中数据价值来源于对数据的再利用和再开发。而数据再利用和再开发产生价值的前提是数据积累达到一定的规模,成为“大数据”。

而互联网时代基于互联网技术形成的网络外部性为数据达到再利用和再开发的规模,成为“大数据”,创造了积极条件。即使在没有互联网技术的明清时代,我们看到,作为旅蒙第一商号大盛魁的万金帐的潜在价值显然高于普通旅蒙商号的万金帐。这是由大盛魁在清代蒙古地区“放印票账”,“走房子”的交易规模所形成的与普通商号相比更大的隐性网络所决定的。

当然,在数据(再利用再开发创造价值)规模的形成过程中,始终需要围绕数据的收集、储存和整理付出数据形成的成本。如果仔细观察,我们不难发现,一些专业数据库(色诺芬,CSMAR等)的数据交易价格是“非独占性”和“非排他性”的各种企业(上市公司公开发布的招股说明书、财报和公告等)数据采集整理和初加工的成本计价,而并非是产生交易数据的主要当事方的产权价值。因而数据交易的成本往往只是数据收集整理的成本。

需要说明的是,数据即使形成规模,成为所谓的“大数据”,也只是具有潜在价值,需要经过再利用和再开发环节才能从潜在价值转化为真实价值。一个对于数据再开发再利用产生价值的正面例子来自研究机构的研究者通过向财经数据库付费获得数据后可以开展学术研究,发表学术论文。一个极端负面例子是不法分子以制造未来交易的不确定性对当事企业进行敲诈勒索。

在大盛魁的案例中,即使万金帐由于基于大盛魁隐性网络的规模巨大具有潜在价值,但如果没有经过再利用和再开发环节,对于包括东伙在内的大多数人而言依然没有太多价值;大盛魁万金帐之所以作为商业机密被大盛魁掌柜们精心呵护,除了顾虑为未来预期正常交易活动的开展带来某种不确定性,同时还担心被竞争对手掌握从中破解企业发展战略,对大盛魁未来发展构成威胁。而数据只有在达到一定规模后才具有(再利用再开发)价值这一事实反过来表明,初始数据的占有和利用不会必然给数据产生各方当事人的利益造成损害。

概括而言,数据的多方当事人交易记录属性和服务交易完成的功能决定了数据如同车辙足迹一样本身并无基于产权定价而形成的价值;它的价值来源于数据的再利用和再开发,而再利用和再开发的前提是数据依靠平台积累后天形成足够的规模,成为所谓的“大数据”;数据(库)交易的价格往往来自数据收集整理成本的加成,而不是来自产生数据当事方的产权定价。

数据再利用的价值与互联网平台的激励

互联网平台在本质上是一种“虚拟的市场”。用一家知名二手车的广告语来刻画,理想的互联网平台是“买者直接买,卖者直接卖,没有中介商赚差价”。对于经济学关注的基本激励问题,除了广告收益等流量红利这一平台创立的基本动机,我们不难发现,再利用再开发平台产生数据的价值成为互联网平台创立更高层次的动机。

数据再利用再开发将为互联网平台带来价值至少包括以下两个方面。其一是有助于互联网平台内部征信系统的建立,使企业黑名单制度的实施成为可能。这为维护互联网平台的吸引力和扩大网络外部性创造了条件。例如,蚂蚁集团旗下的花呗、借呗通过大数据的信用能力识别技术和企业黑名单制度,坏账率控制在1.23%,远远低于商业银行的坏账率水平。其二是有助于识别潜在交易对象,发现潜在的交易机会。例如,京东自营利用数据再开发和再利用,通过制定与同类产品的提供者相比,相对更低的价格和更快的物流速度在竞争中处于优势地位。特别地,作为开放的平台,京东并没有限制,反而是欢迎来自其他供应商的竞争。京东自营至少在目前阶段更多的竞争优势来自于前期苦心经营的强大高效的物流体系。

需要说明的是,由于数据能够带来(再利用再开发)价值的规模出现的时滞,经营“平台”与其他类型的企业相比将面临更大的风险。例如,为了把数据积累到一定的规模,形成所谓的“大数据”,在规模效应出现之前,平台企业往往需要不断地烧钱。很多人仅仅看到京东今天电商叱咤风云的地位,但没有看到京东为了构建物流体系吸引客户和厂家,长期亏损,直到近年才开始盈利的事实。

那么是什么激励平台企业前期不断投入,收集、记录和储存数据,以及持续烧钱呢?我们看到,恰恰是互联网平台希望通过扩大网络,吸引客户和厂家,使数据积累到足以再利用和再开发的规模。因而,数据再利用再开发的价值成为互联网平台创立的潜在激励之一。

在理论上,一家互联网平台企业盈利时交易(数据)规模的临界值由数据红利(广告收入、市场规模对潜在客户的吸引力、新的商机等)与数据收集维护储存等平台运行成本二者之间的比较决定。

数据产权纠纷的认识误区

以上的分析表明,在产权归属上,交易记录的本质属性决定数据涉及各方当事人,具有“非独占性”和“非排他性”,在司法实践中我们并不能明确界定数据的产权归属;在利益分配上,数据价值来源于数据的再利用和再开发,不会必然对各方当事人的利益造成损害;在客观效果上,数据再利用的价值成为互联网平台创立的潜在激励之一。因此,围绕数据产权纠纷的法律救济的关注重点应该集中于是否侵犯隐私(是否损害当事人的声誉)、数据的真实性(是否存在欺骗和造假)以及是否妨碍各方当事人正当交易的完成,由此带来当事人正当利益的损害(是否传递错误或误导信息)等几个方面。

有鉴于数据上述产权属性特征,在司法实践中,我们尽可能避免出现以下认识误区。第一,由谁发起交易,产生数据,数据的产权就归谁所有。我们需要清除地认识到,作为几方当事方交易的记录,数据的产权边界并不是十分清晰。类似于车辙足迹,数据具有“非独占性”和“非排他性”。车辙足迹留在道路上,但是我们并不能因为是马车(以及赶马车的人)和行人留下的,车辙足迹就属于马车和行人,也不能因为留在道路上就属于道路和道路的所有者。

第二,既然数据的产权边界模糊,数据产生的价值应该在当事各方之间进行分享。前面的分析表明,数据的价值来源于数据再利用,而非其产权定价。一些互联网平台企业的利润不是建立在妨碍阻止产生数据各方当事人正当交易,损害其正当利益的基础上,而是来源于对数据的再利用和再开发。我们不能在一些互联网平台目前的盈利与产权属性模糊的数据之间建立简单的因果关系。如同(成功的)企业家创立企业获得高额投资回报,我们并不能因为上述高额投资回报的形成离不开利益相关方的付出和努力而否定企业家获得高额投资回报的正当性和合理性。更何况,平台再利用再开发数据并不必然对产生数据各方当事人的利益构成损害。

第三,既然数据产权边界模糊,那就应该在全社会免费共享,甚至归国家所有。前面的分析表明,一方面,互联网平台需要为形成一定规模的数据的收集、整理和储存投入大量成本。近年来,正是互联网平台对数据整理和储存的现实需要使一些头部的互联网平台成为“云计算”和“大数据”各种互联网前沿技术研发和应用的引领者;另一方面,更加重要的是,数据再利用的价值一定程度上解决了互联网平台创立的激励相容问题,成为互联网平台创立的潜在激励之一。互联网平台从前期烧钱到目前盈利承担巨大风险,无数互联网平台在黎明来临之前倒下。如果将互联网平台前期积累的数据简单在全社会免费共享,甚至归国家所有,挫伤的将不仅仅是平台所有者对互联网平台创设和维护的激励,而是如同市场的关闭一样,互联网平台的倒下将使正常的市场交易减少,受损害的将是每一家厂商和每一位消费者,以及厂商和消费者背后的政府。

理论上,在不损害用户隐私权和商业秘密的前提下,对于互联网平台数据可以参照商业数据库的运营原则进行交易,供需要的大学研究机构和市场研究者购买。而互联网平台之间的竞争,以及代替性的数据市场形成将对互联网平台数据流动进而数据定价产生影响。

(本文仅代表作者观点。责任编辑邮箱:[email protected]

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram