摘要:由于我国科研和非科研领域数据保护和共享制度发展不同步,因而在我国人体基因数据共享领域存在二元规范体系,造成了规则适用困难,人体基因数据分散存储、共享难度大,同时加大共享中的数据风险。在数据出口端对数据链进行延长并整合,建立人体基因数据授权运营制度,可从用户端实现数据统一,为建立统一的数据平台提供表一的经济支持和动力,同时可以兼顾安全和效率。此外,人体基因数据授权运营制度也是进一步落实惠益分享原则的重要途径。具体来说,应当建立首席数据官制度实现基于科研领域的数据统合,同时制定合理、公平、透明的收益分配机制,特别要关注人体基因数据产生者的权益,同时应当建立有效的监督和救济机制。
关键词:人类遗传资源;人体基因数据;数据授权运营;数字经济
中图分类号:D923 文献标识码:A
文章编号:1005-3492(2024)05-0089-15
随着我国一系列释放数据红利政策的实施,数据要素的基础资源作用和创新引擎作用将得到充分释放,为我国数字经济的繁荣发展注入强劲动力。人体基因数据关系到国家安全和公共利益,同时又具有十分重要的经济价值,因而构建兼顾安全与效率的数据共享制度是充分发挥人体基因数据价值的重要途径,同时也是保护我国人体基因数据的重要举措。目前,我国人体基因数据的分享和管理制度中,科研领域和非科研领域分属于不同的规范体系,给进一步挖掘人体基因数据的价值造成了一定的阻碍,也给数据保护带来了一定的困难。因此如何实现所有领域中人体基因数据的统合,构建在安全和效率之间平衡的数据共享制度,是充分发挥人体基因数据优势,发展生物制药相关产业,促进数字经济发展的必由之路,同时也是保障我国人体基因数据安全,维护公共利益的重要内容。
由于我国不同领域中数据保护和共享发展不同步,因而在我国人体基因数据保护与共享领域中存在着规范的“二元规范体系”,给低成本、大规模的人体基因数据共享和保护造成了一定的阻碍。
(一)人体基因数据法律保护的二元规范体系
人体基因数据的保护与共享中存在科研领域与非科研领域二元规范体系。这使得对于同一类信息因用途不同被人为地作出了不同的规定,这两个领域中对数据是否采取和实体样本相同的保护措施的规定也不尽相同。
在科研领域中含有人体基因信息的数据上采用“人类遗传资源”的表述,《生物安全法》第56条和《人类遗传资源管理条例》第3条第2款均采用了“人类遗传资源”这一表述涵摄了数据和实体样本,在既有规范中保持了统一,并明确将临床、殡葬等其他用途排除在“人类遗传资源”相关规范的适用范围之外。《刑法》第334条之一规定:“违反国家有关规定,非法采集我国人类遗传资源或者非法运送、邮寄、携带我国人类遗传资源材料出境,危害公众健康或者社会公共利益,情节严重的,处三年以下有期徒刑、拘役或者管制,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。”此处的“人类遗传资源”的含义应当与《生物安全法》和《人类遗传资源管理条例》中的概念保持一致。这一理解保持了在法律体系中概念的统一性。
至于科研之外的领域,人体基因数据的规定,并无统一规范,散见于各个领域的规定中。《刑法》第334条规定:“非法采集、供应血液或者制作、供应血液制品,不符合国家规定的标准,足以危害人体健康的,处五年以下有期徒刑或者拘役,并处罚金;对人体健康造成严重危害的,处五年以上十年以下有期徒刑,并处罚金;造成特别严重后果的,处十年以上有期徒刑或者无期徒刑,并处罚金或者没收财产。”针对的是指未经国家主管部门批准或者超过批准的业务范围,采集、供应血液或者制作、供应血液制品。无论其是否属于科研领域。《民法典》第1009条规定:“从事与人体基因、人体胚胎等有关的医学和科研活动,应当遵守法律、行政法规和国家有关规定,不得危害人体健康,不得违背伦理道德,不得损害公共利益。”这一表述也未明确具体的适用范围,显然包含了科研和非科研领域。
除此以外,在不同领域中对于人体基因数据保护的规范也不尽相同。在科研领域,人类遗传资源保护遵循的是将数据按照实体样本同样的方式进行保护,这与我国制定《人类遗传资源管理条例》时候,数据和个人信息保护规范体系尚未成熟有关。在非科研领域,基本上实体样本和数据是按照不同规范体系进行保护的,在殡葬、兴奋剂检测领域对实体样本都有专门的规定,而在这些领域中基本没有对于数据的特别保护,一般认为应当普遍适用《数据安全法》《个人信息保护法》《保密法》等通用性的基础规范。在医疗数据领域,目前有一些关于数据利用的规定,但是鲜有特别强调该领域数据保护的规范,因而也应当适用上述的通用性基础规范。
二元规范体系的形成主要是基于20世90年代末出现的两次较为严重的窃取我国人类遗传资源的事件,导致作为主管部门的科技部开始重视科研领域的含有人体基因信息的实体样本的保护。后来,随着基因技术的发展,特别是基因测序以及生物制药行业的发展,除了实体样本以外,数据的重要性也得到了重视。但是,由于当时对于数据保护的规范十分缺乏,因此在1998年《人类遗传资源管理暂行办法》第二条对“人类遗传资源”的法律概念的界定超出了科学领域常用的概念范畴,将数据信息采取了和实体样本相同的保护方法。2019年《人类遗传资源管理条例》继续沿用了这一立法思路。应当说由于科研领域较早地关注到了人体基因数据可能出现的问题,因此在立法上较为超前,形成了与其他领域二元规范体系的立法局面。同时,非科研领域人体基因数据风险的出现又与大数据等技术的发展具有密切联系,此时数据规范开始了快速发展,非科研领域中人体基因的实体样本和数据分属在不同的立法体系中。具体的关系如图1所示。
(二)二元规范体系下人体基因数据共享规则及实践
二元规范体系使得原本性质上相同的数据人为地采用了不同的法律保护体系。当然,目前我国的法律保护体系也并非随意为之,而是基于科学技术的发展而逐步形成的,在实践中发挥了重要的作用,而且具有一定的合理性。但是,从人体基因数据的利用和保护角度来看,这种二元规范体系造成了以下问题:非科研领域中规范适用的范围是实体样本,对于非科研领域数据的保护适用的是数据保护的基本法律,针对性不足;科研领域中的数据样本相对于非科研领域的样本数量要少很多,目前科研领域的数据共享机制不能辐射到非科研领域,对于数据共享和利用不足。同时,科研领域由于辐射范围较小,共享平台和规则存在较大的风险,得不到相应的重视。
目前,在我国科研领域中建立了数据共享制度,即人类遗传资源数据共享平台。我国人类遗传资源数据共享经历了由分散型储存平台到形成统一的共享平台,再到合理有效规制共享平台的三个发展阶段。1998年国内开始出现了较为分散的平台,这是人类遗传资源数据共享起步阶段。1998年科技部批准成立了国家人类基因组北方研究中心和国家人类基因组南方研究中心,由此构建了少量的专业数据库。在这一阶段基本上是科研院所与企业各自形成独立的数据存储平台,这些平台的功能更侧重于存储而非共享。2003年,中国人类遗传资源平台(National Infrastructure of Chinese Genetic Resources,NICGR)建设启动,旨在建立一个跨地区、跨领域的人类遗传资源平台,该平台开始关注并致力于开展人类遗传资源数据的共享。这是我国人类遗传资源数据共享的第二个阶段。人类遗传资源数据共享的第三阶段是2019年《人类遗传资源管理条例》颁布实施以来,开始了从行政法规层面对人类异常资源信息的共享进行规制。其后实施的《生物安全法》作为适用于人类遗传资源的首部法律,对于人类遗传资源的保护和共享作出了规定。目前,《生物安全法》《人类遗传资源管理条例》《人类遗传资源管理条例实施细则》等规范共同形成了人类遗传资源数据共享的制度依据。
在非科研领域,多数规范着眼于人体基因实体样本的保护,数据保护的规定不多,涉及数据共享的规范少之又少。目前较为关注数据共享的是医疗领域。医疗数据共享制度有两种类型:第一类是单独的医疗数据共享机制,这一类共享制度旨在发挥医疗数据的经济机制。《上海市浦东新区促进张江生物医药产业创新高地建设规定》鼓励医疗卫生机构进行医疗数据的采集和共享,建立与共享机制配套的分级分类开放标准,充分挖掘医疗数据的经济和科研红利。《广东省关于促进生物医药创新发展的若干政策措施的通知》中提出建设健康医疗大数据中心,实现健康医疗数据共享交换、跨区域汇聚和科学利用,同时允许粤港湾合作项目需要的医疗数据和实体样本在区域内跨境使用,最大限度地在该地区内发挥医疗数据在生物医药方面的价值。商务部印发的《武汉市服务业扩大开放综合试点总体方案》《重庆市服务业扩大开放综合试点总体方案》明确了建立健全患者主导的医疗数据共享方式和制度的要求。第二类是强调将医疗数据融入既有的人类遗传资源的科研数据中,丰富数据库的样本,整合成一个包含更大范围的人体基因数据共享制度。《深圳市临床医学研究中心管理办法》将医疗数据库建设的规模、质量和共享情况等纳入考核标准中。《广西临床医学研究中心管理办法》《烟台市临床医学研究中心管理办法》《山东省临床医学研究中心管理办法(2022年修订)》将建设临床医疗样本库等公共服务平台列为临床研究中心的职责和任务之一,并将其作为评审的要件之一。
在除医疗数据以外的其他非科研领域,对于涉及人体基因数据资源共享的规定十分有限。值得注意的是,虽然在《刑法》和《人类遗传资源管理条例》中提及了殡葬、兴奋剂检测等行业的人类遗传资源依照各自的规定,但是在《殡葬业管理条例》《反兴奋剂条例》等规范中关于殡葬业和兴奋剂检测领域的条款并未提及人体基因数据的保藏和分享问题,即在这些领域中规范尚不成熟,甚至处于缺失状态。
(一)二元规范体系存在的问题
二元规范体系使得性质相同的人体基因数据被划分为不同的规范体系,在数据的采集、共享和保护方面都遵循不同的规范,造成了诸多问题。
第一,二元规范体系造成了规则适用困难。二元规范体系形成的原因在于我国的人体基因数据规范方面的立法是从个别走向一般的过程。在科研领域,我国在1998年就制定了《人类遗传资源管理暂行办法》,建立了人类遗传资源科研领域的行政许可制度,2019年《人类遗传资源管理条例》开始实施,为进一步规范科研领域人类遗传资源数据使用和挖掘人类遗传资源数据价值发挥了十分重要的作用。同时,前文述及的人类遗传资源领域的共享平台也建立较早。其他领域的规则和平台的发展都远滞后于科研领域。这种现象是由科研领域的先进性以及相关产业的滞后性所决定的。
这种差别虽然可以看作是特别法与一般法的关系,即人类遗传资源领域的规范相对于整个人体基因领域的规范来说是特别法。然而,科研领域和非科研领域采取不同的规则体系,在数据的采集、保护、共享方面遵循不同的规定,造成部分平台重复建设,数据的利用率不高。如前文提及在科研领域已经建立了统一的人类遗传资源数据共享平台,但是科研领域的数据样本有限,并且这些平台的共享制度不能辐射到非科研领域,特别是临床领域的大量人体基因数据被排除在人类遗传资源样本的数据之外。此外,随着生物技术应用更为广泛,该项技术被越来越多地当作一项执法手段进行运用,《治安管理处罚法》(草案)中提到了公安机关在必要时可以采集生物信息,由此产生的大量信息的保护和共享问题也并未作出规定。
第二,二元规范体系使得人体基因数据分散存储,共享难度增加,不利于发挥数据红利。在大数据技术背景下,对于海量数据的占有是利用大数据进行分析并得出准确结论的基础,样本的占有量是十分重要的。二元规范体系使得科研领域和非科研领域的样本存储在不同的平台,这些平台中数据的采集、共享采用不同的规范和标准。从目前的实践来看,形成统一的“数据池”和供给标准是进行有效数据共享的前提,在政务数据领域有地区为了达到这一目的建立了“首席数据官”等制度。标准不同的数据不能从同样的维度被进行描述,在数据之间形成了壁垒,进行数据分析的时候受到了诸多限制,分散在科研和非科研领域中的同一类人体基因数据不能在同一项分析中共同使用,变相降低了对数据的占有量,影响分析的准确性,限制了数据作用的发挥。二元规范体系造成了科研领域和非科研领域中的“数据孤岛”,降低了数据的利用率。“数据孤岛”也阻碍了科研领域和非科研领域的沟通协作。科研的目的在于将成果应用于实践中,非科研领域也需要科研领域的技术支持,从某种意义上说,二者是一个职业共同体,“数据孤岛”的存在割裂了本应存在的职业共同体,削弱了该职业共同体的凝聚力。
第三,二元规则体系加大了人体基因数据在共享中的风险。数据作为一项新的生产要素,在经济中的作用越来越重要。人体基因数据共享可以带来巨大的经济价值,当然人体基因数据共享也存在着一定的风险,特别是伦理和隐私风险。由于授权运营数据要素在不同处理主体之间流动的过程中,与之相关的风险因素有可能由于失察等原因随其流入到下一个环节。人类遗传资源数据因共享而产生的风险防控问题,既有与一般信息相似的共性风险,又有人类遗传资源数据本身所具有的遗传性、族群性等特征,如果不当地共享及利用,对特定的家族、族群将会带来严重的污名化和基因歧视的问题。基于上述原因,就需要对人类遗传资源信息共享进行特别的考量。
现行的二元规范体系之下,科研领域和非科研领域中对于数据的保护采用不同的标准,而这些数据在本质上并无区别,不同的保护标准使得相同的信息按照不同的强度进行共享和保护,在一个体系中难以共享的信息可能会通过另外一个规范的共享途径获得,给人体基因信息数据共享风险的规制带来了困难。二元规范体系本身又容易将工作人员的视野局限在自己的领域中,忽视其他途径可能造成的风险。
鉴于此,将不同领域的人体基因数据进行不划分领域的统合和共享是非常重要的,现行的二元规范体系的形成有历史和现实的原因,进行改变可操作性不强,因而需要考虑如何在现行规范体系不做大的修改的情况下,能够达到将科研领域和非科研领域人体基因数据进行统合的目的。
(二)二元规范体系的可操作性统合
二元规范体系之下,在入口端采用了不同的分类标准,但是,这并不意味着这种情况下无法对人体基因数据进行共享和利用,因为数据共享和利用并非与入口端链接,而是与数据的出口端联系更为紧密,因此在数据的出口端进行统合更为直接。采取数据授权运营制度是在二元规范体系之下,对数据进行整合的较为具有可操作性的方式之一。
1.着眼数据链条末端延伸的破解之法:授权运营
在政府数据开放和共享的背景之下,由于行政机关缺乏共享政府数据的动力同时又承担着政府数据开放后的风险,因而缺乏执行动力,为了应对这种情况,于是数据授权运营制度应运而生。数据授权运营制度构建了数据“可用不可见”的模式,可以同时兼顾经济利益与数据安全。人类遗传资源数据目前掌握在部分医院和科研机构手中,之前的共享基本上是基于科研共同体而进行的无偿共享,因而建立统一的共享平台也缺乏动力和经费来源,而引入数据授权运营制度可以解决这一问题,同时,该制度也是在现行规范框架体系内具有可操作性的制度。
第一,数据授权运营制度可以从用户终端实现数据统一,这一统一包含整合科研和非科研两个领域,同时也包含不同的数据标准。目前现有的二元规范体系使得科研领域和非科研领域的数据采集各自遵循各自的标准,两个领域中的数据不互通,而且因标准不同和存储于不同的平台,互通存在技术上的障碍。授权运营制度的建立对现有的人体基因数据链进行延长,增加了用户终端并且在用户终端层面上对现有数据以相同的标准进行一次整合,使性质相同的人体基因数据跨越科研领域和非科研领域的藩篱,实现在同一个平台上共享。
需要注意的是,现有的人体基因数据共享制度是在二元规范体系之下形成的制度,在科研领域和非科研领域的壁垒业已形成,现有的授权运营终端建设也必须建立在之前的二元规范体系之下,因而面临着现有数据整合困难的问题。基于此,应当对于已经存储于现有共享平台和尚未收集的数据采取不一样的整合方式。对于已经存储于现有平台的数据,因为既定的要素已经形成,如果还是按照要素最大范围来进行数据处理,会产生有些数据的某些要素缺失,在数据分析过程中不可用,进而影响整个研究的情况,因此对于现有数据应该提取不同平台之间要素的合集,以形成最多的有效数据为目标,最大限度地使现有数据在分析中发挥作用和价值。对于尚未收集的数据,可以在授权运营终端建立标准,涵盖到现有数据采集标准中最大的要素范围,从而倒逼科研领域和非科研领域改变既有的数据标准,形成统一的模式。
第二,数据授权运营制度可以为建立统一的数据共享平台提供必要的经济支持和动力。数据已然成为一项十分重要的资产,而数据资产化需要强调利用导向。人体基因数据授权运营的制度可以体现数据作为生产资料的属性,将数据及其衍生产品在市场上进行交易,实现该领域数据资产化利用,进而带来一定的经济收益或者发挥其他的价值。
我国拥有庞大的人口数量而且民族众多,拥有丰富的人体基因数据资源,其中蕴含的经济价值巨大,如果能够依托数据授权运营制度实现对人体基因数据资产化利用,不仅会产生一定的经济利益,而且会进一步实现数据要素的价值,同时进一步培育数据要素市场,为人体基因领域的科研和基础平台建设提供有力的经济支持,形成良性循环,对临床医学的发展也具有十分重要的意义。
第三,数据授权运营制度可以同时兼顾安全和效率。随着生物技术的迅速进步,人体基因数据在科研、临床以及公共健康领域发挥着日益重要的作用。尽管《数据安全法》和《个人信息保护法》为基因数据提供了一定的保护框架,但面对其在非科研领域的应用与共享的必要性,这些措施显得不足。基因数据的共享不仅能够促进科学创新和经济增长,还能够提升公共健康水平。然而,基因信息的泄露和不当使用可能对个人隐私和社会信任造成严重损害,引发一系列社会、法律和伦理问题。个人基因信息的泄露可能导致隐私侵犯和安全风险,包括疾病风险、遗传特征和家族病史等敏感信息的暴露,可能会引起个人的污名化和身份盗用,甚至影响到就业和保险等方面的决策,造成经济和名誉上的损失。此外,基因数据的泄露还可能降低公众对医疗保健提供者、研究机构和政府的信任,减少人们参与基因研究和数据共享的意愿,从而阻碍科学研究和医学进步。
鉴于这些挑战,建立一个统一的人体数据授权运营制度显得尤为重要。这样的制度旨在平衡保护个人隐私和安全与促进基因数据合理利用之间的关系,通过确保数据在收集、存储和使用过程中的安全,避免数据泄露和滥用,同时促进基因数据的有效共享,支持科研创新和公共健康的发展。这一制度还应当解决伦理和法律问题,包括确保个人同意、明确数据所有权和使用范围,以此维护受试者权益,促进公众教育和意识提升,增强社会对基因科学的接受度和信任。
此外,人体基因数据的泄露还有可能给相关机构和工作人员带来法律风险,使其面临法律责任和经济赔偿,而分散且各自为政的数据保护措施更容易出现各种安全隐患,建立统一的数据授权运营制度是应对上述风险的可行措施之一。建立人体基因领域的数据授权运营制度,不仅是对现有科技发展的必要回应,也是面向未来的积极准备。通过规范化的管理和操作,既可以保障个人隐私和数据安全,也可以促进科学研究和公共健康的发展,同时适应国际合作的需要,推动生物技术和医疗健康产业的持续进步。
2.进一步落实惠益分享原则的重要途径
惠益分享原则是一个广泛适用的原则,尤其在遗传资源的获取和利益分享中发挥了重要作用。该原则的主要目标是规范成员国对遗传资源的获取,并对利用遗传资源产生的惠益在资源提供国和资源利用国之间作出合理的分享安排。惠益分享尤其跨国分享是传统知识保护的核心目标之一,但很少能够落到实处。这一原则在《生物多样性公约》《粮食和农业植物遗传资源国际条约》以及《波恩准则》三个国际法律文件中得到了明确规定和体现。《生物多样性公约》第1条指出了该公约的三大目标,其中“公平合理分享由利用遗传资源而产生的惠益”即惠益分享原则。同时,惠益分享原则也是历次公约缔约方大会的核心议题。惠益分享可以涵盖多种形式,包括金钱和非金钱惠益。例如,使用遗传资源生产商业产品时,可以分享许可费作为金钱惠益。一般而言,发达国家拥有技术优势,遗传资源欠缺,因而这些国家生物产业的发展主要依靠我国、印度等几个国家。作为遗传资源出口大国,我国目前更重视的是非金钱惠益,特别是对于知识产权的共享。
在我国,科研领域的人体基因数据及人类遗传资源领域较早地就对这一原则进行了规定。1998年的《人类遗传资源管理办法》第18条规定:“有关人类遗传资源的国际合作项目应当遵循平等互利、诚实信用、共同参与、共享成果的原则,明确各方应享有的权利和承担的义务,充分、有效地保护知识产权。”惠益分享原则对于作为人类遗传出口大国但是技术和经费尚不够充足的我国来说,可以最大程度地在国际科研合作中保护我国的知识产权和经济利益。2019年《人类遗传资源管理条例》第22条至25条对惠益分享原则进行了较为详细的规定,特别是在第24条中明确了“利用我国人类遗传资源开展国际合作科学研究,产生的成果申请专利的,应当由合作双方共同提出申请,专利权归合作双方共有。”2023年实施的《〈人类遗传资源管理条例〉实施细则》第14条规定:“利用我国人类遗传资源开展国际科学研究合作,应当保证中方单位及其研究人员全过程、实质性地参与研究,依法分享相关权益。国际科学研究合作过程中,利用我国人类遗传资源产生的所有记录以及数据信息等应当完全向中方单位开放,并向中方单位提供备份。”上述规定也成为科技部在进行人类遗传资源科研项目行政许可过程中审查的重点内容。当然,在实践中,我国对该原则的执行力尚有提升的空间。
在非科研领域中尚没有此类规定,但是非科研领域的人体基因数据和科研领域中的人类遗传资源数据本质上并无二致,部分企业和个人甚至可以从非科研领域中获取相关数据以此规避惠益分享原则的审查,这不但给我国的经济和知识产权带来一定的损失,而且也会使得我国对于生物安全的危险因素的控制性减弱。
鉴于此,建立统一的人体基因授权运营制度可以更好地贯彻实施惠益分享原则,主要有以下原因:一方面,在数据授权运营制度下,人体基因数据只作为产品销售的时候,可以通过合同条款再次确认惠益分享原则,获得经济利益上的惠益。当外方作为数据产品购买人时,数据授权运营主体可以按照购买方的需求对数据进行分析,提供给购买方其所需的结果,在买卖合同中,购买方自然会支付相应的对价。一般基于该制度下所获得的数据都需要产品购买方在使用数据的时候标明数据来源,这一要求也可以在买卖合同中进一步明确,这样就保证了利用我国人体基因数据产生的成果对我国的贡献进行标识。此外,在此种情况下由于授权运营主体只是提供给购买方一个分析结果而非具体的数据,因此也防止了我国的人体基因数据泄露,对我国的安全造成威胁。
另一方面,授权运营提供数据产品而非数据可以防止该类信息挪作他用。2018年10月,科技部对外发布了六份行政处罚决定,其中涉及将获批项目的剩余样本用于开展其他未获批准的研究,这种直接提供原材料及源数据的研究出现挪用的情况很难避免。而采用数据授权运营制度就可以很好地避免此类情况的发生。在数据授权运营制度的背景之下,一个需求只对应一个数据产品,购买方没有源数据,在有些情况下,对于其中的算法也未见得完全知晓,因而完全避免了将数据挪作他用的可能。同时,数据授权运营制度按照需求收费,一个数据产品收取一次费用,也最大程度地保护了在与外方开展合作时我国的经济利益。
由此可见,无论是从数据安全角度还是从经济利益和知识产权角度,对人体基因数据实行授权运营都有助于我国利益的保护,特别是在国际合作项目中占据优势地位和话语权具有十分重要的积极作用。
(一)建立首席数据官制度实现基于科研领域的数据统合
科研领域中人类遗传资源数据的保护和共享制度发展较早,且目前已经在实践中发挥了一定的作用。现有规范中人类遗传资源数据共享的规范体系也比非科研领域的人体基因数据共享规范体系成熟,因此,基于科研领域现有的基础对人体基因数据进行统合可以充分利用现有的制度和规范基础,同时避免重复建设。
从科研领域的人类遗传资源数据共享扩大到整个人体基因数据的授权运营还需要打破科研领域和非科研领域之间的界限,这是实现数据合理利用的关键一步。为了实现这一目的,可以建立首席数据官制度,以完成不同领域数据在“最后一公里”的整合。
首席数据官制度最初产生于私企当中,扮演着数据赋能开发者等重要角色。后来,在政府数据和公共数据领域中引入了该制度,在我国,已经有部分地区开始设置首席数据官来实现对政府数据和公共数据的管理工作。有学者采用实证研究的方法对于政府首席数据官的作用进行研究和评估,最后得出结论认为政府设置首席数据官可以最大限度地提升政府开放度,同时能够提升数据资源的利用率。这一研究给解决不同领域人体基因数据整合的问题提供了思路。可以效仿公共数据治理领域的首席数据官制度,这一制度虽然在我国尚处于起步阶段,也还有完善的空间,但是这一制度的思路对于解决数据领域的问题无疑是有重要意义的。
在人体基因数据共享领域中设置首席数据官制度具有现实的可行性。一方面,在人体基因领域设置首席数据官与我国对待数据领域问题的整体逻辑相符。面对日益复杂的数据环境和日益增长的数据价值,在宏观层面,数据相关产业的发展越来越受到重视,这一点在顶层设计中已经非常明确。2014年国务院办公厅印发《关于促进电子政务协调发展的指导理念》,2015年,国务院印发《促进大数据发展行动纲要》,2022年12月19日发布的《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》更是将发挥数据要素的作用放到了一个前所未有的高度。在人体基因领域中设置首席数据官制度,是对上述顶层设计安排的具体落实,是对上述要求的切实回应。另一方面,在实践中,广东、浙江等地已经建立了首席数据官制度并且顺利实施,这为在人体基因数据领域设置首席数据官提供了一个非常好的经验。
因此,建议在人体基因领域中,建立首席数据官制度,以履行下列职责:第一,负责延长不同领域的数据链条,负责制定统一的数据标准,促进不同领域数据的能够在一个数据库中采用统一的格式进行描述,这一点在前文中已经提及。
第二,制定数据分级分类标准,并依据该标准对数据进行分级分类,按照数据分级分层的原则进行管理,根据数据的风险程度和经济价值来确定不同的处理策略,对于高风险高价值的数据进行授权运营,对于低风险高价值的数据直接按照既有的共享规则进行开放共享,对于高风险低经济价值的数据不予开放和运营。不能完全照搬既有的数据分级分类标准,需要根据数据授权运营的特点制定具有针对性的标准。确保人体基因数据收集、存储、处理和共享活动都必须在法律规定的框架内进行。严格遵守《数据安全法》《个人信息保护法》等一般规定。
第三,进行伦理审查,保护数据提供者利益和公共利益。数据官一个重要职责是保护数据提供主体的知情同意权。这要求提供充分、透明的信息,让数据主体了解其数据如何被收集、处理和使用。同意过程应简单、明确,确保数据主体可以在完全了解的情况下作出决定。此外,应随时允许数据主体撤回其同意。同时,由于人体基因数据较为特殊,因此伦理审查制度的建立是确保人体基因数据的采集和使用符合伦理标准的关键。在伦理审查中需要对整个过程中数据的采集方法、使用目的、范围和使用方法进行评估,特别是在处理重要家系或涉及遗传特征数据信息时。伦理审查应由具有相应知识背景的专家组成的独立委员会进行,以评估数据使用的潜在伦理风险,并提供指导和建议。这一制度在人类遗传资源领域已经建立,有必要将其推广至整个人体基因数据领域。
第四,总体的监督职责。数据官需要关注整个数据从采集到运营的过程,确保数据在采集、处理,特别是匿名化过程中的合理,同时在授权运营的过程中,确保数据的要特别强调只提供数据产品,对于源数据“不可见”,在控制风险的前提下最大化其经济和科研价值。在此思路之下,建立专门的数据审查机制,对数据和授权运营进行审查的同时,也需要对购买数据产品的个人或者机构进行严格的审查和监督,确保购买者在使用数据产品时遵守法律法规和伦理原则。
应当说,人体基因首席数据官的设立是解决不同领域中人体基因数据整合问题的关键所在。
(二)人体基因数据共享的收益
对于公共数据授权运营的性质,有政府购买服务说、行政许可说、特许经营说、政府与社会资本合作PPP模式等观点,尚未形成通说,并形成了观点交锋,随着研究的推进,又出现了按照类别将数据授权运营划分为不同类型的学说。在该制度出现初期,学者往往以单一的模式界定其法律性质,如有学者认为授权运营属于行政许可,有学者持相反的观点,明确不是行政许可,而是特许经营,有学者在此基础上进一步指出,政府数据的授权运营与行政授权、行政委托和行政许可、用益物权或知识产权法上的许可使用不同,其本质是一种特许经营,适宜按照基础设施特许经营的逻辑进行规范。有学者针对上述观点进行了反驳,认为政府数据授权运营是继政府信息公开、政府数据开放后,持续推进政府数据开发利用的一种新的政府数据对外流通方式,是政府数据开放的一种有益补充,属于政府与社会资本合作的PPP模式之一,需要将其融入政府数据治理整体制度建构中,并作为一重要组成部分进行原则性规定,辅以专门制度,聚焦授权运营和数据产品及服务市场化两个关键环节提供具体规范。而新近的研究成果多认为数据授权运营的法律性质较为复杂,是一个融合了多种模式的混合模式。有学者认为数据授权运营呈现出政府购买服务、国有资产运营和特许经营等多元化法律属性。有学者认为,公共数据授权运营包括政府采购模式与特许经营模式两大类型,前者侧重于政府的狭义公共服务职能,涉及事业性业务,属于行政委托;后者侧重于政府的公共资产增值职能,涉及经营性业务,属于特许经营。然而,有学者认为,政府数据授权运营是一个新的概念,无法植入到已有的行政法体系中,需要用新的理论去分析其法律属性。
应当说这一研究观点的变化是随着数据授权运营实践的发展而进行的及时理论跟进,随着实践越来越丰富,学者发现用单一的模式很难解释现有的数据授权运营模式,因而开始对公共数据授权运营进行分类研究,这种类型化的研究思路是解决目前公共数据授权运营法律性质更为恰当的思路。
之所以要探讨数据授权运营制度的性质是因为对授权运营不同制度定位可能会影响费用的收取和利益分配的情况,但是,无论采取哪种模式,在数据提供者、数据处理者和运营者之间形成一个公平、合理的分配模式是收益分配制度的关键所在。合理有效的收益分配机制不仅能激励数据的产生和共享,也有助于确保所有参与方的合法权益得到保护。
一方面,在收益中应当体现公平、透明和合理的原则。收益分配机制在人体基因数据授权运营中占据核心地位,其设计需基于公平、透明和合理的原则,这就意味着所有参与人体基因数据产生、管理和运营的相关方都应当有权分享由此产生的收益,还意味着这种分配必须反映各方的贡献和风险承担。
在这里要特别关注数据提供者的收益问题。在人体基因数据授权运营的收益分配中,个人数据提供者的权益保护尤为重要。鉴于他们提供的基因信息可能被用于具有商业价值的研究和应用,合理的经济补偿或利益分享机制是保障其权益的关键。数据的处理者和运营者由于直接出售数据产品,因而可以直接依照买卖合同或者是委托合同获得对应的经济收益。人体基因数据的产生者因为在整个链条中处于最前端,与最终的数据产品之间链条最长,因而利益最难获得保障,人体基因数据的提供者经常处于被忽视或得不到与自身相匹配利益的境地,甚至连最基本的知情同意的权利都难以实现 。虽然实务界和学术界都不乏对于该问题的思考和论述,但是在实践中依然存在着诸多问题。当数据采集完成、数据产品形成和数据出售时,由于本身数据链条过长以及匿名化等要求,数据的原始提供者很难主张自己的权益。
鉴于此,可以在数据提供者在提供数据时,获得数据提供者的有偿授权,如果数据提供者同意授权,则该数据可以进入人体基因共享的数据库中进行授权运营,如果数据提供者不同意,则该数据不能够用于授权之外的其他用途。这里的有偿授权除了是经济利益之外,也可以是优先享受研究成果等非直接经济形式的回报,提供优惠的医疗服务、免费或优惠的健康检测、参与特定研究成果的先行体验,一定范围内数据库的使用权、购买数据产品的优惠等其他形式。同时,应允许数据提供者在补偿形式上有一定的选择权。这意味着,提供者可以根据自己的偏好和需要,选择最适合自己的补偿形式。这种灵活性不仅体现了对个体选择的尊重,也更有助于满足不同人群的需求。上述的关键点在数据取得时候就已经完成了数据提供者的经济利益分配,避免后期由于各种原因忽视了数据提供者的利益。
除此以外,收益分配应考虑各方的具体贡献和所承担的风险。例如,数据提供者在不违反个人隐私的前提下提供了基础数据,其贡献在于数据的原始性和真实性;数据处理者通过技术手段加工和分析数据,增加了数据的应用价值;而数据使用者将数据转化为实际的科研成果或商业产品,进一步放大了数据的价值。这些不同层面的贡献和相应的风险,如数据泄露或不当使用带来的法律责任,都应在收益分配中得到体现。
通过以上的规划和设计,可以确保个人数据提供者在人体基因数据的授权运营中得到公正和合理的待遇,同时也有助于建立一个健康、可持续的数据共享生态。
另一方面,利益的分配标准应当明确、透明且进行动态调整。制定收益分配的具体标准和流程对于确保透明性和公平性至关重要。这包括设定明确的比例分配规则、制定详细的合同条款,并确保这些信息对所有参与方开放和透明。应有一个独立的监督机构来监督和调整收益分配机制,以应对数据市场的变化和可能出现的争议。
收益分配的过程应完全透明,所有参与方都应清楚地了解收益分配的标准和过程。这要求建立详细的收益分配规则,并在所有参与方之间进行充分的沟通和协商。
在人体基因数据授权运营的收益分配中确保制度的透明性和公正性不仅有助于维护所有参与者的信任,还能保证收益分配过程中的合理性和公平性。透明和公正的分配制度需要通过明确的规则、透明的流程和独立的监督机构来实现。首先,透明的分配规则意味着所有参与方都能够清楚地了解收益的来源、分配的依据以及实际分配的比例。这些规则应当简明易懂,避免过度复杂的法律术语或技术性描述,使得无论是数据提供者、处理者还是使用者都能够轻易理解。同时,应提供明确的指南和说明,帮助参与者理解他们在收益分配中的角色和权益。其次,实施透明的收益分配流程也至关重要。这意味着从收益产生到分配给各方的整个过程都应该是开放和透明的。例如,可以通过在线平台或定期报告的形式,向所有参与者公布收益分配的详细信息。这种做法不仅增加了流程的透明度,还有助于预防和解决可能出现的疑问或争议。最后,为了确保收益分配的公正性,建立一个独立的第三方监督机构是必要的。这个机构应由行业专家、法律顾问和民间代表组成,其职责包括监督收益分配的过程,确保遵循既定的规则和原则。此外,该机构还应具备处理投诉和解决争议的能力,保证在收益分配过程中出现的任何问题都能得到公正和及时的解决。通过建立这样一个结构完善、运行高效的透明和公正的收益分配制度,不仅能够确保所有参与方的合法权益得到保护,还能促进人体基因数据资源的高效利用和健康发展。
此外,随着数据市场和技术的变化,收益分配机制也应是动态调整的,以督促数据要素交易主体不断调整自身行为,实现数据要素市场各相关主体利益的有效平衡。这意味着应定期评估和修订收益分配规则,以适应新的市场环境和技术发展。例如,随着数据分析技术的进步,数据处理者的贡献可能增加,相应的收益分配比例也应进行调整。为了维持共享的持续运行,还需要设计对收益的再投资制度。应考虑将一部分收益用于基因数据相关领域的研究和发展。这不仅有助于推动科研和技术创新,也有利于持续提升人体基因数据的价值和应用前景。在人体基因数据授权运营的收益分配中,将一部分收益用于基因数据领域的研究和发展具有重要的战略意义。这种做法不仅能够推动科学研究和技术创新,还能够为长期提升人体基因数据的应用价值和社会影响力奠定基础。首先,投资于基因数据相关领域的研究能够促进科学知识的积累和技术创新。例如,通过支持基础生物学研究、遗传学研究以及与人类健康和疾病相关的研究,可以增进我们对基因如何影响人类生理和健康的理解。此外,投资于数据分析技术和算法的开发,能够提高数据处理的效率和准确性,从而提升数据的实用价值。其次,这样的投资还能促进人体基因数据的长期可持续发展。随着科研技术的不断进步,对基因数据的需求和应用也在不断扩大。因此,持续的投资不仅可以满足当前的研究需求,还能预见并支持未来的科研方向和需求。例如,投资于数据安全和隐私保护技术的研究,可以增强公众对参与基因数据共享的信心。此外,这种收益的再投资还有助于建立一个积极的反馈循环。随着研究成果的逐渐积累和技术的不断发展,人体基因数据的价值和应用前景将进一步提升。这不仅可以增加数据的市场价值,也能激励更多的人参与数据共享,从而为未来的研究和应用提供更为丰富和多样的数据资源。综上所述,将人体基因数据授权运营的部分收益投入相关领域的研究和发展中,是一个长远而具有战略性的决策。这不仅有助于推动科学研究和技术创新,还能够促进人体基因数据的长期价值提升和可持续发展。
(三)监督与救济制度
在人体基因数据授权运营中,数据的准确性对于确保研究的有效性和避免潜在的风险至关重要。当数据出现不准确的情况时,采取恰当的救济措施是必要的。这些措施不仅涉及技术性的纠正,还包括法律和伦理层面的考量。
第一,需要有完善的技术性纠正制度。当发现数据不准确时,应立即停止使用该数据,并进行彻底的调查以确定数据不准确的原因。这可能包括错误的数据收集方法、数据处理错误或数据传输过程中的问题。一旦原因被确定,应立即采取措施纠正错误,并对已经处理或分析的数据进行重新评估。此外,应增强数据质量控制措施,例如实施更严格的数据审核流程,以防止类似问题的再次发生。
在处理数据准确性问题时,采取技术性的纠正措施应当被视为首要任务。一旦数据的不准确性被发现,关键的第一步是立即停止使用该批次数据。这是因为继续使用不准确的数据可能会导致进一步的分析错误,影响决策的有效性。进行彻底的调查以确定数据不准确的根本原因至关重要。这一过程可能涉及多个层面,包括但不限于:数据收集方法的审查、数据处理步骤的验证以及数据传输过程的检查。例如,可能需要检查是否存在操作失误、软件错误、算法缺陷或者外部干扰等问题。这些都是可能导致数据准确性受损的常见因素。一旦原因被确定,采取针对性的措施来纠正这些错误显得尤为重要。这可能包括修改数据收集程序、更新或修正数据处理算法、增强数据传输的安全性或者对相关人员进行再培训。在纠正措施实施后,对已经处理或分析的数据进行重新评估也是必不可少的一步。这可能涉及重复之前的数据处理和分析流程,以确保所有的决策和结论都建立在准确和可靠的数据基础之上。
此外,为了预防未来类似问题的发生,强化数据质量控制措施是非常关键的。这可能包括实施更严格的数据审核流程、引入更先进的数据监控技术,或者建立更全面的数据管理政策,这也是首席数据官的职能所在。这些措施可以帮助及时识别和纠正数据问题,从而提高数据的整体质量和可靠性。总体来说,确保数据准确性不仅是技术上的挑战,也是管理和政策层面的重要课题。通过综合运用技术手段和管理策略,可以有效提升数据的质量和准确性,为基于数据的决策提供坚实的支撑。
第二,当数据不准确导致的问题涉及个人权益时,应提供合适的法律救济。在处理数据不准确所引发的问题时,特别是当这些问题涉及个人权益,如隐私泄露或其他形式的损害时,提供合适的法律救济措施显得尤为重要。在这方面,有必要强调构建一个全面且健全的法律框架,以确保受影响个人的权益得到充分的保护。在这里可以借鉴已经较为成熟的政府信息公开制度中的相关救济途径。
应明确个人数据权利的法律地位,确保个人在其数据被不当处理或使用时有权获得赔偿,包括但不限于隐私泄露、身份盗用、数据滥用等场景。个人应有权向有关机构申诉,要求纠正不准确的数据,并在必要时寻求赔偿。例如,在个人信息被错误地公开或用于未经授权的目的时,受影响的个人应通过法律途径要求赔偿。
制定相应的程序和指南,指导公民如何提起诉讼或寻求其他形式的救济,以应对数据不准确或者其他来自数据授权运营制度对自身合法权益造成的侵害。这包括指导如何收集和提交相关证据、如何界定数据不准确对个人造成的具体损害,以及如何计算合理的赔偿额。同时,这些程序应尽可能简化和高效,以便受影响个人能够轻松地访问和使用这些法律资源。
强化对数据处理实体的监管和责任,确保必要的预防措施减少数据不准确的风险也是十分必要的。包括定期的数据安全审查、加强对员工的数据处理培训,以及实施严格的数据质量控制措施。在数据不准确导致个人权益受损时,相关实体应承担相应的法律责任,并采取措施防止类似事件的再次发生。
此外,数据跨境流动对于我国人体基因数据造成的挑战也是必须考虑的。在这个领域中,遵照现有科研领域关于人类遗传资源研究中外方单位的规定,面向整个人体基因数据领域制定类似的规范,解决外方获取我国人体基因数据所造成的安全隐患。
确保数据准确性不仅是一个技术问题,更是一个法律和道德问题。通过构建合理的法律框架和程序,可以有效保护个人在数据不准确时的合法权益,同时促进数据处理实体负起相应的社会责任。此外,人体基因数据授权运营制度的构建和完善还有诸多需要研究的问题,例如应急机制的建立,数据垄断风险的规避,这也是未来该领域研究的重要课题。