人工智能带来的隐私威胁不在于它“学到了什么”,而在于它“琢磨出啥新花样”(观点)
(大中网/096.ca讯)加拿大环球邮报(Globe and Mail)发表了一篇Michael Geist的评论。他是渥太华大学法学院互联网与电子商务法的主席。评论说,1997年,一位来自麻省理工学院(MIT)的研究生斯威尼(Latanya Sweeney)的发现震惊了隐私部门。她将公开的选民登记信息与已去除姓名和地址的医院记录进行匹配,从而识别出当时马萨诸塞州州长 “匿名的”医疗记录。三年后,她进一步证明,仅凭三个数据——邮政编码、出生日期和性别——就可以唯一识别出美国87%的人口。
斯威尼的研究深刻影响了全球的隐私保护意识,各国随后制定了“去标识化”(de-identification)标准,通过删除明显身份信息、应用统计测试,并将处理后的数据视为可安全使用的数据来控制风险。事实上,现代隐私监管的一个核心前提是:去标识化数据可以在不损害个人隐私的情况下被研究、披露并商业化。
人工智能(AI)已经打破了这一前提。具备实时搜索和推演能力的AI系统,如今可以在几分钟内完成过去需要专业研究人员数天才能完成的工作。来自瑞士苏黎世联邦理工学院(ETH Zurich)2月的一项研究显示,AI 可以将匿名网络账户与现实身份匹配,准确率高达90%,几分钟内即可完成原本需要熟练调查员数小时的任务。斯威尼当年指出的漏洞,如今正迅速成为任何拥有互联网和AI聊天工具的人都可以利用的能力。
这对加拿大而言尤为紧迫。联邦人工智能部长所罗门(Evan Solomon)已承诺推出新版的国家AI战略,其中将包含现代化的隐私规则。虽然重新讨论传统的加强保护措施看似是自然选择,但AI正在以新的方式重塑隐私议题。我们必须明白AI的输入端和输出端的隐私挑战是什么。
在输入端,全球范围内正明显转向对用于AI训练的个人信息采取更宽松的处理方式。日本刚刚修改隐私法,明确想成为全球最容易发展AI的国家,用“选择退出”(opt-out)机制取代事先同意要求,类似于电子邮件营销中的邮件“退订链接”。英国近期放宽了自动化决策的限制,并扩大了科研豁免范围。欧盟也提出新规,放宽AI模型训练的数据处理规则。全球主要隐私监管辖区正在放松规则以适应AI发展,这是毋庸置疑的。加拿大也将面临跟进的压力。
相比之下,AI的输出端带来的隐私挑战关注较少,但可能更为深远。问题不在于输入AI系统的个人数据,而在于AI输出了什么样的个人信息。现代AI系统可以从多个来源获取公开数据,将原本单独看似无害的碎片拼接起来,推断出完成的个人信息。
这对处于加拿大隐私法改革核心的“去标识化”框架意味着什么?此前的立法建议曾禁止机构对去标识化数据进行再识别,但这种禁止针对的是“有意的”再识别行为(re-identification)。它并未设想过,AI系统可以在日常提示操作中,轻易从互联网各处零散的数据碎片中重构出一个人的身份。
加拿大的应对之道,可能需要对AI的输入端和输出端采取不同策略。在普遍适用的限制和有意义的透明度基础上,对训练数据输入采取更宽松的政策,或许可以在不放弃核心价值的前提下保持竞争力。但这种输入端的灵活性,必须配套针对AI输出端危害的真正创新性监管方法。这意味着我们要超越对“有意的”再识别的抵触,转向应对 AI 重构个人信息的监管。
问责机制、推断审计以及对推断性个人画像的汇总与披露限制,都应成为监管体系的一部分。
加拿大隐私领域的专家和政策制定者对这一转变反应迟缓,仍主要将讨论集中在避免个人信息进入AI系统。但如果加拿大的AI战略和隐私改革要真正应对当下挑战,就必须直面更艰难的现实:我们几十年来所理解的“去标识化”可能已经失效,而关于隐私的讨论也需要发生根本性的改变。


