cover_image

个人数据存储时机已到

Kurt Pan XPTY
2025年10月07日 16:28

原文:https://blog.muni.town/personal-data-storage-idea/

译者:Kurt Pan

当数据主要由人民管理的机构而非公司掌握时,关于数据所有权的讨论会发生变化。

2009 年,Tim Berners-Lee 起草了一份关于“具备社交感知的云存储”的网络规范:

有一种架构,将一些现有或网络协议结合在一起,通过一些粘合机制,构建一个全球系统,使得应用程序(桌面或网络应用)能够在一层通用的读写存储之上运行。

关键的设计问题在于,主体(用户)和群组通过 URI 来标识,因此具有全球范围的作用,并且存储元素的访问控制是使用这些全球标识符来实现的。其结果是,存储成为一种与运行其上的应用程序无关的通用资源。

  • https://www.w3.org/DesignIssues/CloudStorage.html

在 2000 年代末期,在 Facebook 等“web2”巨头爆炸式增长之后不久,这些想法中的几个开始流传。

当时另一个在精神上类似的理念来自 Opera 浏览器团队,他们希望在浏览器中放置“一个网页服务器”。

  • https://arstechnica.com/information-technology/2009/06/opera-hoping-to-reinvent-the-web-by-making-browser-a-server/

虽然“Opera Unite”从未完全实现,但在几年后的某个时期,随着一场又一场隐私危机的爆发,Tim 的规范获得了显著的关注,这些危机使得加强网络自主权的理由变得显而易见。

2015 年,Tim 和团队为 Solid 协议获得了一些资金支持。

  • https://www.csail.mit.edu/news/web-inventor-tim-berners-lees-next-project-platform-gives-users-control-their-data

目前我们处于最糟糕的境地,人们不仅无法控制自己的数据,而且由于数据分散在许多不同的封闭网站上,实际上也无法真正使用它。我们的目标是开发一种网络架构,让用户拥有自己的数据,包括自由切换到新的应用程序,以寻找更好的功能、价格和政策。”

  • https://www.wired.com/2017/04/tim-berners-lee-inventor-web-plots-radical-overhaul-creation/

在 Berners-Lee 设想的更优质网络中,用户可以控制他们的数据存储位置以及访问方式。例如,社交网络仍然会在云端运行,但你可以将数据存储在本地。或者,你也可以选择由你信任的公司或社区运营的其他云服务器。

你可能会为不同类型的信息使用不同的服务器——比如健康和健身数据——这些服务器与用于存储财务记录的服务器完全分开。

直到今天,Tim 依然雄辩地倡导着 Solid 愿景的优点。

  • https://www.theguardian.com/technology/2025/sep/28/why-i-gave-the-world-wide-web-away-for-free

我们已经具备将这种权力交还给个人的技术能力。Solid 是我和我的团队十多年前在麻省理工学院开发的一个开源、可互操作的标准。运行在 Solid 上的应用程序不会隐性地拥有你的数据——它们必须向你请求,你可以选择同意或拒绝。与其让你的数据分散在互联网上无数不同的地方,被转卖给不知名的第三方,不如将它集中在一个由你掌控的地方。

以聪明的方式分享你的信息也能让其获得自由。为什么你的智能手表要将你的生物数据写入一个格式单一的孤立系统?为什么你的信用卡要将你的财务数据写入另一个格式不同的孤立系统?为什么你的 YouTube 评论、Reddit 帖子、Facebook 更新和推文都存储在不同的地方?为什么默认的预期是你不应该能够查看这些内容?你创造了所有这些数据——你的行为、你的选择、你的身体、你的偏好、你的决定。你应该拥有它。你应该因它而获得力量。

Solid 协议依然是一个极佳的理念,甚至已经发展成了官方的网络规范,但 Solid 尚未在网络上实现主流应用。它的主要资金赞助商 Inrupt(Tim 是联合创始人兼 CTO)将重点放在企业市场,以此作为可持续发展的路径;至于会有多少资源投入到 Solid 的网络规模应用,还有待观察。

  • https://solidproject.org/
  • https://www.w3.org/2024/09/linked-web-storage-wg-charter.html
  • https://www.inrupt.com/

值得庆幸的是,那些希望在网络应用中拥有数据所有权和自主权的人,现在不必再等待。AT 协议由 Bluesky 团队推出,目前其网络已拥有超过 3000 万用户,并且正日益扩展到多个联邦化平台/社区,如 Blacksky 或 Tangled。

  • https://atproto.com/
  • https://bsky.social/
  • https://blackskyweb.xyz/
  • https://tangled.org/

虽然 Solid 和 AT 协议的架构差别很大,但它们都指向同一个开放社交网络——基于用户主权数据存储原则重新构建的网络。

个人数据存储

从 atproto 的视角来看,网络用户主权在实践中的样貌已被 danabra.mov 精妙地呈现出来

  • https://danabra.mov/
  • https://overreacted.io/open-social/

注意,Alice 的用户名现在是 @alice.com 。它并不是由社交媒体公司分配的 [比如 facebook.com/alice],而是她的通用“互联网用户名”,即一个域名。Alice 拥有 alice.com 域名,因此她可以在任何开放社交应用上使用它作为用户名。(在大多数开放社交应用上,她使用 @alice.com ,但在其他平台上她希望拥有一个独立且不关联的身份,所以她还拥有另一个不想公开的用户名。)

Bob 也拥有一个域名,尽管他并不懂技术。他甚至可能不知道“域名”是什么。Bob 只是把 @bob.com 当作他的“网络昵称”。一些开放社交应用会在注册时为你提供一个免费的子域名,就像 Gmail 会给你一个免费的 Gmail 地址,或者可能提供额外的流程来购买域名。你并不会被锁定在第一次的选择上,之后可以更换成不同的域名。

(……)在开放社交中,Alice 的数据——她的帖子、点赞、关注等——是托管在网络本身上的。除了她的个人网站,Alice 现在还有一个属于她自己的数据仓库。

这种新范式在技术上能得以实现,是因为 AT 协议所称的个人数据服务器(Personal Data Server,简称 PDS)(Solid 则称之为 Pod)。

  • https://atproto.wiki/en/wiki/reference/core-architecture/pds
  • https://solidproject.org/faq#pod

“PDS”这个概念很快就会让人觉得非常技术化、极客化,这也是为什么 Dan 的说明文中一次都没有提到它,尽管目标受众仍然是网络极客。但实际上,这里唯一稍显晦涩的词是“服务器”,在这个语境中它可以与“存储”互换使用,即个人数据存储。

即使是普通的互联网用户,也对个人化数据存储的含义有一定的心理认知,尤其是面对集体所有和运营的数据存储这一互补框架的时候。

数据银行合作社

如果你是普通的互联网用户,PDS(个人数据存储)范式并不会将你的数据从云端转移到你的个人电脑。大多数人仍会依赖机构化的云服务,但与其将数据存储在股东控制的公司,不如将大多数人的数据托付给类似于会员所有的信用合作社的数据存储机构。

  • https://en.wikipedia.org/wiki/Credit_union

美国每三位成年人中就有一位在信用合作社开户。考虑到我们在大型银行的集体经验与在大型科技/社交平台上的经历极为相似,实现数据存储方面相同甚至更高的比例并非不可想象。

数据合作社的概念在联邦宇宙(fediverse)中已经获得了广泛关注,像 social.coop、data.coop 和 cosocial.ca 等多个提供商已经运营多年并且依然活跃。很快,AT 网络也将拥有一个类似的共同所有机构——Northsky。

  • https://www.cip.org/blog/data-cooperatives
  • https://social.coop/
  • https://data.coop/
  • https://cosocial.ca/
  • https://northskysocial.com/

不过,这些提供商是否在形式上严格属于合作社并不是这里最重要的;任何足够透明、民主且以社区为导向的数据银行(如前文提到的 Blacksky,或即将推出的 Eurosky)都是开放社交的合法管理者和共同创造者。

当数据主要存放在由人民管理的机构而非公司时,关于数据所有权的讨论就会发生变化。平台不应再争论我们可以从企业数据孤岛中下载哪些数据,而是应该询问我们,他们可以从我们的服务器复制哪些数据,并且只能在严格的临时许可下进行。

虽然目前用户数据与社交平台的分离在 AT 网络中得到了最充分的实现,但在 atproto 的前身 ActivityPub 的持续发展中,已经出现了令人振奋的跨域融合迹象。我希望在 Solid 中也能看到类似的对技术融合的开放态度,以实现更加多元化的社交网络。

  • https://en.wikipedia.org/wiki/ActivityPub
  • https://activitypub.rocks/
  • https://writings.thisismissem.social/statement-on-discourse-about-activitypub-and-at-protocol/

个人数据存储早已不再局限于某个特定协议的概念。它的一些实现方式会比其他方式更为主流,但务实的数据合作社可以不依赖特定协议,存储格式也可以相互转换。

只要我们对自己的数据拥有足够的控制权,在平台崩溃的情况下,我们总能找到方法在其他地方重建我们的社交关系网和数字存在。让我们让网络再次属于个人。