本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

2020-07-17  阅读 921 次 作者:

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

没有他的发明,我们连嘲笑微软 IE 浏览器的机会都没有;没有他的发明,Google、Amazon、百度、阿里巴巴都不会存在;没有他的发明,你苹果手机的 Siri 可能比现在还蠢。

他是提姆‧伯纳斯─李(Tim Berners-Lee),英国电脑科学家,他的发明叫全球资讯网(World Wide Web,WWW)。

伯纳斯─李不是像「贾伯斯」这种如雷灌耳的名字,但关于他最有噱头的段子又极具 10 万标题的潜力:

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

本文主角伯纳斯─李年轻时。

事实上,没有人是真正的「网路之父」,因为网路并不是单独一个人的发明,说伯纳斯─李是「全球资讯网之父」较準确。伯纳斯─李没有申请专利,不是因为他没有意识到这个发明的价值,而是出于推广全球资讯网的考量。

很多人分不清网路(Internet)和全球资讯网(WWW)的区别,简单理解网路就是全球性,而全球资讯网是我们上网时最常用的入口。举一个不太恰当但容易理解的比喻:

如果把网路当成城堡里的宝石,想拥有它必须从城门进入。你有很多门可选:HTTP 之门、FTP 之门、SMTP 之门……你不用弄懂这些神符一样的英文代表什幺意思,只要知道代表全球资讯网的「HTTP 之门」是门槛最低的门,且这道门的钥匙就是浏览器。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

全球资讯网还没发明前,网路也存在了很多年,但上网并不是件轻鬆愉快的事。那时人们透过拨打伺服器号码上网,入口不是浏览器,没有网页、没有图片、更没有影片,只有下面这种一行文字资讯。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

毫无疑问,全球资讯网是伯纳斯─李最重要的发明,但他这辈子做过的事还有很多,比如成立全球资讯网联盟、提出语义网、呼吁数据公开、成立社交网路数据平台,但都紧紧围绕同一个主题:打破「资讯、数据之墙」,促进开放互通。

诞生全球资讯网的福地,是个看似和电脑没关係的地方

伯纳斯─李从小就是电脑迷,父母都曾参与世上第一台商业电脑「曼彻斯特‧马克一号」(Manchester Makr I)的设计研发,让他从小就对电脑知识耳濡目染。

1973~1976 年,他在牛津大学女王学院学习物理专业。大学期间,由于违反规定被禁止使用学校电脑,他自己动手用一台电视、一个摩托罗拉旧型微处理器(Motorola 6800)、一根焊接棒,拼成一台电脑。

1976 年大学毕业后,伯纳斯─李在不同公司担任程式设计师,但每份工作都持续不了多久。1980 年 6~12 月,伯纳斯─李以谘询顾问的身分,在欧洲核子研究中心从事软体工程工作。欧洲核子研究中心是物理界着名的研究所,也是发现「上帝粒子」(希格斯玻色子)的地方。

1980 年的欧洲核子研究中心,是一个资讯需要高频率交换,但又充满各种「资讯围墙」的地方:1 万人在这里来来往往,其中只有 3 千名左右是研究所员工,其余都是世界各地研究院的人员。他们使用不同电脑、不同网路、不同资料格式、不同档案系统。

身为软体工程师,伯纳斯─李需要帮助这些研究人员连上不同电脑,执行不同软体程式,在不同格式的档案中找到有关联的数据,这个过程「让人充满了挫败感」。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

为了改变局面,伯纳斯─李打造了基于超文件的索引系统 Enquire,帮研究人员在不同电脑里迅速找到资讯,儘管只是单机程式,还有很大的局限性。

Enquire 的底层技术「超文件」,最早于 1963 年提出,1976 年发明后投入使用。超文件如今在网路随处可见,我们可为文字加上连结,点击后跳转到网页、档案或档案的某处。某种意义上,基于超文件的 Enquire 就是全球资讯网的原型。

伯纳斯─李很快又离开了欧洲核子研究中心,加入一家电脑公司,参与远端网路呼叫设计,因而获得网路设计经验。1984 年,他以研究员身分重返欧洲核子研究中心工作。

为什幺伯纳斯─李没有申请「全球资讯网」的专利?

回到欧洲核子研究中心的伯纳斯─李,已具备了开发全球资讯网的条件:超文件和网路设计经验、超强的执行能力、开放的思维方式,再加上欧洲核子原子中心这个天然实验场。

外部环境也已成熟:TCP/IP 协定、域名系统等底层技术逐渐完善,降低普通人上网门槛的需求也越来越强烈。

1989 年 3 月,伯纳斯─李萌生了将超文件系统和网路结合,创造一个全球性超文件连接网路的想法:

伯纳斯─李撰写了提案,交给主管迈克‧森道尔(Mike Sendall),后者并没有非常感兴趣,只在提案封面写了简评:不太明确,但令人激动……(Vague, but exciting…)18 个月后,迈克才允许伯纳斯─李兼职做提案,但只是抱着试试看的心态。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

 伯纳斯─李提案的封面,右上角有当时主管的评价。

伯纳斯─李很快开始动手写程式,到 1990 年圣诞,他基本上定义了 Web 的基本概念:HTTP(超文字传输安全协定)、HTML(超文件标示语言)、URL(统一资源定位符)。你不用了解这 3 个名词的技术如何达成,只需要知道:

这 3 样东西结合起来,塑造了我们今天习以为常的上网方式:在位址栏输入网页位址,便能转到相应网页;如果该档案有超连接,还能点击它跳转。相互有关的资讯透过「点击─跳转」连起来了。

1991 年 8 月,伯纳斯─李开放他发明的第一个网页浏览器,并上线世界第一个网页

这个网页非常简单,抬头 3 个大字:World Wide Web。手稿介绍全球资讯网是什幺、所用的技术、参与计画的人、计画的历史等。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

 世上第一个网页。

值得一提的是,全球资讯网计画参与者中,名为罗伯特·卡里奥(Robert Cailliau)的资讯工程师长期使用 Hypercard,这是苹果 1987 年发表、2004 年关停的超文件系统,透过卡里奥间接影响了全球资讯网的设计。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

 苹果电脑以前的超文件系统 Hypercard。

全球资讯网发明后,伯纳斯─李并没有申请专利,因为他很清楚,「开放」是全球资讯网普及的前提,「你无法计画做一个宇宙一样大的空间,同时保持控制」。

全球资讯网开放大众的 1991 年,同时诞生的还有明尼苏达大学的 Gopher。Gopher 在后来和全球资讯网的竞争中落败,部分原因就是收费策略。

事实上,伯纳斯─李确实曾考虑为自己的发明申请专利,但不是全球资讯网而是浏览器。最后,他还是因为自己「开放互联」的价值观放弃了这做法。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

「几百万人突然发现全球资讯网可能比性爱还棒」

诞生头两年,全球资讯网并没有多少人用。不管伯纳斯─李怎幺努力推广,每天只有 10~100 次点击率,就连技术社群也不接纳全球资讯网。

他将全球资讯网相关论文提交给超文件社群 Hypertext’91,但被拒绝了。全球资讯网在他们看来太简单了,且违背社群规则。

当时,超文件社群的信仰是,连结不应指向不存在或已移除的档案,因此当时其他一些超文件系统都约束在一个单独、孤立的资料程式库里。

而全球资讯网是全球性的开放系统,如果某个伺服器坏了或某个档案(网页)被移除,连结就成了坏链。全球资讯网的开放性在超文件社群看来,反而成了亵渎信仰。

改变出现在 1993 年,这一年 Mosaic 浏览器问世。Mosaic 浏览器是第一个可在文字中插入图片,而不是在单独网页显示图片的浏览器。它支援全球资讯网、Gopher 等多个网路标準,且拥有友善的用户介面、简易的安装步骤、可靠的效能。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

 Mosaic 浏览器。

Mosaic 浏览器发表时,市面有好几个竞争者如 Erwise、ViolaWWW、MidasWWW 和 tkWWW,但种种特徴使它脱颖而出、大受欢迎,并带动全球资讯网流行,「几百万人突然发现全球资讯网可能比性爱还棒」。

全球资讯网真正使网路由少数精英使用的资讯传送管道,变成全世界共用的资讯共用平台。1993 年后,越来越多公司开始在全球资讯网的基础上提供服务、做生意,全球资讯网重塑世界经济的故事不必再述。

全球资讯网影响力逐步增加同时,伯纳斯─李也获得了肯定:2004 年获得大英帝国爵士级司令勋章、2017 年获得电脑科学领域最负盛名的奖项──图灵奖。

对任何人来说,取得如此成就已可躺在功劳簿上睡大觉,但伯纳斯─李真是闲不下来,他对网路的贡献远不止全球资讯网这个发明。

苹果手机的 Siri,也得益于伯纳斯─李的工作

伯纳斯─李 1989 年的提案中,全球资讯网「不仅是文件档的网路,也是知识的网路」。

全球资讯网首先透过超文件连结做到档案(网页)互连,到了 1998 年,伯纳斯─李正式将「知识网路」的构想命名为语义网(Semantic Web),并将工作重心放在推广语义网。

语义网是全球资讯网的变革和延伸,目的是让电脑也能像人类一样了解网页内容。

比如,人们看到网路天气预报,会知道哪个数字是温度,哪个是湿度。语义网的目的就要透过隐藏的编码,告诉电脑哪个数字代表温度,哪个数字代表湿度,并说明 「温度」 和「湿度」的含义。

2006 年,语义网发展到了瓶颈,需要大量结构化的公开资料,伯纳斯─李提出互联资料(Linked Data)的概念,还在 2009 年 TED 大会呼吁政府和机构公开原始数据(Raw Data)。同年,白宫成立一个网站 Data.gov,要求所有部门都要有公开资料。

大量资料公开后,有机构将资料结构化,这些结构化的互联资料库默默影响着人工智慧的发展。

2011 年,IBM 的人工智慧 Watson 在美国电视智力竞赛节目《危险边缘》(Jeopardy!)击败人类选手,获得百万美元大奖,就是採用 DBpedia(维基百科的结构化资料程式库)、YAGO(整合 Wikipedia、WordNet 和 GeoNames 三个来源的资料程式库)等成果。

2012 年,Google 收购一家做结构化资料的公司 Metaweb,于后者资料程式库 Freebase 的基础上发起知识图谱(Knowledge Graph)计画。苹果的 Siri,也是脱胎于基于语义网的计画 CALO(Cognitive Assistant that Learns and Organizes)。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

右侧红框圈起来的就是语义网应用。

一个帐号登入所有应用,不怕应用倒闭的新平台

儘管伯纳斯─李一直推动网路往开放方向发展,但「数据围墙」现象还是以另一种形式重现:科技公司借免费服务将用户控制在自己的应用产品内,用户的资料分散在各平台,更无力保护隐私。

矛盾最近几年集中爆发,标誌性事件莫过于今年 Facebook 爆出 2016 年时保护隐私不力,让剑桥分析公司未经授权存取 5 千万用户资料。社会开始出现批评科技公司、将数据还给用户的声音。

在这时间点,伯纳斯─李的新计画恰逢其时。2018 年 9 月 29 日,他发表一篇名为《网路的一小步……》文章,宣布成立基于 Solid 平台的新创公司 Inrupt。

2015 年,伯纳斯─李就在麻省理工启动 Solid 计画。Solid 全称为社交互联资料(Social Linked Data),是一个去中心化的社交平台,基于 2006 年提出的互联资料技术和规格。

现在我们使用社交平台的现状是,Google 有帐号、Facebook 有帐号、Twitter 有帐号、Instagram 有帐号,此外可能还有微信、QQ、微博等。每个帐号的资料都独立存在营运方的伺服器,互不相通。

这有两个显而易见的弊端:1. 用户资料掌握在营运方手里,有被滥用的可能;2. 如果营运方经营不善或关停服务,那用户在这个社交平台的资料也付诸流水。Path 和 Google+ 关停,就是最好的例子。

Solid 的解决方案把用户资料和应用分开,让用户集中自己的资料,称之为「个人线上资料」(Personal Online Data,简称 POD)。然后,将 POD 存在自己建的伺服器,或受信任的个人线上资料商(Personal Online Data Stores,简称 PODS)。

用户会有一个 Web ID,可登陆所有基于 Solid 平台的应用,用户能自己控制给哪个应用多少资讯。

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

目前,Solid 平台还处于原型阶段,主要针对开发者。伯纳斯─李用 Solid 平台的技术打造一款自己使用的应用,一家外媒看过后评价:

本有机会成为世界首富的人,想帮你把资料从科技公司手中夺回来

至于 Inrupt,是帮助 Solid 平台成长的新创公司。Inrupt 之于 Solid,好比 Mosaic 浏览器之于全球资讯网,是领路人角色。伯纳斯─李希望 Inrupt 能为 Solid 带来「生态系统」,其中的市场机会包括 Solid App 和 Solid 资料储存等。

伯纳斯─李已向麻省理工学院请长假,专心在开发者群体推广 Solid 和 Inrupt。这是他又一次转变工作重心。过去,伯纳斯─李一直致力透过全球资讯网、语义网网路公开资讯,现在他尝试透过 Solid 来连结个人资讯、解决科技大公司垄断用户数据的问题。

这不是短期内可看到成效的专案:社交巨头和网路公司不会将用户帐号数据拱手相让,使用户个体自发迁移也需要极大的教育成本。但正如全球资讯网刚诞生时没人关注,谁也不知道 Solid 会不会成为下一棵参天大树。

上一篇:
下一篇: