您当前的位置: 首页 > 旅游

这个本有机会成为世界首富的人想帮你把数据

2019-03-10 10:48:44

没有他的发明,我们连嘲笑微软 IE 浏览器的机会都没有;没有他的发明,Google、Amazon、百度、阿里巴巴都不会存在;没有他的发明,你苹果上的 Siri 可能比现在还要蠢。

他是蒂姆·伯纳斯-李(Tim Berners-Lee),一位英国计算机科学家,他的发明叫万维(World Wid Web)。

伯纳斯-李不是一个“乔布斯”般如雷贯耳的名字,但关于他最有噱头的段子又极具 10 万+ 标题的潜力:

“互联之父”本可碾压比尔·盖茨成为世界首富,但他竟没有为发明申请专利!

假如申请发明专利,世界首富不是盖茨而是他!

如果他愿意,二十年前就能成为世界首富!

这个就是本文的主人公:伯纳斯-李事实上,没有人是真正的“互联之父”,因为互联并不是一个单独的发明,说伯纳斯-李是“万维之父”比较准确。伯纳斯-李没有申请专利,不是因为他没有意识到这个发明的价值,而是出于推广万维的考虑。

很多人分不清互联(Internet)和万维(World Wid Web)的区别,简单理解互联就是一个全球性的络,而万维是我们使用互联最常用的入口。做一个不太恰当但容易理解的比喻吧:

如果把互联当成围城里的宝石,想要拥有它必须从城墙门口进入。你有很多个门可以选择:HTTP 之门、FTP 之门、SMTP 之门......你不用弄懂这些神符一样的英文代表了什么,只需要知道代表了万维的“HTTP 之门”,是门槛最低的那道门,而这道门的钥匙就是浏览器。

原来我的灵魂画风......在万维没有被发明前,互联已经存在了很多年,但上并不是一件轻松愉快的事。那时人们通过拨打服务器号码上,入口不是浏览器,没有页、没有图片、更没有视频,只有像下面这样的一行行文字信息。

毫无疑问,万维是伯纳斯-李最重要的发明,但他这一辈子做的事情还有很多,比如成立万维联盟、提出语义、呼吁数据公开、成立社交互联数据平台,但都紧紧围绕同一个主题:打破“信息、数据之墙”,促进开放互联。

诞生万维的福地,是一个看似和计算机没啥关系的地方伯纳斯-李从小是一个计算机迷。他父母都曾经参与了世界上第一台商业电脑“曼彻斯特·马克一号”(Manchester Makr I)的设计研发,这让他从小就对计算机知识耳濡目染。

1973 年-1976 年,他在牛津大学女王学院学习物理专业。大学期间,由于违反规定被禁止使用学校的计算机,他自己动手用一台电视、一个摩托罗拉旧的微处理器(Motorola 6800)、一根焊接棒,拼出了一台计算机。

1976 年大学毕业后,伯纳斯-李在不同公司担任程序员,但每一份工作都持续不了很长时间。1980 年 6 月-12 月,伯纳斯-李以咨询顾问的身份,为欧洲核子研究中心从事软件工程方面的工作。欧洲核子研究中心是物理界一个著名的研究所,也是发现“上帝粒子”(希格斯粒子)的地方。

1980 年的欧洲核子研究中心,是一个信息需要高频交换、但又充满了各种“信息围墙”的地方:一万人在这里来来往往,其中只有 3000 名左右是这间研究所的员工,其余都是来自世界各地的研究院。他们用着不同的电脑、不同的络、不同的数据格式、不同的文件系统。

作为一个软件工程师,伯纳斯-李需要帮助这些研究人员连接上不同的电脑,运行不同的软件程序,在不同格式的文件中找到有联系的信息,这个过程“让人充满了挫败感”。

为了改变这种局面,伯纳斯-李打造了一个基于超文本的索引系统 Enquire,可以帮研究人员在不同的电脑中迅速找到信息,尽管它还只是一个单机程序、有很大的局限性。

Enquire 的底层技术“超文本”,最早于 1963 年被提出,于 1976 年被发明出来投入使用。超文本如今在互联上随处可见,我们可以为文字加上链接,点击后便可跳转到相应的页、文件或文档的某一处。某种意义上,基于超文本的 Enquire 就是万维的原型。

伯纳斯-李很快又离开了欧洲核子研究中心,加入了一家电脑公司,参与远程络呼叫设计,因而获得了络设计经验。1984 年,他以研究员的身份重返欧洲核子研究中心工作。

为什么伯纳斯-李没有给“万维”的发明申请专利?回到欧洲核子研究中心的伯纳斯-李,已经具备了开发万维的条件:超文本和络设计经验、超强的动手能力、开放的思维方式,再加上欧洲核子原子中心这样一个天然的实验场。

外部环境也已经成熟:TCP/IP 协议、域名系统等底层技术逐渐完善,降低普通人上门槛的需求也越来越强烈。

1989 年 3 月,伯纳斯-李萌生了将超文本系统和络结合在一起、创造一个全球性超文本链接络的想法:

万维需要的技术,例如超文本系统、因特和多种字体的文字文件,都已经被设计出来了。我只需要把他们结合在一起......把现在的文件系统都想象成大型虚拟文件系统的一部分。

伯纳斯-李撰写了一个提案交给自己的主管迈克·森道尔(Mike Sendall),后者当时并没有非常感兴趣,只在提案的封面上写下一栏简短的评语:不太明确,但令人激动......(Vague, but exciting...)。18 个月后,迈克才允许伯纳斯-李兼职实现这个提案,但只是抱着试试看的心态。

伯纳斯·李提案的封面,右上角写有当时主管的评价伯纳斯-李很快开始动手编码,到 1990 年圣诞,他基本上定义了 Web 的基本概念:HTTP(超文本传输协议)、HTML(超文本标记语言)、URL(统一资源定位符)。你不用了解这三个名词的技术实现,只需要知道:

HTTP 超文本传输协议:负责传输信息HTML 超文本标记语言:负责在页上显示信息URL 统一资源定位符:负责给每一个页一个地址,方便你找到它这三样东西结合起来,塑造了我们今天习以为常的上方式:在地址栏输入页的地址,便能跳转到相应的页;如果该文档上有超链接,还能点击它进行跳转。相互关联的信息通过“点击-跳转”联系了起来。

1991 年 8 月,伯纳斯-李将他发明的第一个页浏览器开放给了公众,并且上线了世界上第一个页:。

这个页非常简单,抬头三个大字:World Wide Web。正文介绍了万维是什么、所用的技术、参与项目的人、项目的历史等。

世界上第一个页值得一提的是,万维项目参与者中,

这个本有机会成为世界首富的人想帮你把数据

有一位名为罗伯特·卡里奥(Robert Cailliau)的信息工程师,他长期使用着Hypercard,这是一个苹果 1987 年发布、2004 年关停的超文本系统,通过卡里奥间接影响了万维的设计。

苹果电脑以前的超文本系统 Hypercard万维发明出来后,伯纳斯-李并没有申请专利,因为他自己清楚得很,“开放”是万维普及的前提,“你不能计划着做一个宇宙一样大的空间,同时保持控制”。

万维开放给公众的 1991 年,同时诞生的还有明尼苏达大学的 Gopher。Gopher 在后来和万维的竞争中落败,部分原因就是收费策略。

事实上,伯纳斯-李确实曾经考虑过为自己的发明申请专利,但不是万维而是浏览器。最后,他还是因为自己“开放互联”的价值观放弃了这个做法。

“几百万人突然发现万维可能比性爱还要棒”诞生头两年,万维其实并没有多少人用。不管伯纳斯-李怎么努力推广,每天只有 次点击率,就连技术社区也不接纳万维。

他将万维相关论文提交给了一个超文本社区 Hypertext'91,但被拒绝了。万维在他们看来太简单了,并且违背了社区规则。

当时,超文本社区的信仰是,链接不应该指向不存在或已删除的文件,因此当时其他一些超文本系统都被约束在一个单独、孤立的数据库里。

而万维是一个全球性的开放系统,如果某个服务器坏了或某个文档(页)被删除了,链接就成了坏链。万维的开放性在超文本社区看来,反而成了对信仰的亵渎。

改变出现在 1993 年,这一年 Mosaic 浏览器面世。Mosaic 浏览器是第一个可以在文字中插入图片,而不是在单独页中显示图片的浏览器。它支持万维、Gopher 等多个络标准,并且拥有友好的用户界面、简易的安装步骤、可靠的性能。

Mosaic 浏览器Mosaic 浏览器发布之时,市面上有好几个竞争者如 Erwise、ViolaWWW、MidasWWW 和 tkWWW,但种种特性使它脱颖而出、大受欢迎,并带动了万维的流行,“几百万人突然发现万维可能比性爱还要棒”。

万维真正使得互联由少数精英使用的信息传输渠道,变成了供全世界共用的信息共享平台。1993 年后,越来越多的公司开始在万维的基础上提供服务、做生意,万维重塑世界经济的故事不必再述。

万维影响力逐步加大的同时,伯纳斯-李也获得了相应的肯定:2004 年获得大英帝国爵级司令勋章、2017 年获得计算机科学领域的最负盛名的奖项——图灵奖。

对于任何一个人来说,取得如此成就已经可以躺在功劳簿上睡大觉,但伯纳斯-李真是闲不下来,他对互联的贡献远不止万维这个发明。

苹果上的 Siri,也得益于伯纳斯-李的工作在伯纳斯-李 1989 年的提案中,万维“不仅是一个文本文档的互联络,也是一个知识的互联络”。

万维首先通过超文本链接实现了文档(页)的互联,到 1998 年,伯纳斯-李正式将“知识互联络”的构想命名为语义(Semantic Web),并将自己的工作重心放在推广语义上。

语义是万维的变革和延伸,它的目的是让计算机也能像人类一样了解页上的内容。

比如,人们看到页上的天气预报,会知道哪个数字是温度,哪个是湿度。语义的目的就要通过隐藏的编码,告诉计算机哪个数字代表温度,哪个数字代表湿度,并且说明 “温度” 和“湿度”的含义。

2006 年,语义发展到了一个瓶颈,需要大量结构化的公开数据,伯纳斯-李提出了互联数据(Linked Data)的概念,还在 2009 年的 TED 大会上呼吁政府和机构公开原始数据(Raw Data)。同年,白宫成立了一个站 ,要求所有的部门都要有公开数据。

大量数据公开后,有机构把它们进行了结构化,这些结构化的互联数据库默默影响着人工智能的发展。

2011 年,IBM 的人工智能沃森(Watson)在美国电视智力竞赛节目《危险边缘》(Jeopardy!)中击败人类选手,获得百万美元大奖,就是采用了 DBpedia(维基百科的结构化数据库)、YAGO(集成 Wikipedia、WordNet 和 GeoNames 三个来源的数据库)等成果。

2012 年,Google 收购了一家做结构化数据的公司 Metaweb,在后者数据库 Freebase 的基础上发起了知识图谱(Knowledge Graph)项目。苹果的 Siri,也是脱胎于一个基于语义的项目 CALO(Cognitive Assistant that Learns and Organizes)。

右侧红框圈起来的就是语义的应用一个账号登上所有应用、不怕应用倒闭的新平台尽管伯纳斯-李一直推动络往开放互联的方向发展,但“数据围墙”的现象还是以另一种形式重现了:科技公司借助免费服务将用户控制在自己的应用内,用户的数据分散在各个平台,更无力保护自己的隐私。

矛盾在最近几年集中爆发了,标志性事件莫过于今年 Facebook 被曝出 2016 年时保护隐私不力,让剑桥分析公司得以未经授权访问 5000 万用户数据。社会开始出现一股批评科技公司、将数据还给用户的思潮。

在这样的时间节点,伯纳斯-李的新项目恰逢其时。2018 年 9 月 29 日,他发布了一篇名为《互联的一小步......》的文章,对外宣布成立一家基于 Solid 平台的初创公司 Inrupt。

2015 年,伯纳斯-李就在麻省理工启动了 Solid 项目。Solid 全称社交互联数据(Social Linked Data),是一个去中心化的社交平台,基于 2006 年提出的互联数据(Linked Data)的技术和规范。

现在我们使用社交平台的现状是,有个账号、 有个账号、微博有个账号,此外还有 Twitter、Facebook等。每个账号的数据都独立保存在运营方自己的服务器里,互不打通。

这样有两个显而易见的弊端:1.用户数据掌握在运营方手里,有被滥用的可能;2.如果运营方经营不善或者关停服务,那用户在这个社交平台的数据也将付诸东流。Path 和 Google+ 的关停,就是最好的例子。

Solid 的解决方案把用户数据和应用分离开了,让用户把自己的数据都集中在一起,称之为“个人数据”(Personal Online Data,简称 POD)。然后,将 POD 储存在自己建的服务器,或者受信任的个人数据商(Personal Online Data Stores,简称 PODS)。

用户会有一个 WebID,可以登陆所有基于 Solid 平台的应用,用户能自己控制给哪个应用多少信息。

目前,Solid 平台还处于原型阶段,主要面向开发者。伯纳斯-李用 Solid 平台的技术打造了一款自己使用的应用,国外一家媒体看过后评价道:

这款应用程序,使用了 Solid 的去中心化技术,允许伯纳斯-李无缝访问他的所有数据——他的日历、音乐库、视频、聊天记录、研究。它就像 Google Drive,Microsoft Outlook,Slack,Spotify 和 WhatsApp 的混合体。

至于 Inrupt,是帮助 Solid 平台成长的一个初创公司。Inrupt 之于 Solid,好比 Mosaic 浏览器之于万维,是一个领路人的角色。伯纳斯-李希望 Inrupt 能够为 Solid 带来一个 “生态系统”,其中的市场机会包括 Solid APP 和 Solid 数据存储等。

伯纳斯-李本人已经向麻省理工学院请了长假,专心在开发者群体中推广 Solid 和 Inrupt。这是他又一次转变工作重心。过去,伯纳斯-李一直在致力于通过万维、语义互联公开信息,现在他尝试通过 Solid 来互联个人信息、解决科技大公司垄断用户数据的问题。

这必定不是一个短期内可以看到成效的项目:社交巨头和互联公司不会将用户账号数据拱手相让,让用户个体自发迁移也需要极大的教育成本。但正如万维刚诞生时缺少关注,谁也不知道 Solid 会不会成为下一颗参天大树。

万维语义伯纳斯-李

推荐阅读
图文聚焦