'寫一個網絡!(Ted分享)'

"

20年前,TimBerners-Lee發明了萬維網。在他的下一個項目中,他正在為開放的、鏈接的數據構建一個網絡,就像網絡對文字、圖片、視頻所做的那樣:解鎖我們的數據並重新定義我們一起使用它的方式。

"

20年前,TimBerners-Lee發明了萬維網。在他的下一個項目中,他正在為開放的、鏈接的數據構建一個網絡,就像網絡對文字、圖片、視頻所做的那樣:解鎖我們的數據並重新定義我們一起使用它的方式。

寫一個網絡!(Ted分享)

光陰似箭 差不多是20年前 當我想重新構造我們使用信息 協同工作方式的時候 - 我發明了萬維網 20年過去了,現在,在TED 我請求你們幫助創建新的架構

回到1989年 我在備忘錄中建議使用一種全球的超鏈接系統 幾乎沒有什麼人在真正用它 但是,18個月後 - 革新就是這麼開始的 18個月後,老闆說,我可以兼職做這件事 做一種遊戲性質的項目 就拿我們新買來的電腦 他給了我些時間寫代碼實現 我草擬了下HTML應該是什麼樣子 超文本協議 - HTTP - 關於URLs 的想法 - 事物的名稱 這些事物都是以HTTP開頭命名的 我完成了代碼併發布出來。

我為什麼要這麼做? 這是一個充滿挫敗感的過程 我感到很挫敗 - 因為我作為名軟件工程師 工作在這個令人興奮的超大的實驗室中 很多人從世界各地來到這裡 他們的電腦各不相同 數據格式各不相同 文件系統各不相同 所以,這其中有很大的差異性 如果我想建立一點點東西 在這些差異性很大的電腦上 我要找一些數據,我不得不連接到一些新的機器 運行一些新的程序 以便我能在新的數據格式中找到一些信息 這些都是不兼容的 這非常令人沮喪 這種挫敗感卻正顯示出這個項目的潛力所在

事實上,這些磁盤裡全是文件 所以如果你僅僅把他們 想象成天空中某些大型虛擬文件系統的一部分 比如Internet 生活就會簡單得多 這樣,一旦你有了這樣的想法 即使人們並沒有讀到你的備忘錄 事實上他讀到了,因為在他死後,在他的草稿拷貝中 他用鉛筆在角落寫到“模糊,但是令人興奮”。

但一般情況下,很難有這樣的想法 – 的確很難解釋 網絡是什麼樣的 現在都很難向人們解釋,更別提當初了 但是 - 對,當TED開始時,那時沒有網絡 所以像點擊這樣的事情含義是不同的 我現在可以向某人展示一大堆超鏈接 某個包含鏈接的網頁 我們點擊一個鏈接,然後bing -- 就會轉到另一個超鏈接的頁面 沒什麼令人印象深刻的 我們已經見到,通過超鏈接找到CD-ROMs中的內容 困難的是把它們想象出來 所以,想象那個鏈接可以到 任何實際的你能想象得到的文件 好的,這個跳躍對於人們是很難做到的 然而,一些人做到了 儘管很難解釋,但是這是一場草根運動 這正是使它好玩的地方 也是最令人激動人心的事情 不是技術,不是人們用它所做的東西 而是實際的交流,所有這些人的思想匯聚 在一起,發送電子郵件 這是那時的情況

你知道嗎?有趣的是,現在跟那時候又有點像了 我問每一個人,他們或多或少都發布過文檔 我說“你能把你的文檔放到網絡上嗎?” 然後,你做了 謝謝 這已經是一場疾風,不是嗎? 我的意思是,它已經非常有趣 因為我們發現,網絡上發生的事情似乎 已經把我們吹到了一邊 現在它的功能得比我們想象的還多 最初的設計只是想把文檔放在一起 在我們最初開始使用網絡時 現在我想讓你把你的數據放在網上 還是有巨大的可釋放潛力 也有很大的挫敗感 因為我們從網上得到的數據不是我們想要的數據

你說的數據是什麼?文檔和數據之間有什麼區別? 文檔是你閱讀的東西 或多或少,你都讀過,你可以追蹤他們的鏈接,就是這樣 數據—你可以通過一臺電腦使用各種數據 誰在這裡或者其他地方聽過漢斯羅素玲的演講? 一個偉大的 – 很多人已經看過了 – 一個偉大的TED演講 漢斯在他的演示文檔中 使用不同的顏色表示不同的國家 他在一個軸上顯示收入水平 同時他用動畫按年份顯示嬰兒死亡率 他使用這些數據完成了一場演講, 這個演講打破了很多人 對發展中國家經濟的神話

他展示了一個類似的幻燈片 數據都被埋在地下 對,數據是這些棕色的、無趣的四方盒子 我們就是這樣看待數據的,不是嗎? 因為,你不能漫無目的地使用數據 但事實上,數據驅動了我們的生活 因為某些人使用了數據並且做了些事情 在這個例子中,漢斯將數據放到了一起 漢斯在美國網站找到各種數據和事物 他把數據放到了一起 將它們組合起來使之比原始數據有趣得多 然後把數據放到這個軟件中 這個軟件我覺得是他兒子開發的 最終他做出了這個美妙的演示 最後漢斯說道 “瞧,有大量的數據是非常重要的” 我高興地看到在昨天的晚會上 他仍然強烈地表示“有大量數據是非常重要的”

現在我想讓大家想的是 不僅僅是兩條數據間的連接,或者像他所說的那樣六條數據 而是這個世界上任何人 都把數據和可以虛擬化的一切內容放到網絡上 然後把它們稱為關聯數據 這個技術就是關聯數據,它是極其簡單的 如果你想把什麼東西放在網絡,有三條規則 第一條規則是,需要有HTTP的名字 那些東西要以http:開頭 我們現在不僅對文檔這樣用 對文檔描述的事物也這樣用 我們對人物、地點 產品,事件等都這樣用 所有概念化的東西現在都以HTTP開頭命名

第二條規則,如果我有一個HTTP名稱,然後我根據它在網絡上進行查找 我可以從網上獲取數據 通過HTTP協議 我將得到一些標準的格式化數據 這些有用數據或許是關於人們希望瞭解 某個事物或者事件的 事件的主人公是誰?關於這個人的所有信息 他們什麼時候生的,等等 所以,第二條規則就是我通過HTTP獲得了重要的數據

第三條規則是,我得到的信息 不僅僅是某人的身高、體重和出生日期 還有數據間的關係 數據是有聯繫的 很有趣,數據是有聯繫的 這個人出生在柏林,柏林在德國 當數據有聯繫時,無論何時它表現出這種聯繫 另一件與之有聯繫的事物 就以HTTP開頭命名 所以,我可以直接去找那件事 比如,我查一個人 -- 我查他出生的城市 這個城市的所在區域,城市的城鎮 人口等等 這樣我就能瀏覽這些信息

真的,就是這樣 這就是關聯數據 我多年前在一篇文章中給它命名為“關聯數據” 之後不久,有些事開始發生了 關聯數據的想法就像我們得到了很多很多 類似漢斯擁有的盒子 很多很多的事物開始發芽生長 它帶給我們相當多的植物 不僅僅是一個根供給一個植物 對於這的每一個植物,無論它是什麼 一個演示,一個分析,某些人查看數據的樣式 它們都著眼於所有的數據 並且它們把數據聯繫起來 關於數據真正重要的是 你把很多東西聯繫起來,數據就更加有價值

所以,關聯數據 由此而來 很快,來自柏林自由大學的克里斯拜澤 做為第一人把有趣的東西放在一起 他注意到維基百科 一部在線百科全書 有很多有趣的文檔 在這些文檔中,有些小方格子和小盒子 在許多信息盒子中,就是數據 他寫了 一個程序將數據從維基百科中提取出來 然後將它放到關聯數據的blob(二進制大對象)中 在網絡上,被他稱之為dbpedia(數據庫百科) 這張幻燈片中部藍色的blob表示Dbpedia 如果你去找柏林 你會發現還有其他的數據 也有柏林的信息,它們被聯繫到了一起 所以,如果你要從dbpedia中摘出關於柏林的數據 你也最終會摘出其他內容 令人興奮的事情是它正在成長 這又是一個草根做的事情,對嗎?

讓我們多想想數據 數據實際上來源於很多很多不同的形式 想想網絡的多樣性,很重要的一點 網絡允許你將各式各樣的數據放在一起 說到數據,我能說出各種各樣的數據 我們可以說政府數據,企業數據真的很重要 還有科學數據,個人數據 天氣數據,關於事件的數據 關於談話的數據,還有新聞和各種類似的東西 我只提到了一小部分數據 你們就可以看出其多樣性 所以你可以看到其中的潛力

讓我們從政府數據說起 讓我們從政府數據說起 美國的政府數據將在互聯網上被應用 以一種可訪問的形式 美國的政府數據將在互聯網上以一種可訪問的形式被應用 這非常重要,難道不是嗎? 不僅僅是為了透明性,透明性對政府很重要 尤其是從政府部門出來的數據更重要 想想有多少關係到在美國如何生活的數據 它的確很有用,很有價值 我可以把它用在我的公司 我可以像個小孩子般把它用在我的家庭作業中 所以,我們談論的是讓世界變得更好 通過將這些數據變得更有用

事實上,如果你們在負責 - 如果你知道一些數據 關於政府的, 你經常會發現 有些人,他們會被這些數據所吸引 Hans稱之為數據庫擁抱 你擁抱你的數據庫,你不會放它走 直到你為它建立了一個漂亮的網站 嗯,我想建議的是,除了建一個漂亮的網站 是的,建一個漂亮的網站 我沒說不要建一個漂亮的網站 建一個漂亮的網站,首先 要給我們純粹的數據 我們要的是數據 我們要純粹的數據 好,現在我們不得不要求原始數據了 我要請你們練習一下,好嗎?

請說“原始”

請說“數據”

請說‘現在“

好,原始數據現在!

這樣練習是非常重要的 因為你不知道那些擁有數據的人 有多少理由拒絕將數據給你,甚至你作為一個納稅人是為此付了錢的 這不僅僅存在於美國,全世界都一樣 也不僅僅在政府,當然也存在於企業。

我還想再談談關於數據的其他想法 在TED,我們一直關注於 人類社會目前所面臨的巨大問題 癌症治療,瞭解阿爾茨海默病 瞭解經濟好讓它穩定點 瞭解世界是如何運轉的 那些致力於解決這些問題的科學家 他們腦海中有些還不成熟的想法 他們試圖在網絡上與他人交流 但是現狀是很多人類的知識 現在都在數據庫中,放在他們的電腦裡 現在實際上也沒被共享

事實上,我就從一個方面來說明 - 如果你在研究阿爾茨海默病,以此為例, 以藥物發現為例 -- 這個領域具有相當多的剛剛出現的關聯數據 因為這個領域的科學家們意識到 關聯數據是一種很好的方法,可以幫助他們擺脫數據孤島 因為他們在一個數據庫中建立了基因圖組 他們在另一個數據庫中建立蛋白質數據 現在,他們將基因圖組和蛋白質數據形成了關聯數據 他們可以問排序的問題,也許你不會問 我不會問,但是他們會 哪些蛋白質參與信號轉導 並且也和錐體神經元相關? 當你將這個問題放到Google上搜索 自然沒有回答結果的頁面 因為之前沒有人問過這樣的問題 雖然你得到了223,000個結果 但是沒有一個你用得上 但是沒有一個你用得上 -- 現在他們已經被放到了一起 命中32個結果,每一個結果都是與特徵相關的蛋白質 並且你可以看到 做為一個科學家, 詢問那些問題的能力 那些問題基本上都是跨學科的問題 是真正的C-change 這是非常非常重要的 科學家們那時完全陷入了困境 因為其他科學家蒐集的數據,其價值被鎖起來了 我們需要將之解鎖,以便處理那些大問題

現在,如果我繼續像這樣講 和你沒有一點關係 但是,這種想法並不對 事實上,數據關乎我們的生活 你剛剛登陸了你的社會化網絡站點 你最喜歡的一個,你說“這是我朋友” 叮!聯繫,數據 你說“這副照片,是這個人的” 叮!那是數據。數據,數據,數據 每次你在社會化網絡上做的事 社會化網絡站點就獲取數據並利用它 重新設計數據的目的是為了讓這個站點的其他人過得更有趣 但是,當你上另一個關聯數據網站 假設是一個旅遊網站 你說“我想把這張照片發給那個組裡的所有人” 但你卻無法翻過這些牆 經濟學家曾經寫了一篇關於這個問題的文章,並且許多人也發了相關博文表示出 巨大的挫敗感 打破孤島的方式是實現互操作 在這些社交網絡之間 我們需要通過關聯數據做這件事

最後一種我將要談到的數據,也許是最令人激動的 在我來這之前,我通過OpenStreetMap查找了一下 OpenStreetMap是一個地圖,但同樣也是一個維基 放大這個方塊,這是一個劇場 -- 就是我們現在所處的地方 -- 特倫斯劇場(位於長灘市,加利福尼亞)。它現在還沒有被標上名字 所以我可以到編輯模式,選擇劇場 然後在底下填上名字,然後保存它 現在你再去訪問OpenStreetMap.org 你找到這個地方,你會發現它現在有名字了 這都是我做的 我在地圖上標的,剛剛做的 我把它標註在那裡。嗨,你知道嗎 如果除了我,每個人都在這個地圖上標註一點 將會產生難以置信的資源 因為其他每個人都做了 這就是關聯數據 每個人都做一點 生成一點內容,然後把它們連接起來 關聯數據就是這樣工作的 你做一些,每個人都做一些 也許你的數據在關聯數據中只是很小一部分 但你知道你需要它 我們已經在實踐了

關聯數據 -- 是非常巨大的 我只能告訴你很小一部分 我們生活的每個方面 工作和快樂的每個方面 不管是數據出處的有多少 關鍵是把它聯繫起來 當你把數據聯繫起來 你能從這樣的方式中獲取在網絡或文檔中無法獲取的能量 你能從中得到巨大的能量 現在我們處在一個階段 我們必須要做的階段 -- 那些認為這是個偉大想法的人們 而且所有人 -- 我想在TED的大部分人 他們做事情並不是為了要使投資得到立即的回報 因為只有當每個人都這麼做了才會有所回報 他們將會這麼做,因為他們是那類人 那類希望每個人都參與進來而讓事情變好的人 OK,這就是關聯數據 我希望你參與 我希望你需要它 我也認為這個想法值得宣揚

視頻來源:https://www.ted.com/talks/tim_berners_lee_on_the_next_web

"

相關推薦

推薦中...