看了谷歌Quick,Draw!數據集,才知各地簡筆畫差這麼多

李杉 編譯自 TechCrunch

量子位 報道 | 公眾號 QbitAI

看了谷歌Quick,Draw!數據集,才知各地簡筆畫差這麼多

去年11月,谷歌展示了幾項有趣的機器學習實驗,其中包括Quick, Draw!——在這款遊戲中,你可以畫一個東西,讓圖片識別系統猜測你畫的究竟實是什麼。

看了谷歌Quick,Draw!數據集,才知各地簡筆畫差這麼多

該公司現在又發佈了玩家提交的海量圖片,將其作為一個公開數據庫,供人工智能開發者使用。目前,這個數據庫包含5000萬張圖,谷歌還打算繼續擴充它。

如果你覺得瀏覽5000萬張潦草的繪畫毫無樂趣,那也不要擔心,因為關鍵不在這裡。

關鍵在於元數據。這些元數據來自許多不同國家,內容也有很大差異,而且充滿樂趣。

看了谷歌Quick,Draw!數據集,才知各地簡筆畫差這麼多

例如,你可以從中瞭解德國人和韓國人對貓或椅子有什麼不同看法。

看了谷歌Quick,Draw!數據集,才知各地簡筆畫差這麼多

當然,其中的一些模式非常值得思考。很顯然,韓國人和俄羅斯人更喜歡把椅子畫在角落或側面。為什麼?你或許可以藉助自己的機器學習系統找出背後的原因。

其中還有很多有趣的信息。谷歌在博文中指出,整個數據庫裡的運動鞋比例很大,以至於系統很難識別出高跟鞋和涼鞋。人們畫貓的方法可能也存在一些特定模式。你畫的貓是否跟別人有所不同?或許也可以開發一套機器學習算法找出答案。

谷歌建議你使用新的Facets工具對海量數據進行視覺化。當你擁有這麼大的數據時,如何對其進行分類,以便人們找到值得思考的粗糙模式和想法?如何找到系統性偏見或改進的機會,或者其他類似的東西?

這5000萬張圖片只是個開始——谷歌今後還將發佈另外大約7.5億張圖片,還有可能包括其他項目的有趣數據。

更多信息見Google Research Blog:https://research.googleblog.com/2017/08/exploring-and-visualizing-open-global.html

數據集:https://quickdraw.withgoogle.com/data

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI

վ'ᴗ' ի 追蹤AI技術和產品新動態

相關推薦

推薦中...