谷歌開源“教機器畫畫”項目代碼,公開5000萬幅簡筆畫數據集

人工智能 Google GitHub 藝術 量子位 2017-05-21

李林 編譯整理

量子位 報道 | 公眾號 QbitAI

谷歌開源“教機器畫畫”項目代碼,公開5000萬幅簡筆畫數據集

這個小遊戲,你大概還有點印象。機器給出一個名詞,給你20秒時間畫畫,同時,它會根據你畫的東西一直猜猜猜。

遊戲的名字,叫“Quick, Draw!”。

谷歌開源“教機器畫畫”項目代碼,公開5000萬幅簡筆畫數據集

今天,谷歌開放了Quick, Draw!數據集,包含345類、5000萬幅簡筆畫。這些簡筆畫,來自這個小遊戲的1500萬用戶。

數據集的GitHub地址:

https://github.com/googlecreativelab/quickdraw-dataset

與通常的圖像數據集不同,谷歌捕捉了這些簡筆畫的繪製過程,存儲成為一組帶時間戳的向量,並加上了元數據信息標籤,包括機器要求用戶畫的是什麼、用戶所在國家等。

機器成功認出的圖像,也就是被收錄到數據集中的那些,都展示在Quick, Draw!的數據集網站上:https://quickdraw.withgoogle.com/data

谷歌開源“教機器畫畫”項目代碼,公開5000萬幅簡筆畫數據集

Quick, Draw!遊戲玩家畫的蘋果

谷歌希望開發者、研究人員和藝術家,能用這些數據來進行研究、探索。他們說,這些簡筆畫構成了一個獨特的數據集,開發者可以用它來訓練新的神經網絡,研究人員可以藉助它探索世界各地人民畫畫的模式,藝術家則可能從中獲得靈感,創造我們從未想過的東西。

如果你用這個數據集創造了什麼東西,谷歌希望你通過郵件告訴他們,或者去A.I. Experiments網站提交。

郵箱:[email protected]

網站:https://aiexperiments.withgoogle.com/submit

上個月,谷歌用這個數據集完成了一個教機器畫畫的項目:Sketch-RNN。在這個項目中,機器不僅學會了畫簡筆畫,還對自己所畫的東西建立了抽象概念,比如說知道貓應該有兩隻眼睛,豬有四條腿。

谷歌大腦團隊研究員David Ha和Douglas Eck發表了論文《A Neural Representation of Sketch Drawings》來詳細闡釋這個項目,並在谷歌官方博客上發文做了通俗說明。

在Quick, Draw!數據集開放之後,Sketch-RNN模型也在谷歌的藝術項目Magenta下開源。谷歌開放了Sketch-RNN的預訓練模型、供你在TensorFlow中訓練自己模型用的源代碼、以及一份Jupyter notebook教程。

最後,這裡還有一個Douglas Eck發佈的視頻,展示了Sketch-RNN生成的瑜伽過程:

谷歌開源“教機器畫畫”項目代碼,公開5000萬幅簡筆畫數據集

上圖是節選gif,視頻開始後不久,模型為畫面中的人,加了個瑜伽墊,你會看到機器懵了一會兒。具體原因,作者在項目相關論文中做出瞭解釋。

Sketch-RNN開源模型:

https://github.com/tensorflow/magenta/tree/master/magenta/models/sketch_rnn

A Neural Representation of Sketch Drawings論文:

https://arxiv.org/abs/1704.03477

【完】

招聘

量子位正在招募編輯記者、運營、產品等崗位,工作地點在北京中關村。相關細節,請在公眾號對話界面,回覆:“招聘”。

One More Thing…

今天AI界還有哪些事值得關注?在量子位(QbitAI)公眾號對話界面回覆“今天”,看我們全網蒐羅的AI行業和研究動態。筆芯~

相關推薦

推薦中...