“少女詩人”小冰眼中的世界
小冰
生命的脈動
漸漸模糊的地方
我在念月下的時光
在離我更遠的方向
小冰
我有十八年未到過動物園
老樹枯乾的手指
在這土地上
一個人的影子
小冰
海灘外和紅色的斑紋
都是晴朗的衣裳
靜靜地穿著
淺淺的風淡淡的
以上這些詩詞文字優美,頗具風格。不禁讓我們好奇與感嘆它們是出自哪位詩人之手?
其實這些優美的詩出自一位叫“小冰”的女詩人,不過她並非人類,而是人工智能機器人!
小冰自述如下:
我學習了1920年以來的
519位詩人的作品
徐志摩的詩我讀了2000遍
我已經經歷了10000次迭代
每次迭代只要6分鐘
10000次迭代總共需要100個小時
人類如果讀完同樣的詩大約需要100年
機器少女詩人養成記大揭祕!
她有519位老師
小冰的研發團隊用了機器學習的方法,賦予小冰學習詩歌的能力,並不斷讓其提高,以使句子更加通順、句間更加關聯,並且從物到情有所引申,希望能激起讀者的共鳴。
為了能寫出好詩,“小冰”也為此付出了辛苦的努力。她學習了1920年以來的519位詩人的代表作,從頭到尾與從尾到頭各一萬遍。
微軟亞洲研究院主管研究員宋睿華說,“小冰的項目最初是我自己想到一個研究課題,利用社交網絡的數據,來構造一個機器人。她不是全知全能,而是知道我知道的,也不知道我不知道的,說話的風格也像我。”
風格化的對話機器人是宋睿華最感興趣的題目,於是她想嘗試一下機器人能否從一個人的語料裡,學習到說話人的風格,生成有特色的內容。
“能不能讓小冰受到圖像的激發,獲取靈感,來寫一首詩呢?”宋睿華說,“我們很喜歡這個由圖像激發靈感的主意,因為圖像的信息豐富,又具有內在的邏輯和故事性。而詩歌也很適合做人工智能寫作的嘗試,因為詩歌本身富有想象力,句與句之間允許跳躍,但語言本身要求更具感染力,表達的意境要求有思考深度。”
她學習很用功!
研發團隊嘗試讓小冰特意多讀某位詩人的詩,比如徐志摩,大約2000遍,她的風格就會受這位詩人的影響,且詩中有徐志摩的痕跡;再讓她讀另一位詩人於賡虞的詩作大約2000遍,同樣一幅圖就會寫出風格迥異的詩來。
於庚虞.小冰
任深思隨海鳥去了
滾滾江心之孤舟絃歌悽迷哀戀
低問枯骨對於生命的鮮花
面前就飛翔著惡毒的佯笑
徐志摩.小冰
飛鳥在海沫裡
這人迎著你鼓掌
一個聲音在生命的舞臺上合奏著
這一半也是靈魂的聖泉
她有10000歲的年齡!
小冰學會創作的過程大致是兩個階段。
第一階段,先不斷地修習現有的優秀作品,修習到一定程度之後,當她受到某個靈感激發源的刺激,就會利用學習到的能力產生新的創造。
在這個過程中,技術團隊使用了跨語義空間的多個深度神經網絡模型,包括卷積神經網絡和循環神經網絡,並且針對圖片的多領域和情感維度做了深度優化。
大家今天看到的可以寫詩的小冰,已經經歷了10000次迭代,每迭代一次,小冰會把現有的519位詩人的幾千首詩都修習一遍,這個時間大約是6分鐘,那麼10000次迭代需要100個小時。而人類如果要把這些詩讀10000遍,大約需要100年。
所以可以說,小冰用了100個小時,就擁有了如今寫現代詩的創造力。
其實機器人寫詩,背後涉及的圖像識別和文本生成技術在現實領域大有可為。
由於人在成長的過程中是在不斷的接受多感官的刺激後,才逐漸建立了世界和語言的聯繫。因此,應用多感官刺激的方法來做語言理解與生成是很有前景的一個方向。
舉一個例子,用與寫詩類似的技術去學習某一類人的語言模型,比如說高中生或中年人,這樣就可以抓住不同群體的語言特性。在聊天中,就可以針對不同人群產生不同回覆,製造出與同齡人聊天的順暢感。
她詩集的生日是5月19日
研發團隊認為小冰寫的詩具有自己的風格,雖然會有語法錯誤,但卻能給人驚喜,而且她思維活躍,可以考慮出本詩集。
在經過了技術修正和大規模評測後,小冰的詩質量有了明顯提升。但詩集的發佈卻遭遇了困難重重,由於小冰是作為第一個人工智能的作者,並沒有身份證號碼,而且總會有人質疑,這本書是否真的是機器人所寫。這使小冰詩集的發佈時間有所拖延。
但最終詩集還是獲得了刊號,並且將發佈的日期定在2017年5月19日,選擇這個日期也是為了致敬中國的519位現代詩人,小冰正是學習了他們的代表作才有了今天的寫作能力。更讓人驚喜的是,這一天恰好也是小冰寫詩的立項日期。
這就是“小冰”,我們的人工智能美少女詩人。