'要啥給啥的寫作AI：新聞評論小說能編，題材風格隨便選，真假難辨'

小說新聞維基百科 Reddit GitHub SaaS Salesforce 人生第一份工作蜘蛛量子位 2019-09-16

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

這裡“一模”，自然是OpenAI橫空出世的GPT-2。但今日更秀的另一模型，來自Salesforce——全球最大的SaaS提供商，雖然之前AI能力展露不多，但這一次，絕對一鳴驚人。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

這是一個擁有多達16億參數的條件Transformer語言模型（GPT-2模型參數15億），採用無監督學習，並且正如其名，能夠對文本生成的內容進行更精準的控制。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

這樣，CTRL在訓練過程中，就會學習這些URL的結構和文本之間的關係。在推理過程中，URL可以指定各種功能，包括域，子域，實體，實體關係，乃至日期。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

值得一提的是，CTRL的訓練文本數據多達140GB，包括維基百科，Gutenberg上的書籍，OpenWebText2數據集（GPT-2網頁文本數據集克隆版），大量新聞數據集，亞馬遜評價，來自ELI5的問答，以及包括斯坦福問答數據集在內的MRQA共享任務等等等等。

數據集雖然沒有開源，但Salesforce表示，他們會發布與數據收集相關的代碼。

以及，由於控制代碼和用於訓練模型的文本之間存在直接關係，CTRL能判斷出新文本生成時對其影響最大的數據源是哪一個。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

數據集雖然沒有開源，但Salesforce表示，他們會發布與數據收集相關的代碼。

以及，由於控制代碼和用於訓練模型的文本之間存在直接關係，CTRL能判斷出新文本生成時對其影響最大的數據源是哪一個。

全球最大的SaaS服務提供商出品

這篇論文來自Salesforce——全球最大的SaaS服務提供商。

最近最為人關注的是一次大規模商業併購：豪擲157億美元收購大數據公司Tableau。

Salesforce Research是其內部的研究部門，核心目標是用AI來解決業務中的問題，已經在NLP領域頗有建樹。

目前，這一部門由Salesforce的首席科學家Richard Socher領導。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

數據集雖然沒有開源，但Salesforce表示，他們會發布與數據收集相關的代碼。

以及，由於控制代碼和用於訓練模型的文本之間存在直接關係，CTRL能判斷出新文本生成時對其影響最大的數據源是哪一個。

全球最大的SaaS服務提供商出品

這篇論文來自Salesforce——全球最大的SaaS服務提供商。

最近最為人關注的是一次大規模商業併購：豪擲157億美元收購大數據公司Tableau。

Salesforce Research是其內部的研究部門，核心目標是用AI來解決業務中的問題，已經在NLP領域頗有建樹。

目前，這一部門由Salesforce的首席科學家Richard Socher領導。

他博士畢業於斯坦福大學計算機系。2016年，自己創辦的公司被Salesforce收購後，加入Salesforce。

根據他個人網站信息，僅在2019年他就發佈了11篇頂會論文，其中ACL 2019 3篇；ICLR 2019 6篇；CVPR 2019 1篇；ICML 2019 3篇。

他也是這篇論文的作者之一。這篇論文的其他作者，都是Salesforce Research的研究員。第一作者有兩位，分別是Nitish Shirish Keskar和Bryan McCann。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

數據集雖然沒有開源，但Salesforce表示，他們會發布與數據收集相關的代碼。

以及，由於控制代碼和用於訓練模型的文本之間存在直接關係，CTRL能判斷出新文本生成時對其影響最大的數據源是哪一個。

全球最大的SaaS服務提供商出品

這篇論文來自Salesforce——全球最大的SaaS服務提供商。

最近最為人關注的是一次大規模商業併購：豪擲157億美元收購大數據公司Tableau。

Salesforce Research是其內部的研究部門，核心目標是用AI來解決業務中的問題，已經在NLP領域頗有建樹。

目前，這一部門由Salesforce的首席科學家Richard Socher領導。

他博士畢業於斯坦福大學計算機系。2016年，自己創辦的公司被Salesforce收購後，加入Salesforce。

根據他個人網站信息，僅在2019年他就發佈了11篇頂會論文，其中ACL 2019 3篇；ICLR 2019 6篇；CVPR 2019 1篇；ICML 2019 3篇。

他也是這篇論文的作者之一。這篇論文的其他作者，都是Salesforce Research的研究員。第一作者有兩位，分別是Nitish Shirish Keskar和Bryan McCann。

其中，Nitish Shirish Keskar是Salesforce的高級研究員，博士畢業於西北大學，研究方向為深度學習及其在自然語言處理和計算機視覺方面的應用。他的個人頁面顯示，已經發表了14篇論文，其中不乏ICLR等頂會。

Bryan McCann也是Salesforce高級研究員，畢業於斯坦福大學，曾經擔任過吳恩達機器學習課程的助理，研究方向是深度學習及其在自然語言處理方面的應用。個人網站顯示，他發表過7篇論文，不乏ACL、NeurIPS、EMNLP等AI頂會。

引發參數熱議

這一研究成果，也引起了大家對模型參數的討論。

有人說，15億參數也好，16億參數也罷，要是英偉達的Megatron放出來，80億參數肯定都通通碾壓。

但也有人給出冷思考，表示參數很多並不是優點，而是一個弱點。阿姆斯特丹大學的助理教授Willem Zuidema說：

為什麼規模大是一個賣點？我理解人們為建立了一個非常好的模型而自豪，甚至為找到了在有限的計算資源上訓練大型模型的方法而自豪。
但在我看來，16億參數本身似乎是一個弱點，而不是優勢。

魚羊乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

AI編故事，一模更比一模秀。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。
蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。
他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心信息點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文本生成非常有價值。

而且，這個NLP模型具有16億參數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億參數的語言模型

這個模型，有一個非常有“靈性”的名字：CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文本生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文本再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他打開它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。
這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制代碼（control codes）。

CTRL以控制代碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制代碼的損失來進行訓練。

控制代碼能使用戶意圖為語言模型所理解。

通過標註訓練數據集的特定標籤，CTRL模型中大部分控制代碼能指定生成文本的整體樣式。

即使給出的提示（prompt）相同，控制代碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文本。

△在有控制代碼的情況下，開頭也不用給

而將控制代碼添加到標籤代碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文檔後面加入URL地址，作為輸入序列的開頭。

除此之外，還有一小部分控制代碼是與問答、翻譯這樣的特定任務相關的。這些控制代碼相對複雜。

好玩的是，混合控制代碼會產生一些有意思的文本。

比如把翻譯控制代碼混合到飲食這個標籤中，生成的文本就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

數據集雖然沒有開源，但Salesforce表示，他們會發布與數據收集相關的代碼。

以及，由於控制代碼和用於訓練模型的文本之間存在直接關係，CTRL能判斷出新文本生成時對其影響最大的數據源是哪一個。

全球最大的SaaS服務提供商出品

這篇論文來自Salesforce——全球最大的SaaS服務提供商。

最近最為人關注的是一次大規模商業併購：豪擲157億美元收購大數據公司Tableau。

Salesforce Research是其內部的研究部門，核心目標是用AI來解決業務中的問題，已經在NLP領域頗有建樹。

目前，這一部門由Salesforce的首席科學家Richard Socher領導。

他博士畢業於斯坦福大學計算機系。2016年，自己創辦的公司被Salesforce收購後，加入Salesforce。

根據他個人網站信息，僅在2019年他就發佈了11篇頂會論文，其中ACL 2019 3篇；ICLR 2019 6篇；CVPR 2019 1篇；ICML 2019 3篇。

他也是這篇論文的作者之一。這篇論文的其他作者，都是Salesforce Research的研究員。第一作者有兩位，分別是Nitish Shirish Keskar和Bryan McCann。

引發參數熱議

這一研究成果，也引起了大家對模型參數的討論。

有人說，15億參數也好，16億參數也罷，要是英偉達的Megatron放出來，80億參數肯定都通通碾壓。

但也有人給出冷思考，表示參數很多並不是優點，而是一個弱點。阿姆斯特丹大學的助理教授Willem Zuidema說：

為什麼規模大是一個賣點？我理解人們為建立了一個非常好的模型而自豪，甚至為找到了在有限的計算資源上訓練大型模型的方法而自豪。
但在我看來，16億參數本身似乎是一個弱點，而不是優勢。

對此，Richard Socher也給出了迴應：

確實，假設性能相同，較小的模型更好。但事實證明，只要你在大量的訓練數據上訓練它，語言模型的性能和記憶事實的能力與大小是密切相關的。

Jelle Zuidema再度迴應，給出了進一步的解釋：

令我驚訝的是，“最大”是聲明中的第一個形容詞，而“高質量”只是最後一點。
我認為有必要提醒人們，理想的方法仍然是更少的參數、更少的培訓和更好的性能。

你怎麼看？

傳送門

最後，如果你對這個研究感興趣，請收好傳送門：

項目地址：

https://github.com/salesforce/ctrl

論文地址：

https://einstein.ai/presentations/ctrl.pdf

博客文章：

https://blog.einstein.ai/introducing-a-conditional-transformer-language-model-for-controllable-generation/

— 完 —

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

'要啥給啥的寫作AI：新聞評論小說能編，題材風格隨便選，真假難辨'

相關推薦