"


"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

AI居然直接給修改前的武則天打碼了……健康概率提升幅度達23%。

第三輪:

測試樣本:妲己 新舊原畫

修改處:超大幅增加了胸部的布料

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

AI居然直接給修改前的武則天打碼了……健康概率提升幅度達23%。

第三輪:

測試樣本:妲己 新舊原畫

修改處:超大幅增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

AI居然直接給修改前的武則天打碼了……健康概率提升幅度達23%。

第三輪:

測試樣本:妲己 新舊原畫

修改處:超大幅增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

老版本依然打碼,新版修改之後健康概率提升幅度高達57%。

以王者榮耀的群眾基礎來看,這輪修改非常有必要,AI打碼也算情有可原……

看來AI對直觀的視覺刺激檢測更為嚴格,對似有若無的的精神刺激拿捏還並不到位。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

AI居然直接給修改前的武則天打碼了……健康概率提升幅度達23%。

第三輪:

測試樣本:妲己 新舊原畫

修改處:超大幅增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

老版本依然打碼,新版修改之後健康概率提升幅度高達57%。

以王者榮耀的群眾基礎來看,這輪修改非常有必要,AI打碼也算情有可原……

看來AI對直觀的視覺刺激檢測更為嚴格,對似有若無的的精神刺激拿捏還並不到位。

我用靈犬測了《王者榮耀》裡的女英雄……

總體看來,今日頭條的“靈犬”AI來做簡單的過濾已經沒什麼問題,至少可以幫助審核團隊大幅的提高審核的效率,而且我用的只是一個簡化版,看來今日頭條的審核員不用像程序員一樣禿頭了。

但是完全交給AI來審核目前來看還是不現實,人民群眾的智慧是無窮的。比如我們一看就懂這是CXK,可是AI想要分辨就非常困難。

"


我用靈犬測了《王者榮耀》裡的女英雄……

我用靈犬測了《王者榮耀》裡的女英雄……


全國已經累積註冊了兩千多萬個公眾號,是一個頭部吃肉、中部喝湯、底部喝西北風的狀態,為了讓自家的內容獲得曝光,各路神仙都有很多騷操作。

比如前幾天知乎還推給了我一篇祕籍,大意是在探探上做好一套資料,扮演女人來和男性配對,以此勾引男人加自己的微信。

我用靈犬測了《王者榮耀》裡的女英雄……

加好友後自己一直扮演女人,再有意無意的對直男們露出公眾號。

文章裡興奮地說道:“一個人一天轉化進10個人,如果僱傭3個人來做的話,每天可以轉化進30個人,一個月就是9000人,這可將近一萬粉絲啊!”

……

30 x 30 = 9000?將近一萬粉絲?

我用靈犬測了《王者榮耀》裡的女英雄……

一個月漲粉“一萬”這個數據在後文還被引用,抒發自己對世上無難事,只怕有心人的這句話的贊同。

為了能從千萬大軍中廝殺出來,男扮女裝只是雞賊的自媒體人中小小的一個伎倆。為了吸引流量,色情、低俗、標題黨從未消失,各種迷惑文章層出不窮。

文章《震驚!著名LOL玩家和DOTA玩家,互斥對方不是男人,現場數萬人圍觀》點開一看,發現是周杰倫和林俊杰合唱《算什麼男人》。

《關於我市暴雨強制放假通知》點開一看,只有幾個字“年輕人,你的思想很危險啊!”。

我用靈犬測了《王者榮耀》裡的女英雄……

今日頭條上每天產出數十萬內容,為了過濾不合時宜的內容,聽說有一個上萬人的審核團隊,我猜他們每天的工作大概是這樣的。

我用靈犬測了《王者榮耀》裡的女英雄……

全部靠人來審核,日復一日這個成本太高了,尤其內容還是爆炸式增長的,效率也容易跟不上。所以,今日頭條很早就嘗試用技術來做反低俗的工作。應該是國內最早建設的,每天都在迭代。

現在還放出了個簡化的版本可以給普通的創作者使用,名叫“靈犬反低俗助手”。

我用靈犬測了《王者榮耀》裡的女英雄……

它已經進化到了第三個版本,不但可以識別圖片是不是低俗,還可以結合上下文理解文本,看看你是不是標題黨或者是血腥暴力的內容。

像我這種做遊戲的,以前檢測玩家是不是說了粗鄙之語的辦法主要是靠屏蔽字庫,把所有屏蔽詞都彙總在一起,匹配到玩家說的內容後,再進行各種處理(例如降低權重、轉換成**、禁止發言)。

我用靈犬測了《王者榮耀》裡的女英雄……

但這個辦法已經太古老了,一是用戶體驗不好,因為詞庫一大,正常說話也容易被無意間轉換成**,體驗極差。

而詞庫太小,又達不到效果。

再者就是也很容易被繞過,比如用戶打拼音和縮寫就沒辦法了,大家都已經熟練掌握。

我用靈犬測了《王者榮耀》裡的女英雄……

但是“靈犬”AI不一樣,它用的是自然語言處理(NLP)技術,可以全局的理解文本,如今第三代同時使用“Bert”和半監督技術,訓練數據集總量是1.2個T,相當於20個百度百科,包含920萬個樣本,準確率提升至91%。

我用靈犬測了《王者榮耀》裡的女英雄……

說了這麼多,但我覺得頭條還是不相信中文語言的博大精深,一定是低估了這幫自媒體人的雞賊程度。

我用靈犬測了《王者榮耀》裡的女英雄……

正好頭條搞了個小程序版,把精簡版的功能開放給用戶使用,就讓我來看看到底誰比較睿智。

第一輪挑戰:

人民日報:《電杆上搶修的大叔一低頭,發現水溝裡漂著個娃……》

識別難度:低

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:90%。

評價:文章講的是供電員工搶救溺水兒童的一事,應該沒有比《人民日報》更正能量的公眾號了,要是這也能翻船,頭條的程序員的頭就白禿了。

通過測試

第二輪挑戰:

全世界不如一個你:《官方開車最為致命,四川衛視報道暗訪按摩店,上演“雞你太美~”》

識別難度:中

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:45%。

通過測試

評價:這篇文章講的是四川記者暗訪按摩店,播出節目後關鍵部位未打碼的相關段子。雖然表面上寫的是段子,但是底下的評論都在評價王先生的尺寸。

所以健康概率不高也就很好理解了。

第三輪挑戰:

青橙生活研究所:《劉強東的2分鐘,真的算快嗎》

識別難度:高

我用靈犬測了《王者榮耀》裡的女英雄……

健康概率:58%。

通過

評價:這篇文章暗藏殺機,雖然看似是一個科普文章,用東哥的2分鐘為引子,分析全球男人的性行為平均時間,得出的評價也算得上有理有據,但是角度相比之下還是偏向低俗。

市界:《劉強東明州24小時》就嚴肅的多了,還原了整個事件的過程,所以分數就很穩……

我用靈犬測了《王者榮耀》裡的女英雄……

目前看來文章檢測的可靠性還是很高的,不過不要高興的太早。

還有一個環節是圖片檢測,圖片檢測的難度同樣非常高,普羅大眾一看就懂的內涵圖,在AI的眼裡看來也許並沒有那麼好理解。

以前通過裸露皮膚的比例來判斷是否違規,而歷史和藝術性的照片就會被誤傷。

我用靈犬測了《王者榮耀》裡的女英雄……

下面我將使用控制變量法,來測試一下“靈犬”對於圖片的健康檢測。

我用靈犬測了《王者榮耀》裡的女英雄……

眾所周知,《王者榮耀》裡的女英雄原畫曾遭到過不同程度的削弱,下面我們將對比削弱前後,看看影響健康值的浮動。

第一輪:

測試樣本:不知火舞 新舊原畫

修改處:增加了衣服兩側的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

不知火舞加了這麼多布料,僅僅從66%提高到了67%,提升幅度僅有1%。

原畫:“這波修改太虧了。”

第二輪:

測試樣本:武則天 海洋之心 新舊原畫

修改處:增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

AI居然直接給修改前的武則天打碼了……健康概率提升幅度達23%。

第三輪:

測試樣本:妲己 新舊原畫

修改處:超大幅增加了胸部的布料

我用靈犬測了《王者榮耀》裡的女英雄……

測試結果:

我用靈犬測了《王者榮耀》裡的女英雄……

老版本依然打碼,新版修改之後健康概率提升幅度高達57%。

以王者榮耀的群眾基礎來看,這輪修改非常有必要,AI打碼也算情有可原……

看來AI對直觀的視覺刺激檢測更為嚴格,對似有若無的的精神刺激拿捏還並不到位。

我用靈犬測了《王者榮耀》裡的女英雄……

總體看來,今日頭條的“靈犬”AI來做簡單的過濾已經沒什麼問題,至少可以幫助審核團隊大幅的提高審核的效率,而且我用的只是一個簡化版,看來今日頭條的審核員不用像程序員一樣禿頭了。

但是完全交給AI來審核目前來看還是不現實,人民群眾的智慧是無窮的。比如我們一看就懂這是CXK,可是AI想要分辨就非常困難。

我用靈犬測了《王者榮耀》裡的女英雄……

更何況“低俗”本身界限就很模糊,在未成年人眼裡看來低俗的圖片,在成年人看來未必,一張內衣照片是放在淘寶還是文章裡,在不同語境下去看待時,是否低俗也同樣是變化的。

所以AI+人工複審的機制將會長期存在。

不過至少有一點毋庸置疑,那就是人既沒有自己想的那麼開放,AI也沒有我們想的那麼呆板,界限已經越來越模糊。

這個世界啊,未來究竟會是怎樣?

"

相關推薦

推薦中...