春節期間,一款智能作詩拜年H5在親朋好友間大規模地傳播開來。據人民日報統計,產品上線6天的點擊量就超過了1100萬。
這是百分點聯合人民日報和全國黨媒信息公共平臺等機構推出“中國首個智能作詩送祝福應用——AI李白”。
當古典詩詞與現代風觸碰到AI技術后,生成出一首首個性化詩詞,祝福不再千篇一律,乘著拜年的習俗、伴著祝福的味道,讓很多人都體會了“一秒變李白”的神奇,也讓使用AI技術成為了拜年新風尚。
一、中國首個智能作詩送祝福應用
中國是“禮儀之邦”,春節拜年是中國優秀傳統文化的集中展示。通過使用人工智能技術,由機器作出個性化的詩句,“AI李白”成為了中國首個被大量人群使用的智能作詩拜年送祝福的應用。區別于其他智能作詩應用,“AI李白”具有三個特點:
智能化:在研發階段,考慮到詩詞中有自己的平仄韻律美和組合規律,傳統的N-Gram語言模型表達能力有限,無法較好的處理長距離的上下文語言依賴問題。因此,百分點NLP團隊利用先進的深度神經網絡技術,訓練出以春節祝福為主題的詩詞自動生成模型。
個性化:
“AI李白”不僅可以支持使用者向親人、朋友、師長、領導、愛人等拜年,還可以提供不同的風格和形式,不僅有唐詩、宋詞,還有祝福語、現代風、Freestyle等風格和形式,來滿足中國人在新春佳節互相拜年的需求。
趣味性:
為了讓大家在春節期間玩起來,增加了互動性和趣味性,在唐詩和宋詞中特別地支持用戶輸入個性化的4-8個字的祝福語句,從而生成個性化詩詞,并且在生成頁面用高亮的呈現效果散落在詩詞中。
中國是一個詩的國度,中國人的詩心一直在,“為你寫詩”的AI李白,借AI技術在春節期間激活了中國人的詩情。因其兼具祝福的高雅性和趣味性,通過在人民日報平臺、騰訊客戶端廣泛的傳播后,據人民日報統計,產品上線6天的點擊量就超過了1100萬,成為春節送祝福產品中被廣泛好評的爆款。
2
二、AI技術與古典文化的碰撞
“AI李白”H5由人民日報和全國黨媒信息公共平臺策劃出品,百分點提供技術支持,從開始的創意策劃、研發到優化、測試、上線,時間只有短短數周,在H5上線后百分點和人民日報中央廚房相關團隊一起全程保障產品運行。
在整體設計上,“AI李白”產品是百分點卓越的自然語言處理技術與中國傳統文學典籍的巧妙結合,是技術+藝術的美好嘗試。 具體表現在:
首先,以深度神經網絡展現詩詞韻律美。
百分點首席算法科學家蘇海波博士介紹,百分點NLP團隊利用了先進的深度學習技術,采用長短期記憶網絡模型LSTM(Long-Short-TermMemory),結合大規模的詩詞訓練語料,自動學習發現詩詞中的特征和規律,捕獲上下文復雜的語言依賴關系,從而訓練出智能作詩的模型。尤其是在宋詞中,五十多個詞牌模型全部依靠AI習得。
其次,80余萬首詩詞構建為大規模數據集。
為了達到更好的生成效果,在對詩詞上下文建模中,采用的訓練語料包括全部的唐詩、宋詞、詩經以及經典的現代散文和現代詩共計80萬首,構建了大規模的數據集。
第三,以詞向量技術呈現春節祝福主題。
在相關詩詞專家團隊的指導下,利用詞向量(Word2Vec)技術發現與春節語義相關的詞匯,并智能化填入各種風格的詩詞中,呈現出春節送祝福的美好意境。
第四,個性化祝福。
為了保證用戶插入的祝福語滿足詩詞自身的平仄和諧,百分點NLP團隊運用了啟發式搜索技術實現了這種插入邏輯,而且在前端還支持用戶上傳自己的照片,最終讓用戶生成的每一首詩詞都是滿滿的個性化祝福。
最重要的是智能審核環節。為保障詩詞中不出現黃色、非法或廣告詞匯,在本項目中所使用的敏感詞審核系統是百分點為主流媒體機構開發并實際使用的一款智能審核系統,系統中包括數萬條的敏感詞庫,國內服務器租用 服務器托管,結合先進的機器學習算法,可以實現各種敏感詞變種識別,并且從訓練語料庫、輸入環節、生成詩詞的各個階段都有極為嚴苛的技術保障。
三、NLP:懂語言者得天下