大數據+人工智能,讓疫情有效信息“水落石出”

2020年02月17日11:15  來源:人民網-科技頻道
 

人民網北京2月17日電(趙竹青)新型冠狀病毒肺炎疫情爆發以來,相關話題熱度持續高漲。如何在紛繁蕪雜的信息中理清頭緒?為便於疫情防控和宣傳工作的開展,近日,清華大學人工智能研究院、RealAI共同研發推出“新冠肺炎疫情AI話題分析平台”,幫助相關部門和公眾更好地了解疫情實時動態。

據介紹,該平台通過對多渠道海量媒體信息進行自動抓取採集、識別分析,解決了傳統信息檢索過程中因消息源頭繁雜、消息過多、檢索意圖不明確而產生的困擾。同時,基於大數據分析和AI建模,自動識別出近期熱點話題、新聞追蹤和話題導向、地區關注度變化,第一時間展示全網話題最新動態,滿足用戶對疫情輿情監測的需求。

在底層算法支持上,該平台基於清華大學人工智能研究院、計算機系推出的WarpLDA主題提取算法研發。基於蒙特卡洛EM算法,WarpLDA在訪存效率、並行度方面相比傳統的Gibbs採樣算法更有優勢,可用於上億級別文本的主題提取。該成果最早首發於數據庫領域頂級國際學術會議VLDB上。

RealAI首席執行官田天認為,不同於2003年非典等重大公共衛生突發事件,互聯網成為這次疫情主要的“信息源”平台,傳播模式更是基於人手一機的“自媒體”,信息流的爆發不僅降低了大眾獲取信息的“信噪比”,更是滋生了不同程度的謠言。可以說,傳播速度之快、話題數量之大、更新變化之迅速都對疫情信息的有效傳達提出了更高的要求。

“在這場沒有硝煙的戰爭中,我們每個人、每個組織都無法獨善其身。”田天表示,RealAI希望以自身算法、優勢技術為依托,從內容側打造防疫戰線,發揮信息戰“疫”價值,為抗擊疫情貢獻力所能及的力量。

(責編:趙竹青、呂騫)