據國防科技信息網報道,每天,美國防部都會收到來自世界各地的公開和秘密情報機構或個人提供的無數條情報,情報分析專家要負責從中找出有用的線索來。但海量的信息就是不讓人睡覺也處理不完。與此同時,分析人員還面臨另外一個更為深層的問題:來自不同國度、文化背景,由不同語種寫就的情報常借隱語、暗語或俚語等來“隱身”,導致字面意義與文本含義經常出現偏離,文本十分晦澀難懂。據國防預研計劃局(DARPA)分析,在這種經常趕時間、語義模糊的環境下,分析人員經常會誤讀或忽略情報中隱藏的重要信息,從而誤導決策或貽誤決策時機。
為此,美國防部擬采用“深度自然語言”(deep natural language)研制出一種自動化的軟件系統,以便透過表面文章挖出真正有用的情報。其中,DARPA立項的“深入探索與過濾文本”(Deep Exploration and Filtering Text)項目,“就是打算借助剝離過濾器,消除情報當中遮蔽真實語義的晦澀之處,最終排除虛假情報”。在將來,該技術將幫助情報分析人員透過字里行間看問題,在分析文字、搜索信息方面采用更為策略的方式,而非像現在這樣,在有限的時間內線性地處理大量的信息。
2012年5月,DARPA已經為該項目舉辦了一次“建議者日”研討會。接下來,該局還準備在更大的范圍內公開征求項目研發建議,并吸引工業界參與項目研制。(新華網)