全國首個藏文搜索引擎“云藏”上線以來 創新發展數據量不斷擴大
|
“云藏”工作人員演示系統運行情況(央廣網記者 張雷 攝) 央廣網西寧4月22日消息(記者張雷 通訊員先吉卓瑪 王成霞 曲田)全國首個藏文搜索引擎“云藏”在青海上線以來,不斷擴大數據量,創新發展,實現與世界的對話。 這幾天,青海省海南藏族自治州藏文信息技術研究中心數據建設部的工作人員正在加緊錄入全國各省區市的地名,便于用戶通過“云藏”搜索引擎快速查詢相關地名信息。 海南州藏文信息技術研究中心數據建設部負責人德青措介紹:“資料來源主要就是從百度上翻譯過來,然后在云藏的前臺編輯,審核完了以后在云藏前臺發布。” 目前,“云藏”搜索在百科板塊錄入了文化、政治、經濟、歷史等各領域的詞條共9萬多條,隨著編輯和錄入內容的更新,最新的疫情信息也有所體現。 海南州藏文信息技術研究中心數據建設部負責人多杰仁青介紹:“疫情期間,我們及時更新疫情方面的詞條,比如鐘南山等人物都翻譯了。” 創新發展,技術是第一關口。“云藏”上線以來,孵化基地的工作人員成功研發藏文自動分詞與語言智能處理系統,實現了藏文自動糾錯、藏文同義詞搜索、藏文拉丁轉寫搜索等功能,填補了藏文信息處理應用領域的一大空白。 海南州藏文信息技術研究中心自然語言處理研究所負責人航尖才讓介紹:“藏文分詞是藏文信息處理技術第一項難關,分詞語料庫規模越大,它的搜索準確性越高,還有分詞的搜索結果越豐富。” 云藏系統也是一個信息共享的平臺。與世界接軌的云藏,在提高個性化檢索能力的同時,也注重提升移動用戶端的體驗。
“云藏”工作人員正在用搜索引擎進行檢索(央廣網記者 張雷 攝) 海南州藏文信息技術研究中心網絡安全技術部負責人官卻多杰介紹:“目前我們技術部正在著力打造云藏系統新版app,目前已經完成了60%的工作內容,有望在今年的上半年,在蘋果的應用市場和安卓的各大應用市場同時發布。” 隨著云藏數據量的不斷增加擴充,“云藏”生態系統建設也加快步伐,形成了集創業、技術孵化、人才培養于一體的云藏藏文信息技術孵化基地。 海南州藏文信息技術研究中心綜合部主任 拉吉卓瑪表示:“在新形勢下,我們將依托云藏平臺優勢,通過云藏孵化基地吸引信息化類小微企業入駐,抱團發展,共同探索藏文信息化領域的新業態,研發新功能、新產品,進一步推動藏文信息化發展。” |


