詞條
詞條說明
近年來,隨著Internet?的迅猛發展以及人們利用信息技術生產和搜集數據能力的大幅度提高,大規模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本大數據挖掘成為人們研究的焦點。 數據挖掘(KD)是從數據中自動抽取模型。數據挖掘包括許多步驟:從大規模數據庫中(或從其他來源)**數據;選擇合適的特征屬性;挑選合適的樣本策略;剔除數據中不正常的數據并補足不夠
近年來,隨著移動互聯網和自媒體的興起與發展,互聯網空間日益豐富、熱鬧,人人享有“麥克風”的時代逐漸成為現實,網絡空間一度成為眾聲喧嘩之地。然而,在拓展人們生活空間的同時,互聯網中的不實信息、不良行為等“負能量”和“噪音”也開始滋生傳播,不僅侵害個人隱私和財產安全,也威脅著從虛擬空間到現實空間的秩序。 信息網絡以激濁揚清為**要義。網絡化生活已成為人們的基本生活形態,對于廣大群眾來說,信息網絡絕不
當今,信息技術為人類步入智能社會開啟了大門,帶動了互聯網、物聯網、電子商務、現代物流、網絡金融等現代服務業發展,催生了車聯網、智能電網、新能源、智能交通、智能城市、**裝備制造等新興產業發展.現代信息技術正成為各行各業運營和發展的引擎.但這個引擎正面臨著大數據這個巨大的考驗.各種業務數據正以幾何級數的形式爆發,其格式、收集、儲存、檢索、分析、應用等諸多問題,不再能以傳統的信息處理技術加以解決,對
漢語分詞(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。中文分詞是其他中文信息處理的基礎,搜索引擎只是中文分詞的一個應用。其他的比如機器翻譯(MT)、語音合成、自動分類、自動摘要、自動校對等等,都需要用到分詞。 漢語自動分詞是目前中文信息處理領域公認的一大難題,也是自然語言理解研究領域
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: