本書全面探討了科技文本分析的智能方法,以情報(bào)學(xué)理論為支撐,以人工智能技術(shù)為核心,結(jié)合現(xiàn)代情報(bào)工程的前沿實(shí)踐經(jīng)驗(yàn),對(duì)科技文本分析的任務(wù)圖景、智能方法實(shí)現(xiàn)以及技術(shù)發(fā)展趨勢(shì)進(jìn)行了系統(tǒng)研究。首先分析了科技文本分析的概念、任務(wù)、實(shí)現(xiàn)流程和發(fā)展歷史,系統(tǒng)性地提出了科技文本分析的任務(wù)圖景。其次,深入論述科技文獻(xiàn)的智能化版式分析方法、科技文本結(jié)構(gòu)分析的智能方法、科技文本詞匯功能分析的智能方法、科技文本中科技知識(shí)要素分析的智能方法,以及科技文本中引用片段的功能分析。再次,論述了科技文本中的科學(xué)機(jī)理識(shí)別、科技文本大模型等前沿課題,并簡(jiǎn)要分析科技文本中的偏見(jiàn)識(shí)別與環(huán)節(jié)、多模態(tài)科技文本分析等高階任務(wù)。最后,分析了科技文本分析智能方法的發(fā)展趨勢(shì)。
程齊凱,武漢大學(xué)副教授,博導(dǎo),智能與創(chuàng)新治理研究所所長(zhǎng),長(zhǎng)期從事情報(bào)分析、文本挖掘研究,主持自科面上項(xiàng)目等項(xiàng)目8項(xiàng);發(fā)表SSCI、SCI、CSSCI及以上論文70余篇;獲教育部高等學(xué)?茖W(xué)研究?jī)?yōu)秀成果獎(jiǎng)二等獎(jiǎng)在內(nèi)省部級(jí)獎(jiǎng)勵(lì)8次。
馬永強(qiáng),博士,講師,畢業(yè)于武漢大學(xué)信息管理學(xué)院,師從陸偉教授。研究方向?yàn)橹悄芮閳?bào)技術(shù)、科技文本挖掘,在IP&M、ESWA、情報(bào)學(xué)報(bào)及ACL等期刊、會(huì)議發(fā)表論文十余篇,被引兩百余次,相關(guān)研究成果在業(yè)內(nèi)多次成功落地應(yīng)用。
導(dǎo)言/001 第一章 科技文本與科技文本分析/005 一 基礎(chǔ)概念/005 二 科技文本的模態(tài)類型與結(jié)構(gòu)層級(jí)/009 三 科技文本分析的任務(wù)體系/015 四 科技文本分析面臨的難題/025 五 走向智能化的科技文本分析技術(shù)/029 六 本章小結(jié)/033 第二章 科技文本中蘊(yùn)含的知識(shí)體系/034 一 通用知識(shí)類型劃分/035 二 本體視角下的科技文本知識(shí)類型/037 三 科技文本知識(shí)的本體類型域/045 四 文本結(jié)構(gòu)視角下的科技文本知識(shí)體系/047 五 本章小結(jié)/057 第三章 第一性原理視角下的科技文本智能分析/059 一 科技文本分析的認(rèn)識(shí)論觀點(diǎn)/060 二 從認(rèn)識(shí)論觀點(diǎn)到方法論觀點(diǎn)/064 三 本章小結(jié)/068 第四章 科技文獻(xiàn)的版式識(shí)別/069 一 科技文獻(xiàn)版式分析的任務(wù)和方法/069 二 科技文獻(xiàn)圖表分析的任務(wù)和方法/079 三 基于動(dòng)態(tài)版式數(shù)據(jù)集生成的版式分析方法/083 四 交互式科技文獻(xiàn)圖表細(xì)粒度理解/090 五 本章小結(jié)/110 第五章 科技文本的結(jié)構(gòu)功能分析/112 一 科技文本結(jié)構(gòu)功能的定義與任務(wù)/112 二 科技文本結(jié)構(gòu)功能的自動(dòng)識(shí)別方法/117 三 科技文本的結(jié)構(gòu)功能識(shí)別/121 四 本章小結(jié)/136 第六章 科技文本的詞匯功能分析/137 一 科技文本詞匯功能分析的任務(wù)定義/137 二 科技文本詞匯功能識(shí)別的低成本實(shí)現(xiàn)方法/142 三 科技文本詞匯功能識(shí)別的預(yù)訓(xùn)練語(yǔ)言模型方法/156 四 本章小結(jié)/163 第七章 科技文本的科技知識(shí)要素分析/165 一 科技知識(shí)要素的類型/165 二 科技知識(shí)要素識(shí)別的一般方法與實(shí)現(xiàn)/168 三 面向設(shè)備計(jì)量的設(shè)備概念識(shí)別與分析/174 四 本章小結(jié)/180 第八章 科技文本的引用片段識(shí)別及引用功能分析/181 一 科技文本引用功能分析的任務(wù)定義/182 二 科技文本引用片段定位/184 三 科技文本引用片段引用動(dòng)機(jī)識(shí)別/190 四 超越文檔粒度的知識(shí)要素引用網(wǎng)絡(luò)構(gòu)建與分析/194 五 本章小結(jié)/201 第九章 科技文本的科學(xué)機(jī)理識(shí)別與表示/203 一 科學(xué)機(jī)理抽取的任務(wù)定義/204 二 科學(xué)機(jī)理的表示方法/208 三 科技機(jī)理抽取數(shù)據(jù)集的構(gòu)建/213 四 基于預(yù)訓(xùn)練語(yǔ)言模型的科學(xué)機(jī)理抽取方法/216 五 科學(xué)機(jī)理文本的檢索與應(yīng)用/222 六 本章小結(jié)/227 第十章 科技文本大模型的構(gòu)建與應(yīng)用/228 一 科技文本大模型的通用能力體系/229 二 科技文本大模型的痛點(diǎn)、問(wèn)題與方向/232 三 可信可靠科技文本大模型的構(gòu)建思路/237 四 超越下一詞預(yù)測(cè)的科技文本大模型/249 五 本章小結(jié)/267 參考文獻(xiàn)/268