本書主要從理論體系和方法實踐兩方面展開。在理論體系篇,在介紹科學預測的內(nèi)涵、發(fā)展與面對的困境后,著重從科學影響力預測、科學行為預測、學科主題預測三方面構建科學預測內(nèi)容理論體系,主要構建論文影響力、學者影響力、期刊影響力、專利影響力、機構影響力、選題行為、合作行為、引用行為、學科主題發(fā)展狀態(tài)、學科主題鏈路關系十個預測維度,系統(tǒng)介紹科學預測這一領域的理論體系、方法思路、模型算法、數(shù)據(jù)特征等,集圖機器學習、大模型、深度學習于一體,為科學預測提供了一套相對系統(tǒng)的理論和方法體系框架。在方法實踐篇,基于同構圖神經(jīng)網(wǎng)絡、異構圖神經(jīng)網(wǎng)絡、文本表示學習、深度學習、機器學習、大數(shù)據(jù)分析等技術,分別構建學科主題熱度預測模型、跨學科主題鏈路預測模型、學者跨學科合作測度指標與預測模型、跨學科引文預測模型、學者跨學科選題行為預測模型等,分別以國內(nèi)外信息資源管理學科數(shù)據(jù)、“清北人”三所高校學者數(shù)據(jù)、PubMed生命與醫(yī)學全量數(shù)據(jù)、數(shù)字人文領域數(shù)據(jù)等為例,從不同維度進行實證,為科學預測提供一系列方法指導和具體的應用示范。本書可作為高等學校計算機科學、信息科學、信息資源管理等專業(yè)的指導書或教學參考書,也可作為科技情報、圖機器學習、圖神經(jīng)網(wǎng)絡、復雜網(wǎng)絡、大模型等工作者的參考書。
本書可作為高等學校計算機科學、信息科學、信息資源管理等專業(yè)學者研究的專業(yè)指導書籍以及教學參考書,亦可為從事科技情報、圖機器學習、圖神經(jīng)網(wǎng)絡、復雜網(wǎng)絡、大模型的實際工作者的參考書籍。
前 言PREFACE
凡事預則立,不預則廢。如何從海量科學文獻數(shù)據(jù)中識別出科學的演化模式
以及科研行為的演化規(guī)律,并通過建模量化表征其蘊含的規(guī)律,預測科學生態(tài)的
未來發(fā)展趨勢及創(chuàng)新路徑,為學者開展新的或跨學科研究提供指導,已經(jīng)成為現(xiàn)
代科學攻關和科研競技的重要命題。在科學復雜系統(tǒng)理論和萬物皆可“圖”
思想的指導下,人類的科學研究是有規(guī)律可循的,是可以預測的,本書旨在塑造
科學預測這一新的研究領域的知識體系,主要包含理論體系和方法實踐兩部分。
在理論體系篇,本書介紹科學預測的研究背景與意義、內(nèi)涵、面對的困境與
機遇,著重從科學影響力預測、科學行為預測、學科主題預測三方面構建科學預
測內(nèi)容的理論體系,主要構建論文影響力、學者影響力、期刊影響力、專利影響力、
機構影響力、選題行為、合作行為、引用行為、學科主題發(fā)展狀態(tài)、學科主題鏈
路關系十個預測維度,系統(tǒng)介紹科學預測這一領域的理論體系、方法思路、模型
算法、數(shù)據(jù)特征等,集圖機器學習、大模型、深度學習于一體,為科學預測提供
了一套相對系統(tǒng)的理論和方法體系框架。
在方法實踐篇,基于同構圖神經(jīng)網(wǎng)絡、異構圖神經(jīng)網(wǎng)絡、文本表示學習、深
度學習、機器學習、大數(shù)據(jù)分析等技術,分別構建學科主題熱度預測模型、跨學
科主題鏈路預測模型、學者跨學科合作測度指標與預測模型、跨學科引文預測模
型、學者跨學科選題行為預測模型等,分別以國內(nèi)外信息資源管理學科16 萬余
篇科學文獻數(shù)據(jù)、“清北人”三所高校23 萬余位學者數(shù)據(jù)、PubMed 生命與醫(yī)學
數(shù)據(jù)庫3356 萬余條跨學科引文關系數(shù)據(jù)、數(shù)字人文學科交叉領域數(shù)據(jù)等為例,
從不同維度進行實證,為科學預測提供一系列方法指導和具體的應用示范。
首先,作者要感謝恩師武漢大學馬費成教授、中國人民大學馮惠玲教授對本
人在此研究領域的持續(xù)指導和大力支持,感謝中國人民大學盧小賓教授、中國人
民大學索傳軍教授、武漢大學陸偉教授對本書題目和版塊內(nèi)容的指導。其次,感
謝近年來與本人在科學預測領域并肩開拓的韓粵吉、李文靜、但婷婷、羅飛、高
兆盛等同學為本書做出的貢獻。最后,感謝國家自然科學委員會、中國人民
大學信息資源管理學院學術委員會對我們的研究工作的大力支持。感謝本書的每
一位讀者,正是你們的閱讀實現(xiàn)了本書的價值,如果本書的任何一部分能夠給你
們帶來一點點啟發(fā),我們都會由衷感到高興。
霍朝光
2025 年5 月于中國人民大學
目 錄CONTENTS
理論體系篇
第1 章科學預測的內(nèi)涵和發(fā)展 .2
1.1 科學預測的研究背景與意義
3
1.2 科學預測的內(nèi)涵
8
1.3 科學預測之困與機遇
9
第2 章科學影響力預測.12
2.1 科學影響力預測內(nèi)涵13
2.2 論文影響力預測.14
2.2.1 基于引證指標的論文影響力預測15
2.2.2 基于替代計量指標的論文影響力預測16
2.2.3 論文影響力預測的相關特征 .16
2.3 學者影響力預測.17
2.3.1 基于學者影響因子的學者影響力預測18
2.3.2 基于H-index、Q-value 等指數(shù)的學者影響力預測 .19
2.3.3 基于引文數(shù)量的學者影響力預測19
2.3.4 基于網(wǎng)絡結構的學者影響力預測20
2.4 其他科學影響力預測21
2.4.1 機構影響力預測 .21
2.4.2 期刊影響力預測 .22
2.4.3 項目影響力預測 .23
2.4.4 專利影響力預測 .23
2.4.5 相關特征24
2.5 科學影響力預測體系25
Kxczw(新).indd 3
2025/8/5 14:29:09
2.5.1 科學影響力預測指標體系25
2.5.2 科學影響力預測方法體系26
2.5.3 科學影響力預測特征體系28
2.6 本章小結29
第3 章科學行為預測 .33
3.1 科學行為預測內(nèi)涵 34
3.2 選題行為預測 .35
3.2.1 選題行為模式分析.36
3.2.2 基于二模網(wǎng)絡的選題行為預測.37
3.3 合作行為預測 .39
3.3.1 融合網(wǎng)絡結構和個體屬性等多指標的合作行為預測 .40
3.3.2 表示學習視角下的合作行為預測40
3.3.3 持續(xù)合作視角下的合作行為預測41
3.3.4 情境限制視角下的合作行為預測42
3.3.5 合作推薦視角下的合作行為預測43
3.3.6 學者主觀視角下的合作行為預測44
3.4 引用行為預測 .45
3.4.1 節(jié)點影響力和關系權重視角下的引用行為預測 46
3.4.2 不同拓撲模式視角下的引用行為預測47
3.4.3 引文推薦視角下的引用行為預測48
3.5 科學行為預測研究模式總結.49
3.5.1 科學行為預測中的方法體系 .49
3.5.2 科學行為預測中的數(shù)據(jù)支持 .52
3.5.3 科學行為預測中的心理機制 .53
3.6 本章小結55
第4 章學科主題預測 .56
4.1 學科主題的內(nèi)涵與刻畫 57
Kxczw(新).indd 4
2025/8/5 14:29:11
4.1.1 定性概括層面的學科主題.57
4.1.2 定量詞匯組合層面的學科主題.58
4.1.3 單一詞匯表征層面的學科主題.59
4.2 學科主題發(fā)展態(tài)勢預測 60
4.2.1 基于學科主題出現(xiàn)頻次衍生出來的相關指標62
4.2.2 基于主題模型衍生出來的相關指標 62
4.2.3 基于引證關系衍生出來的相關指標 62
4.2.4 基于替代計量衍生出來的相關指標 63
4.3 學科主題關系預測 64
4.3.1 基于鏈路預測的學科主題關系預測 64
4.3.2 基于學術實體相互作用的學科主題關系預測65
4.4 本章小結65
方法實踐篇
第5 章基于LSTM 神經(jīng)網(wǎng)絡的學科主題熱度預測 68
5.1 引言.69
5.2 研究設計70
5.2.1 基于LDA 模型的學科主題抽取 71
5.2.2 基于期刊影響因子的學科主題熱度計算模型71
5.2.3 基于LSTM 的學科主題熱度預測模型72
5.3 數(shù)據(jù)處理74
5.3.1 數(shù)據(jù)收集74
5.3.2 學科主題抽取75
5.3.3 學科主題熱度計算.76
5.4 模型評價76
5.4.1 評價指標77
5.4.2 模型檢驗77
Kxczw(新).indd 5
2025/8/5 14:29:12
5.5 方法應用79
5.5.1 研究熱點預測分析.79
5.5.2 學科增長點預測分析80
5.6 本章小結82
第6 章基于圖神經(jīng)網(wǎng)絡的跨學科主題鏈路預測.84
6.1 引言.85
6.2 相關研究86
6.2.1 跨學科研究與跨學科主題86
6.2.2 數(shù)字人文87
6.2.3 共現(xiàn)網(wǎng)絡88
6.2.4 鏈路預測89
6.3 研究設計89
6.4 實驗檢驗94
6.4.1 數(shù)據(jù)獲取與數(shù)字人文領域的學科分析94
6.4.2 數(shù)字人文共現(xiàn)網(wǎng)絡的構建95
6.4.3 預測結果評價96
6.5 討論.98
6.5.1 結果討論98
6.5.2 應用和分析 99
6.6 本章小結.102
第7 章學者跨學科合作交叉測度與預測.103
7.1 引言104
7.1.1 學者跨學科合作交叉測度研究背景 104
7.1.2 學者跨學科合作預測研究背景105
7.2 研究現(xiàn)狀.106
7.2.1 學者跨學科合作交叉測度106
7.2.2 跨學科交叉測度指標.108
Kxczw(新).indd 6
2025/8/5 14:29:12
7.2.3 學者合作預測110
7.3 學者跨學科合作測度框架設計 .112
7.3.1 學者跨學科合作學科多樣性測度指標112
7.3.2 學者跨學科合作網(wǎng)絡凝聚性測度指標115
7.4 中國人民大學學者跨學科合作交叉測度117
7.4.1 數(shù)據(jù)收集和處理 117
7.4.2 中國人民大學學者合作網(wǎng)絡構建.121
7.4.3 中國人民大學學者跨學科交叉測度結果與分析 122
7.4.4 測度結果討論125
7.5 “清北人”三大高校學者跨學科合作交叉情況對比分析 126
7.5.1 數(shù)據(jù)收集和預處理126
7.5.2 三大高校學者合作總體情況分析.128
7.5.3 “清北人”三大高校跨學科合作網(wǎng)絡結構分析 132
7.6 學者跨學科合作預測框架設計 .136
7.6.1 學者跨學科合作預測框架136
7.6.2 學者跨學科合作預測模型136
7.6.3 實驗設置.137
7.6.4 性能評估.138
7.6.5 預測結果與討論 138
7.7 本章小結.140
第8 章基于圖神經(jīng)網(wǎng)絡的跨學科引文預測 141
8.1 引言142
8.2 相關工作.144
8.2.1 基于內(nèi)容過濾的引文預測144
8.2.2 基于協(xié)同過濾的引文預測145
8.2.3 基于圖的引文預測147
8.3 研究設計.148
8.3.1 數(shù)據(jù)預處理 150
8.3.2 跨學科引文預測模型構建151
Kxczw(新).indd 7
2025/8/5 14:29:12
8.4 實驗與結果分析153
8.4.1 數(shù)據(jù)準備.153
8.4.2 實驗設計.154
8.4.3 評價指標.155
8.4.4 實驗結果與分析 156
8.5 本章小結.161
第9 章基于異構圖神經(jīng)網(wǎng)絡的學者跨學科選題預測.162
9.1 引言163
9.2 相關研究.164
9.2.1 學者研究選題推薦研究現(xiàn)狀 164
9.2.2 跨學科研究主題推薦策略相關研究 167
9.2.3 異構信息網(wǎng)絡推薦方法 170
9.3 研究設計.173
9.3.1 研究框架.173
9.3.2 基本概念與問題定義.175
9.4 學者和研究主題的跨學科關系 .178
9.4.1 學者學科標識178
9.4.2 研究主題的跨學科標識 181
9.5 基于異構圖神經(jīng)網(wǎng)絡的跨學科主題預測模型.182
9.5.1 特征抽取和表示 183
9.5.2 HetGNN 異構圖神經(jīng)網(wǎng)絡模型185
9.5.3 機器學習分類器 186
9.6 實證研究.188
9.6.1 數(shù)據(jù)收集與預處理188
9.6.2 異構信息網(wǎng)絡構建190
9.6.3 評價指標.194
9.6.4 實驗過程.195
9.6.5 實驗結果與分析 196
9.7 本章小結.198