數據密集型科研范式下,科學研究越來越依賴大量的、規(guī)范的、可靠的數據,但可用的大數據集難以獨立生成,科學數據共享是解決可用數據缺乏、實現數據潛在價值的重要途徑。在此背景下,有必要進一步關注不同視角下科研人員在日?蒲谢顒又械臄祿蚕硇枨、影響機理、模式及演化博弈策略,并針對特定問題展開實證分析,以豐富科學數據領域的研究成果,為后續(xù)研究提供一定的理論參考和實證支持,并為科學數據管理與共享實踐提供新思路、新方案。
為此,本書開展了以下工作。第一,分別設計數據提供者與使用者雙重視角下的科學數據共享需求量表,并利用一手數據進行驗證與分析。采用形式概念分析的方法構建使用者需求概念格,提取關聯(lián)規(guī)則,進而揭示不同需求之間的關聯(lián)性。第二,結合社會資本、計劃行為、雙路徑等理論,分別構建雙重視角下科學數據共享影響因素理論模型,并展開實證檢驗或仿真分析。第三,初步搭建基于區(qū)塊鏈的數據共享模式架構,分析其流程、特點與實現技術。構建數據密集型科研范式下的科學數據管理模式。第四,結合主體間性理論與演化博弈理論,針對科學數據共享活動中的數據生產者、數據使用者及數據管理平臺,構建三方演化博弈模型,探討各主體共享的演化策略與系統(tǒng)演化均衡點。從科技計劃項目科學數據匯交政策、科學數據與科技文獻的關聯(lián)、科學數據管理方面提出共享策略。
本書的主要研究發(fā)現有以下幾點。第一,提供者視角的需求包含數據安全、數據管理平臺、自我價值實現、社交、利益回報 5個維度,其中,數據安全是其最為強烈的需求。從使用者角度來看,數據內容質量、數據獲取效率及平臺的安全性是焦點需求,且性別與學科背景是造成需求差異的主要因素。第二,提供者的信任、互惠、社會互動正向影響共享態(tài)度,且共享態(tài)度與感知行為控制正向影響共享意愿;數據質量正向調節(jié)感知行為控制、共享態(tài)度、主觀規(guī)范與共享意愿之間的關系。此外,信任共享態(tài)度共享意愿路徑是驅動科學數據共享的基本邏輯,互惠、社會互動、數據質量對信任有顯著的正向影響,而主觀規(guī)范對共享意愿的影響不顯著。不同情境下的信任速率、初始感
科學數據共享機理與實證研究
知行為控制、初始共享意愿均對科學數據共享意愿產生影響。使用者的感知有用性和感知易用性受到數據來源可信度的正向影響,并通過共享意愿影響共享行為,且感知易用性正向影響感知有用性。第三,基于區(qū)塊鏈的去中心化共享模式具有靈活性高、安全性強、可追溯、可信任等優(yōu)勢,可有效促進數據共享。在數據密集型科研范式下,科學數據管理模式的創(chuàng)新與發(fā)展非常重要,構建的新模式有助于更好地實現科學數據的價值。第四,各主體受相關收益、成本和風險的影響有所差別,其共同點是兩種策略下的凈收益差值越大越有利于選擇凈收益數值大的策略。在一定條件下,該三方博弈系統(tǒng)能夠最終穩(wěn)定于數據生產者和數據使用者均參與共享、數據管理平臺積極監(jiān)管的理想狀態(tài)。
本書是團隊對多年研究成果的系統(tǒng)梳理與完善,是集體智慧的結晶。本書由中國科學技術信息研究所科技報告服務與產業(yè)情報研究中心鄭彥寧主任大力指導,支鳳穩(wěn)主筆統(tǒng)稿。團隊的其他成員也做出了突出貢獻,陳佳琪參與第1、第4章的撰寫,孟佳琪參與第2章的撰寫,張萌參與第3、第5、第6、第7、第 8章的撰寫,彭兆祺參與第 4、第 11章的撰寫,趙夢凡參與第 5、第 8、第11、第 12章的撰寫,云仲倫、張閃閃參與第 9章的撰寫,史潔參與第 10章的撰寫,韓夢嬌參與第 11、第 13章的撰寫,書中部分繪圖由徐楊嬌完成,陳佳琪、韓夢嬌、馬小琪參與本書的文字校對工作。
本書是河北省高等學校人文社會科學研究項目元宇宙時代科學數據共享模式及其應用研究(項目編號:BJS2022027)、中國博士后基金面上項目科學數據共享模式及驅動機制研究(項目編號:2018M641446)和河北省數字治理與協(xié)同治理研究基地的研究成果之一。另外,本書的出版得到了河北大學管理學院、科學技術文獻出版社的大力支持,在此一并致謝!
第一篇基礎篇 1
第 1章 緒論3
11 研究背景 3 12研究問題與意義 5 13研究思路與方法 6 14研究內容安排 8 15創(chuàng)新之處 9
第 2章國內外研究現狀11
21方法與數據來源 11 22國內研究現狀 13 23國外研究現狀 17 24國內外對比 22 25研究評論 23
第 3章科學數據共享的理論基礎25
31社會學視角 25 311社會交換理論26 312制度理論26 313仿真理論27
32心理學視角 28 321社會認知理論28 322計劃行為理論28 323雙路徑理論29
33管理學視角 30
331技術接受模型30
332利益相關者理論30 34不同理論視角的比較分析31 35科學數據共享的動因、方式與價值33 351科學數據共享的動因 33 352科學數據共享的方式 34 353科學數據共享的價值 34 36整合理論框架構建35
第二篇需求篇 37
第 4章提供者的科學數據共享需求分析39
41調查問卷設計與數據收集40 411調查問卷設計40 412數據來源與預處理 41 413樣本特征描述性統(tǒng)計 41 42數據分析 43 421信度檢驗43 422效度檢驗45 43信度重測與最終量表50 44需求分析與討論 51 441提供者的共享需求特征 51 442不同共享意愿提供者的需求對比52
第 5章使用者的科學數據共享需求分析55
51科學數據共享需求調查56 511問卷設計56 512數據收集與樣本特征 57 513數據分析與預處理 58 52形式背景與概念格59
521形式背景導出59
522概念格生成61 53關聯(lián)規(guī)則 62 531總體關聯(lián)規(guī)則挖掘 62 532不同類型關聯(lián)規(guī)則挖掘 63 54結果分析與討論 66
第三篇機理篇 69
第 6章提供者科學數據共享意愿影響因素實證基于 TSC與 TPB71
61理論進展 72 611社會資本理論72 612計劃行為理論72 62研究假設與理論模型73 621社會資本與共享態(tài)度 73 622計劃行為與共享意愿 75 623數據質量的調節(jié)作用 75 624理論模型76 63問卷設計與數據收集77 631問卷設計77 632數據收集78 64數據分析與模型檢驗78 641描述性統(tǒng)計分析78 642信效度分析80 643模型擬合檢驗82 644調節(jié)效應檢驗83 65實證結果分析 83
第 7章提供者科學數據共享意愿影響因素實證與仿真基于 SOR和 SD87
71理論進展 88 711共享意愿影響因素 88 712刺激機體反應理論 88 72研究假設與理論模型89 721刺激與機體89 722刺激與反應90 723機體與反應91 724共享態(tài)度與共享意愿 91 73實證檢驗 92 731數據獲取92 732描述性統(tǒng)計分析93 733信度與效度檢驗93 734結構方程模型檢驗 95 74系統(tǒng)動力學仿真 96 741存量流量圖構建96 742自然狀態(tài)下的科學數據共享意愿仿真98 743不同情境下的科學數據共享意愿仿真99 75結果分析與討論 102
第 8章使用者科學數據共享行為影響因素實證基于 ELM和 TAM 105
81理論進展 106 811雙路徑模型106 812技術接受模型107 82研究假設與理論模型108 821科學數據質量與感知有用性、感知易用性108 822數據來源可信度與感知有用性、感知易用性108 823感知易用性與感知有用性 109
824感知有用性、感知易用性與共享意愿109
825共享意愿與共享行為 110 826理論模型構建110 83問卷設計與數據收集111 831問卷設計111 832數據收集113 84數據分析和模型檢驗113 841描述性統(tǒng)計分析113 842信度分析115 843效度分析115 844模型檢驗117 85實證結果分析 118
第四篇模式篇 121
第 9章基于區(qū)塊鏈的科學數據共享模式 123
91理論進展 124 911個人科學數據共享 124 912區(qū)塊鏈應用于科學數據共享的相關研究124 92現有共享模式的問題分析126 921數據確權問題126 922數據安全問題126 923隱私保護問題127 924數據標準不統(tǒng)一問題 127 925數據近似化問題127 926激勵機制問題128 93基于區(qū)塊鏈的科學數據共享模式構建128 931模式架構模型128 932模式所涉及的具體流程 130 933模式特點分析130
94共享模式實現 132
941區(qū)塊鏈與 SQL數據庫結合實現分布式數據存儲132
942基于 SQL的智能合約激勵共享參與主體133 943萬能數據結構表實現數據標準化134 944加密算法實現數據可用不可見135 945共識機制控制數據調用規(guī)模 136
第 10章數據密集型科研范式下的科學數據管理模式 139
101傳統(tǒng)科學數據管理模式139 102新范式對科學數據管理模式的新要求140 1021整合數據資源,建立數據關聯(lián)性140 1022管理模式智能化、動態(tài)化 141 1023應用新興技術,挖掘潛在價值 141 103不同生命周期階段的科學數據管理任務 141 1031數據產生與采集143 1032數據處理與分析143 1033數據描述與組織143 1034數據保存與歸檔144 1035數據發(fā)布與共享144 1036數據挖掘與再利用 145 104新范式下科學數據管理模式構建145 1041科學數據管理過程 146 1042科學數據管理手段 147 1043科學數據管理與共享機制 147
第五篇策略篇 149
第 11章科學數據共享主體的演化博弈策略 151
111理論發(fā)展 152 1111主體間性理論152
1112演化博弈理論153
112演化博弈模型構建154 1121問題描述154 1122模型假設156 1123收益矩陣158 113模型演化穩(wěn)定分析159 1131數據生產者159 1132數據使用者161 1133數據管理平臺163 1134三方博弈系統(tǒng)165 114數值仿真與驗證 168 1141三方博弈系統(tǒng)的演化路徑 169 1142不同參數對各主體策略選擇的影響172 115結果分析與啟示 175
第 12章促進科學數據共享的策略建議 179
121完善科學數據匯交政策179 1211具體化涉密數據的匯交辦法 179 1212增強數據匯交政策的創(chuàng)新性 180 1213完善數據匯交的評價體系 181 1214健全數據匯交的激勵機制 181 1215嚴格數據匯交制度 182 122強化科學數據與科技文獻的關聯(lián)182 1221完善科學數據相關政策體系 182 1222豐富科學數據平臺的服務功能 183 1223增加可關聯(lián)文獻的類型 185 1224加強相關主體之間的合作 185 123加強科學數據管理與共享186 1231完善相關框架、設施與政策 187 1232增強科學數據平臺的安全性與透明性187 1233加大科研資助機構支持力度 188
1234加強對數據共享的宣傳、管理與保護188
1235注重數據質量與安全 189 1236提升科學數據重用意愿 189
第六篇總結篇 193
第 13章研究總結與展望 195
131主要研究結論 195 132研究貢獻 196 133研究不足與展望 196
參考文獻 199