時間:2023-04-11 17:19:56
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇中醫藥管理論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
關鍵詞:知識圖譜;中醫藥;應用前景;綜述
DOI:10.3969/j.issn.1005-5304.2017.07.033
中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2017)07-0129-04
Abstract: As the new development of scientometrics and informetrics, knowledge graph has infiltrated into the financial, industrial and medical fields, and become a hot issue in the real world research. In this article, the concept and features of knowledge graph, construction and the existing softwares, the application status and development prospect in the TCM field were reviewed, which may provide references for research on the knowledge graph in the TCM field.
Key words: knowledge graph; TCM; application prospect; review
隨著2012年谷歌第一版知識圖譜的,特定領域的知識圖譜構建成為真實世界研究中的熱點問題。從搜索引擎優化,到新藥發現,知識圖譜在學術界掀起了一股熱潮,并滲透到金融、工業和醫學等領域。這種以科學學為基礎,涉及應用數學、信息學及計算機學等多學科的可視化技術,成為科學計量學和信息計量學的新發展方向。本文就知識圖譜的概念、特點及其在中醫藥領域的應用現狀、前景進行梳理,以期為中醫藥領域知識圖譜相關研究提供參考。
1 知識圖譜概念及特點
1.1 知識圖譜的概念
在知識圖譜的定義上,陳悅等[1-2]從其功能角度進行闡釋,認為知識圖譜能夠可視化地描述人類隨時間擁有的知識資源及其載體,繪制、挖掘、分析和顯示科學技術知識以及它們之間的相互聯系,在組織內創造知識共享的環境以促進科學技術研究的合作和深入。楊國立等[3]從理論和方法層面,將其定義為把應用數學、計算機科學、科學學、信息科學等學科的理論和方法與科學計量學引文分析、共現分析、社會網絡分析等方法結合,用可視化的圖譜形象地揭示科
學發展進程和結構關系的一種研究方法,屬于科學計量學的范疇。
楊思洛等[4]提出知識圖譜有廣義與狹義之分,廣義上可包括生物的基因圖譜、教育教學中的認知地圖、探索太空的天體圖、描繪地形的地理信息系統(GIS)圖、模擬人腦的神經網絡圖、各種金屬圖譜等;狹義的知識圖譜主要是運用文獻計量學方法,通過文獻知識單元分析來可視化科學知識的結構、關系與演化過程,包括“科學圖”“文獻計量圖”“文獻圖”“知識圖譜”等。
簡言之,知識圖譜是隨著計算機技術的發展,應用數學算法來簡化知識單元結構以達到可視化知識結構關系的一種方法,是顯示科學知識的發展進程與結構關系的一種圖形,是一種有效的知識管理工具。
1.2 研究對象
知識圖譜所描繪的對象主要包括:①從事科學技術活動和作為知識載體的人,包括科學家、技術專家、項目組、實踐團體或某一知識領域共同體;②顯性或編碼化的知識,如論文、專利、所學課程、數據庫等;③過程或方法,包括研究問題和解決問題的過程或方法、組織的業務流程,以及相關的知識投入等。
知識圖譜主要源于三大領域:①計算機科學領域的數據、信息、知識與知識域可視化研究;②圖書情報領域的引文分析可視化、知識地圖和知識網絡等研究;③復雜網絡系統和社會網絡分析的研究。上述領域的研究方向和內容正在走向融合[5]。
2 知識圖譜繪制流程
參考國內外已有研究,目前知識圖譜的繪制主要包括以下幾個版塊[4,6-7]。
數據檢索:繪制知識圖譜的基礎,其數據源在傳統文獻數據庫的基礎上逐漸擴展到出版商、機構聯盟等機構網站的網絡日志、用戶記錄、點擊流數據等。
數據清洗:即對數據的預處理,包括、勘誤等,進行歷時或分時段對比分析時需要對數據M行分段處理;若樣本數據過大或分析目的不同,則需要進行有代表性的抽取。
構建關系矩陣:選擇要分析的知識單元,如關鍵詞、題名、作者等,構建其相互關系,常用方法有共詞分析、共引分析、共作者分析、書目耦合分析、期刊耦合分析等。
數據標準化:根據數據間的相似度對數據進行標準化,常用方法有集合論方法(Cosine、Pearson、Spearman、Ochiai、Jaccard指數等)和概率論方法(合力指數、概率親和力指數等)。
數據簡化:運用因子分析、多為尺度分析、自組織映射圖、尋徑網絡圖譜、聚類分析、潛在語義分析、三角法等方法處理數據以更好地展示各數據單元。
可視化展示:是知識圖譜構建過程中最重要的一環,通過運用不同的算法,調整相關參數,構建整個圖譜。可通過不同模擬實現可視化,如幾何圖、戰略圖、沖積圖、主題河圖、地形圖、星團圖、簸幅圖等。
圖譜解讀:采用歷時分析、突變檢測、空間分析、網絡分析等方法對圖譜進行解讀,同時需要結合研究者的經驗、知識、學術背景、學術功底等。
3 知識圖譜繪制軟件
目前可用于知識圖譜繪制的軟件非常豐富,根據主要功能可分為2類[4]:一類為通用軟件,如SPSS、社會網絡分析軟件Ucinet和Pajek、詞頻分析軟件Wordsmith Tools和GIS相關軟件;另一類為繪制知識圖譜的專用軟件,如CiteSpace、Bibexcel、Gephi、VOSviewer、VantagePoint、Network Workbench Tool、NWB、Sci2 Tool、In-SPRIE、SciMAT、Histcite、GeoTime、ColPalRed、Guess、Leydesdorff、Jigsaw、Carrot等。分析各軟件的特點[6,8-9]可以看出,隨著知識圖譜的繪制軟件越來越多,一方面其支持的數據格式愈發多樣,相互之間的兼容性也逐步增強;另一方面,在可視化效果方面也日趨完善,知識展示的真實度、準確度逐漸提高。詳見表1。
4 知識圖譜在中醫藥領域的應用
目前知識圖譜的研究中,國外學者主要集中在2個研究方向[10]:部分偏于技術研究,包括可視化工具和算法的開發;部分以應用為主,利用科學計量學理論及相關方法、知識圖譜軟件等進行分析研究。國內研究也可分為2個方向:部分以科學計量學為理論基礎,利用可視化方法研究科學學與管理學、科學技術合作等領域;部分以電子資源數據庫為數據源,通過可視化方式展示某一學科的研究前沿和發展動向。
4.1 應用現狀
醫學領域各學科中采用知識圖譜理論與方法進行的研究尚處于起步階段,中醫藥領域已有部分學者開展了相關研究。
在學科層面,趙蓉英等[11]以Web of Science為數據來源,運用CiteSpace對中醫研究領域的研究熱點進行了可視化探索。徐浩等[12]以我國醫藥衛生領域中文核心期刊文獻為數據來源,對我國中醫學科交叉領域的研究熱點進行了可視化分析,但研究僅限于中醫學與醫藥衛生領域之間的合作。楊秦等[13]采用共詞分析及社會網絡方法對中醫外科瘡瘍領域的研究主題及分布進行了探索。
具體在疾病方面,譚火媛等[14]基于中國知識資源總庫(CNKI)收錄的近10年中醫藥治療高血壓相關文獻,對前沿與熱點研究進行了可視化分析。王淑斌等[15]對中西醫治療2型糖尿病的國內外研究進行了系統梳理。在證候方面,劉俊麗等[16]采用文本挖掘技術,通過數據清洗、實體抽取、構建共詞矩陣并采用Ucinet軟件繪制乙型肝炎熱點研究知識圖譜,分析了子模塊中的中醫證候描述及疾病名稱。秦義等[17-18]基于CiteSpace軟件對氣虛證、血瘀證證候診斷標準的相關研究進行了可視化分析。在中藥材方面,郭棟等[19]通過關鍵詞共現網絡和聚類圖對中藥枸杞的育種、種植、采收、加工、儲存等5個領域的研究進行了熱點分析。在治療措施方面,李祖偷[20]對針灸治療腰椎間盤突出癥常用腧穴的演變過程及施穴治療的變遷進行了可視化分析,胡松潔等[21]運用Ucinet軟件對“五行音樂”療法的發展脈絡進行了梳理。
此外,張靜[22]基于CNKI核心期刊文獻關鍵詞,探討了中醫藥專業人才培養熱點主題。陳姍姍等[23]對中醫藥傳播發展的研究文獻進行了可視化分析,榮光等[24]基于中醫電子病歷研究領域的相關文獻,構建了該領域的研究者、研究機構、關鍵詞的共現網絡。
上述研究主要集中在不同領域的研究現狀及熱點分析,多以期刊文獻為數據來源,多采用CiteSpace軟件構建研究者、研究機構、關鍵詞等信息的共現圖和聚類圖,從不同側面宏觀解釋了中醫學信息的整體結構特點。但針對特定研究目標,尚未形成一套明確的建模策略及技術,導致已有研究結果中也有差異甚至矛盾之處[5]。因此,中醫藥領域知識圖譜理論尚處在針對各學科結構宏觀概述階段,急需解決對多層信息深度整合的知識圖譜建模策略及其技術。
近年來,已有學者在中醫藥知識圖譜構建方法與標準化流程方面進行了嘗試和探索。于彤等[25]提出以中醫藥學語言系統(TCMLS)為框架,以中醫藥領域現有的術語和數據庫資源為內容,構建大型知識圖譜的構想,并進行了探索和實踐,但尚未實現中醫藥知識資源的有效整合及提供全面、及時、可靠的知識服務。阮彤等[26]基于文本抽取、關系數據轉換及數據融合等技術提出了中醫藥知識問答和輔助開藥領域的知識圖譜半自動化構建流程。此外,該課題組對知識圖譜進行了形式化定義,詳細描述了數據驅動的增量式知識圖譜構建方法,同時闡述了以此方法所構建的中醫藥知識圖譜在輔助開方領域的應用,但未涉及其它領域[27]。賈李蓉等[28]以中藥知識圖譜為例,從數據來源、研究內容、圖形化展示等方面探討如何構建中醫知識圖譜,但其應用尚局限于瀏覽檢索方面,對多種數據資源間的映射及數據元等標準未進行詳細論述。張德政等[29]提出了基于本體的中醫核心知識圖譜表示及其構建方法,對中醫本體與知識圖譜的映射方法進行了探索,為中醫知識圖譜的構建提供了較系統的方法流程,但對多源數據的獲取技術及中醫師臨床實際診療數據的研究未進行深入研究。王華珍等[30]以中醫慢性胃炎數據可視化處理為例,引入隨機森林(RF)技術進行可視化前的數據預處理,根據高維中醫數據的特征進行變換和降維,使數據在低緯空間呈現良好的分離性,從而增強了數據的可視化效果。
4.2 應用前景
知識圖譜研究已經滲透到金融、醫學和工業等領域,對知識圖譜定量與定性特征的科學理解已成為大數據時代科學研究中一個極其重要的挑戰性課題。結合自身知識體系的特點,中醫藥領域的知識圖譜研究應以從事相關領域活動和作為知識載體的人(如臨床醫學領域的醫師)、顯性或編碼化的知識(如癥狀、藥物等)、過程或方法(如辨證論治等)為研究對象,運用圖論、統計學、應用數學、數據挖掘等方法,研究知識之間多維網絡關系及演化規律等一系列問題。
在我國,中醫臨床研究領域的知識圖譜構建研究仍較滯后,研究大多處在術語本體領域的研究層面。知識圖譜在中醫藥領域有著廣闊的前景,如在中醫藥知識體系構架方面,可建立中醫藥知識地圖系統、維基百科系統[25]等;在中醫藥知識的推廣普及方面,可建立基于知識圖譜的信息檢索系統、基于自然語言的問答引擎[26]等;在臨床診療方面,可建立基于知識圖譜的四診信息采集、診斷、處方用藥系統;在醫師診療規律挖掘方面,可\用知識圖譜挖掘中醫師“病-證-治-效”臨床診療數據之間的相互關系和內在規律。因此,知識圖譜為開展中醫基礎理論體系、臨床診療規律研究提供了有利的工具,探索解決中醫臨床診療過程中多尺度非完整信息整合的核心技術,建立中醫藥知識圖譜構建的流程和規范將成為研究的熱點。
參考文獻:
[1] 陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究,2005,23(2):149-154.
[2] 陳悅,劉則淵,陳勁,等.科學知識圖譜的發展歷程[J].科學學研究, 2008,26(3):449-460.
[3] 楊國立,李品,劉竟.科學知識圖譜――科學計量學的新領域[J].科普研究,2010,5(4):28-34.
[4] 楊思洛,韓瑞珍.國外知識圖譜繪制的方法與工具分析[J].圖書情報知識,2012,20(6):101-109.
[5] 楊思洛,韓瑞珍.國外知識圖譜的應用研究現狀分析[J].情報資料工作,2013(6):15-20.
[6] 肖明,邱小花,黃界,等.知識圖譜工具比較研究[J].圖書館雜志, 2013,32(3):61-69.
[7] 陳超美.科學前沿圖譜――知識可視化探索[M].北京:科學出版社, 2014.
[8] 鄧君,馬曉君,畢強.社會網絡分析工具Ucinet和Gephi的比較研究[J].情報理論與實踐,2014,37(8):133-138.
[9] 侯月明,喬曉東,孫衛,等.開源分析工具在中文文獻分析中的應用[J].現代圖書情報技術,2013(3):71-76.
[10] 曹樹金,吳育冰,韋景竹,等.知識圖譜研究的脈絡、流派與趨勢――基于SSCI與CSSCI期刊論文的計量與可視化[J].中國圖書館學報,2015, 41(5):16-34.
[11] 趙蓉英,王敏.國際視野下中醫研究的可視化分析[J].醫學信息學雜志,2011,32(7):36-41.
[12] 徐浩,濮文淵,錢愛兵,等.我國中醫學學科交叉領域研究熱點可視化分析[J].中草藥,2015,46(19):2966-2973.
[13] 楊秦,曾莉,李文林.中醫外科關于瘡瘍研究的知識圖譜分析[J].南京中醫藥大學學報,2012,28(6):535-537.
[14] 譚火媛,魏靜,譚定英,等.基于CiteSpaceⅢ的中醫藥治療高血壓前沿與熱點可視化研究[J].現代計算機:專業版,2016(11):50-54.
[15] 王淑斌.中西醫治療2型糖尿病的知識圖譜分析[D].北京:北京中醫藥大學,2014.
[16] 劉俊麗,張秀梅,蔣勇青.基于文本挖掘的乙型肝炎相關文獻知識圖譜分析[J].醫學信息學雜志,2014,35(1):48-53.
[17] 秦義,田元祥.基于CiteSpace的氣虛證證候診斷標準知識圖譜可視化分析[J].中醫雜志,2015,56(18):1588-1592.
[18] 秦義,田元祥.基于CiteSpace的血瘀證證候診斷標準研究的可視化分析[J].世界科學技術-中醫藥現代化,2015,17(12):2656-2665.
[19] 郭棟,童元元,S生權,等.基于數據挖掘的枸杞研究熱點分析[J].中國中醫藥信息雜志,2016,23(9):48-51.
[20] 李祖停田元祥,趙建新.針灸治療腰椎間盤突出癥常用腧穴的可視化分析[J].河北中醫,2016,38(9):1372-1377.
[21] 胡松潔,馬彥平.基于知識圖譜的“中醫五行音樂療法”可視化構建研究[J].長春中醫藥大學學報,2015,31(3):534-537.
[22] 張靜.中醫藥專業人才培養研究的知識圖譜與主題分析[J].濟寧醫學院學報,2017,40(1):51-55.
[23] 陳姍姍,邵英俊.基于中國知網的中醫藥傳播研究的計量分析[J]. 中國中醫藥現代遠程教育,2017,15(3):6-9.
[24] 榮光,謝晴宇,孟慶剛.中醫電子病歷研究領域科學知識圖譜分析[J].中國中醫藥信息雜志,2017,24(1):99-104.
[25] 于彤,劉靜,賈李蓉,等.大型中醫藥知識圖譜構建研究[J].中國數字醫學,2015,10(3):80-82.
[26] 阮彤,孫程琳,王昊奮,等.中醫藥知識圖譜構建與應用[J].醫學信息學雜志,2016,37(4):8-13.
[27] 阮彤,王夢婕,王昊奮,等.垂直知識圖譜的構建與應用研究[J].知識管理論壇,2016(3):226-234.
[28] 賈李蓉,劉靜,于彤,等.中醫藥知識圖譜構建[J].醫學信息學雜志, 2015,36(8):51-53.
[29] 張德政,謝永紅,李曼,等.基于本體的中醫知識圖譜構建[J].情報工程,2017,3(1):35-42.
[30] 王華珍,彭淑娟,緱錦,等.基于隨機森林的中醫數據可視化研究[J]. 系統仿真學報,2014,26(11):2751-2756.
引用格式:邢霞, 鐘永恒, 劉佳, 等. 基于國家自然科學基金的我國醫學科學的省域基礎研究競爭力分析[J/OL]. 知識管理論壇, 2017, 2(3): 232-243[引用日期]. http://kmf.ac.cn/p/1/124/.
1 引言
隨著知識經濟的迅速崛起,綜合國力競爭的前沿已從技術開發延伸到基礎研究。基礎研究已成為一個國家或地區科技發展水平的標志,代表著國家或地區的科技實力[1]。因此,加強對我國基礎研究競爭力研究不僅是廣大科技管理部門、大學與科研機構、科技工作者的迫切需求,也有利于分析掌握我國基礎研究競爭力的現狀,為快速提升我國基礎研究競爭力提供建議,為建成科技強國奠定扎實基礎。
國家自然科學基金(National Natural Science Foundation of China,簡稱NSFC)作為我國支持基礎研究的主要渠道之一,是國家創新體系的重要組成部分。自成立以來,對推動我國基礎研究的穩定發展起到了重要作用。其公開、公正、公平的原則,在科技界獲得了崇高的聲譽,被科研人員公認為國內最規范、最公正、最能反映研究者競爭能力的研究基金[2]。獲得NSFC資助的競爭能力已經成為衡量我國各省域和科研機構基礎研究水平的一項重要指標。本文修正了“國家自然科學基金競爭能力指數”(competitiveness index on NSFC,簡稱 “NCI”), 以醫學科學為例,對我國省域基礎研究競爭力進行分析,了解我國的醫學科學的研究現狀。
2 研究現狀
通過文獻調研發現,關于國家或地區的基礎研究競爭力的分析與評價目前還沒有一個較為完善、系統、量化的指標體系。目前的研究主要是從基礎研究投入、基礎研究隊伍與基地建設、基礎研究產出這3個角度展開。其中最常見的是以基礎研究投入角度中的國家自然科學基金為切入點和以基礎研究產出角度中的論文為切入點。
從NFSC的角度分析我國基礎研究競爭力的研究已有不少,馬廷燦等構建了基于NSFC競爭能力的基礎研究綜合競爭力指數,對我國大陸31個省市的基礎研究競爭力進行了系統的、動態交互式的可視化對比分析[3];張慧穎等構建“學科競爭力指數”,對學科競爭力進行考察,并構建“省市基礎研究效率指數”以考察科研人員科研效率[4];張祚等利用GIS工具和空間分析方法,主要采用Moran’s I指數和G系數等統計指標,從不同的空間尺度,對科學基金資助項目總體空間分布情況、省際獲資助和城市獲資助空間分布情況進行了分析[5];楊新泉等[6]、廖海等[7]、高凱等[8]從單個學科的角度對各省市的資助情況進行了研究;馬廷燦等[9]、丁奕然等[10]基于NSFC對高校和科研機構的基礎研究競爭力進行分析。
3 研究內容與方法
3.1 國家自然科學基金-醫學科學部介紹
醫學科學的發展是保障公眾健康的重要基礎和支撐,其基礎研究關系到人民健康水平的提高,同時對完善國家創新體系和建設創新型國家具有重要意義。醫學是目前最為活躍的自然科學研究領域之一,醫學科學的創新已經成為我國民生科技工作的戰略重點。為了適應當前醫學科學前沿發展的趨勢,即以人為主體,2009年,國家自然科學基金委員會將醫學科學從生命科學中獨立出來,成立了醫學科學部。全新的醫學科學部將遵循在科學研究領域自由探索和國家需求導向“雙力驅動”的規律的基礎上,提倡以防病控病為目標,側重基礎研究和人才培養,注重與國際同類研究接軌和合作,推動具有我國特色的中醫藥和原創性研究的開展,提高我國醫學科學基礎研究和應用基礎研究水平[11]。
3.2 數據來源
原始數據來自國家自然科學基金委科學信息網絡信息系統(ISIS)。數據經中國科學院武漢文獻情報中心中國產業智庫采集、清洗、整理和集成。檢索時間為2017年1月20日。檢索申請代碼為H類(醫學科學部)的項目信息。
3.3 分析指標建立
不少學者對基于NSFC的基礎研究競爭力問題展開了研究,其中馬廷燦等[12]綜合考慮各地區在醫學科學領域中獲得國家自然科學基金資助的專家數量、經費數量以及31個省域的平均水平,提出基于國家自然科學基金資助能力的醫學科學基礎研究競爭力指數。某省域某年(基于項目批準年度)的醫學科學基礎研究競爭力指數―――NCI某省域-某年的計算公式如下:
NCI某省域-某年=
其中,專家數量是指某省域某年在醫學科學領域獲得國家自然科學基金資助的專家(即項目負責人)數量;經費數量是指某省域某年在醫學科學領域獲得國家自然科學基金資助的經費數量。
通過對上述計算公式和NSFC公開的相關項目信息進行研究,筆者認為該指標在計算基礎研究競爭力方面仍然具有不全面性。為了更加系統、全面、有效地分析我國省域、大學與科研機構基于國家自然科學基金的基礎研究競爭力,構建一套更系統、更全面的評價指標體系是非常必要的。基于此,本文完善了NCI的內涵,修正NCI指數。以省域作為研究對象,將某省域獲得NSFC資助的項目數量、項目經費、機構數量、項目主持人數量這4項指標納入NCI,形成針對省域的綜合NCI、學科NCI、項目類別NCI.某省域的項目數量和項目經費主要反映基礎研究的現狀與實力,而某省域獲得NSFC的機構數量和項目主持人數量指標則能較好地反映其在基礎研究的潛力與發展前景。將這4項指標納入NCI能夠更全面、更真實反映某省域的基礎研究競爭力狀況。本文主要涉及學科NCI,這里所指的學科與國家自然科學基金的科學部相對應,見公式1。
4.3 2016年大學與科研機構TOP20(醫學科學NCI)
根據大學與科研機構基礎研究學科NCI計算公式,筆者列出了2016年在醫學科學領域的大學與科研機構TOP20及其競爭力。結果顯示:TOP 5的大學與科研機構是上海交通大學、中山大學、復旦大學、華中科技大學以及北京大學。上海交通大學位居榜首,NCI為50.339 6,遠遠高于其他大學和機構。TOP20的大學與機構中,有接近一半的大學與科研機構屬于專業型醫科院校。其中上海市占4個,北京市占2個。如表3所示:
5 結論
通過研究與分析,可得出以下結論:
(1)總體上我國醫學科學基礎研究投入增長較快,2006年項目經費是58 577.85萬,2016年達到397 158.62萬元,年均增長率21.09%;2006年項目數量2 192項,2016年達到9 212項,年均增長率15.4%。但我國仍然是發展中國家,基礎研究的發展還面臨不少的困難和挑戰,醫學科學基礎研究經費投入還是偏低,投入強度不夠,與發達國家存在一定差距。基礎研究是一項長期的系統性工程,其投入結構和資助機制有待改善,可以適當加大地方政府和企業對基礎研究的投入比重,而加大中央財政對基礎研究的投入仍然是首要任務和發展方向。