時間:2023-10-09 11:00:47
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇中西醫臨床醫學前景范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
關鍵詞:知識圖譜;中醫藥;應用前景;綜述
DOI:10.3969/j.issn.1005-5304.2017.07.033
中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2017)07-0129-04
Abstract: As the new development of scientometrics and informetrics, knowledge graph has infiltrated into the financial, industrial and medical fields, and become a hot issue in the real world research. In this article, the concept and features of knowledge graph, construction and the existing softwares, the application status and development prospect in the TCM field were reviewed, which may provide references for research on the knowledge graph in the TCM field.
Key words: knowledge graph; TCM; application prospect; review
隨著2012年谷歌第一版知識圖譜的,特定領域的知識圖譜構建成為真實世界研究中的熱點問題。從搜索引擎優化,到新藥發現,知識圖譜在學術界掀起了一股熱潮,并滲透到金融、工業和醫學等領域。這種以科學學為基礎,涉及應用數學、信息學及計算機學等多學科的可視化技術,成為科學計量學和信息計量學的新發展方向。本文就知識圖譜的概念、特點及其在中醫藥領域的應用現狀、前景進行梳理,以期為中醫藥領域知識圖譜相關研究提供參考。
1 知識圖譜概念及特點
1.1 知識圖譜的概念
在知識圖譜的定義上,陳悅等[1-2]從其功能角度進行闡釋,認為知識圖譜能夠可視化地描述人類隨時間擁有的知識資源及其載體,繪制、挖掘、分析和顯示科學技術知識以及它們之間的相互聯系,在組織內創造知識共享的環境以促進科學技術研究的合作和深入。楊國立等[3]從理論和方法層面,將其定義為把應用數學、計算機科學、科學學、信息科學等學科的理論和方法與科學計量學引文分析、共現分析、社會網絡分析等方法結合,用可視化的圖譜形象地揭示科
學發展進程和結構關系的一種研究方法,屬于科學計量學的范疇。
楊思洛等[4]提出知識圖譜有廣義與狹義之分,廣義上可包括生物的基因圖譜、教育教學中的認知地圖、探索太空的天體圖、描繪地形的地理信息系統(GIS)圖、模擬人腦的神經網絡圖、各種金屬圖譜等;狹義的知識圖譜主要是運用文獻計量學方法,通過文獻知識單元分析來可視化科學知識的結構、關系與演化過程,包括“科學圖”“文獻計量圖”“文獻圖”“知識圖譜”等。
簡言之,知識圖譜是隨著計算機技術的發展,應用數學算法來簡化知識單元結構以達到可視化知識結構關系的一種方法,是顯示科學知識的發展進程與結構關系的一種圖形,是一種有效的知識管理工具。
1.2 研究對象
知識圖譜所描繪的對象主要包括:①從事科學技術活動和作為知識載體的人,包括科學家、技術專家、項目組、實踐團體或某一知識領域共同體;②顯性或編碼化的知識,如論文、專利、所學課程、數據庫等;③過程或方法,包括研究問題和解決問題的過程或方法、組織的業務流程,以及相關的知識投入等。
知識圖譜主要源于三大領域:①計算機科學領域的數據、信息、知識與知識域可視化研究;②圖書情報領域的引文分析可視化、知識地圖和知識網絡等研究;③復雜網絡系統和社會網絡分析的研究。上述領域的研究方向和內容正在走向融合[5]。
2 知識圖譜繪制流程
參考國內外已有研究,目前知識圖譜的繪制主要包括以下幾個版塊[4,6-7]。
數據檢索:繪制知識圖譜的基礎,其數據源在傳統文獻數據庫的基礎上逐漸擴展到出版商、機構聯盟等機構網站的網絡日志、用戶記錄、點擊流數據等。
數據清洗:即對數據的預處理,包括、勘誤等,進行歷時或分時段對比分析時需要對數據M行分段處理;若樣本數據過大或分析目的不同,則需要進行有代表性的抽取。
構建關系矩陣:選擇要分析的知識單元,如關鍵詞、題名、作者等,構建其相互關系,常用方法有共詞分析、共引分析、共作者分析、書目耦合分析、期刊耦合分析等。
數據標準化:根據數據間的相似度對數據進行標準化,常用方法有集合論方法(Cosine、Pearson、Spearman、Ochiai、Jaccard指數等)和概率論方法(合力指數、概率親和力指數等)。
數據簡化:運用因子分析、多為尺度分析、自組織映射圖、尋徑網絡圖譜、聚類分析、潛在語義分析、三角法等方法處理數據以更好地展示各數據單元。
可視化展示:是知識圖譜構建過程中最重要的一環,通過運用不同的算法,調整相關參數,構建整個圖譜。可通過不同模擬實現可視化,如幾何圖、戰略圖、沖積圖、主題河圖、地形圖、星團圖、簸幅圖等。
圖譜解讀:采用歷時分析、突變檢測、空間分析、網絡分析等方法對圖譜進行解讀,同時需要結合研究者的經驗、知識、學術背景、學術功底等。
3 知識圖譜繪制軟件
目前可用于知識圖譜繪制的軟件非常豐富,根據主要功能可分為2類[4]:一類為通用軟件,如SPSS、社會網絡分析軟件Ucinet和Pajek、詞頻分析軟件Wordsmith Tools和GIS相關軟件;另一類為繪制知識圖譜的專用軟件,如CiteSpace、Bibexcel、Gephi、VOSviewer、VantagePoint、Network Workbench Tool、NWB、Sci2 Tool、In-SPRIE、SciMAT、Histcite、GeoTime、ColPalRed、Guess、Leydesdorff、Jigsaw、Carrot等。分析各軟件的特點[6,8-9]可以看出,隨著知識圖譜的繪制軟件越來越多,一方面其支持的數據格式愈發多樣,相互之間的兼容性也逐步增強;另一方面,在可視化效果方面也日趨完善,知識展示的真實度、準確度逐漸提高。詳見表1。
4 知識圖譜在中醫藥領域的應用
目前知識圖譜的研究中,國外學者主要集中在2個研究方向[10]:部分偏于技術研究,包括可視化工具和算法的開發;部分以應用為主,利用科學計量學理論及相關方法、知識圖譜軟件等進行分析研究。國內研究也可分為2個方向:部分以科學計量學為理論基礎,利用可視化方法研究科學學與管理學、科學技術合作等領域;部分以電子資源數據庫為數據源,通過可視化方式展示某一學科的研究前沿和發展動向。
4.1 應用現狀
醫學領域各學科中采用知識圖譜理論與方法進行的研究尚處于起步階段,中醫藥領域已有部分學者開展了相關研究。
在學科層面,趙蓉英等[11]以Web of Science為數據來源,運用CiteSpace對中醫研究領域的研究熱點進行了可視化探索。徐浩等[12]以我國醫藥衛生領域中文核心期刊文獻為數據來源,對我國中醫學科交叉領域的研究熱點進行了可視化分析,但研究僅限于中醫學與醫藥衛生領域之間的合作。楊秦等[13]采用共詞分析及社會網絡方法對中醫外科瘡瘍領域的研究主題及分布進行了探索。
具體在疾病方面,譚火媛等[14]基于中國知識資源總庫(CNKI)收錄的近10年中醫藥治療高血壓相關文獻,對前沿與熱點研究進行了可視化分析。王淑斌等[15]對中西醫治療2型糖尿病的國內外研究進行了系統梳理。在證候方面,劉俊麗等[16]采用文本挖掘技術,通過數據清洗、實體抽取、構建共詞矩陣并采用Ucinet軟件繪制乙型肝炎熱點研究知識圖譜,分析了子模塊中的中醫證候描述及疾病名稱。秦義等[17-18]基于CiteSpace軟件對氣虛證、血瘀證證候診斷標準的相關研究進行了可視化分析。在中藥材方面,郭棟等[19]通過關鍵詞共現網絡和聚類圖對中藥枸杞的育種、種植、采收、加工、儲存等5個領域的研究進行了熱點分析。在治療措施方面,李祖偷[20]對針灸治療腰椎間盤突出癥常用腧穴的演變過程及施穴治療的變遷進行了可視化分析,胡松潔等[21]運用Ucinet軟件對“五行音樂”療法的發展脈絡進行了梳理。
此外,張靜[22]基于CNKI核心期刊文獻關鍵詞,探討了中醫藥專業人才培養熱點主題。陳姍姍等[23]對中醫藥傳播發展的研究文獻進行了可視化分析,榮光等[24]基于中醫電子病歷研究領域的相關文獻,構建了該領域的研究者、研究機構、關鍵詞的共現網絡。
上述研究主要集中在不同領域的研究現狀及熱點分析,多以期刊文獻為數據來源,多采用CiteSpace軟件構建研究者、研究機構、關鍵詞等信息的共現圖和聚類圖,從不同側面宏觀解釋了中醫學信息的整體結構特點。但針對特定研究目標,尚未形成一套明確的建模策略及技術,導致已有研究結果中也有差異甚至矛盾之處[5]。因此,中醫藥領域知識圖譜理論尚處在針對各學科結構宏觀概述階段,急需解決對多層信息深度整合的知識圖譜建模策略及其技術。
近年來,已有學者在中醫藥知識圖譜構建方法與標準化流程方面進行了嘗試和探索。于彤等[25]提出以中醫藥學語言系統(TCMLS)為框架,以中醫藥領域現有的術語和數據庫資源為內容,構建大型知識圖譜的構想,并進行了探索和實踐,但尚未實現中醫藥知識資源的有效整合及提供全面、及時、可靠的知識服務。阮彤等[26]基于文本抽取、關系數據轉換及數據融合等技術提出了中醫藥知識問答和輔助開藥領域的知識圖譜半自動化構建流程。此外,該課題組對知識圖譜進行了形式化定義,詳細描述了數據驅動的增量式知識圖譜構建方法,同時闡述了以此方法所構建的中醫藥知識圖譜在輔助開方領域的應用,但未涉及其它領域[27]。賈李蓉等[28]以中藥知識圖譜為例,從數據來源、研究內容、圖形化展示等方面探討如何構建中醫知識圖譜,但其應用尚局限于瀏覽檢索方面,對多種數據資源間的映射及數據元等標準未進行詳細論述。張德政等[29]提出了基于本體的中醫核心知識圖譜表示及其構建方法,對中醫本體與知識圖譜的映射方法進行了探索,為中醫知識圖譜的構建提供了較系統的方法流程,但對多源數據的獲取技術及中醫師臨床實際診療數據的研究未進行深入研究。王華珍等[30]以中醫慢性胃炎數據可視化處理為例,引入隨機森林(RF)技術進行可視化前的數據預處理,根據高維中醫數據的特征進行變換和降維,使數據在低緯空間呈現良好的分離性,從而增強了數據的可視化效果。
4.2 應用前景
知識圖譜研究已經滲透到金融、醫學和工業等領域,對知識圖譜定量與定性特征的科學理解已成為大數據時代科學研究中一個極其重要的挑戰性課題。結合自身知識體系的特點,中醫藥領域的知識圖譜研究應以從事相關領域活動和作為知識載體的人(如臨床醫學領域的醫師)、顯性或編碼化的知識(如癥狀、藥物等)、過程或方法(如辨證論治等)為研究對象,運用圖論、統計學、應用數學、數據挖掘等方法,研究知識之間多維網絡關系及演化規律等一系列問題。
在我國,中醫臨床研究領域的知識圖譜構建研究仍較滯后,研究大多處在術語本體領域的研究層面。知識圖譜在中醫藥領域有著廣闊的前景,如在中醫藥知識體系構架方面,可建立中醫藥知識地圖系統、維基百科系統[25]等;在中醫藥知識的推廣普及方面,可建立基于知識圖譜的信息檢索系統、基于自然語言的問答引擎[26]等;在臨床診療方面,可建立基于知識圖譜的四診信息采集、診斷、處方用藥系統;在醫師診療規律挖掘方面,可\用知識圖譜挖掘中醫師“病-證-治-效”臨床診療數據之間的相互關系和內在規律。因此,知識圖譜為開展中醫基礎理論體系、臨床診療規律研究提供了有利的工具,探索解決中醫臨床診療過程中多尺度非完整信息整合的核心技術,建立中醫藥知識圖譜構建的流程和規范將成為研究的熱點。
參考文獻:
[1] 陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究,2005,23(2):149-154.
[2] 陳悅,劉則淵,陳勁,等.科學知識圖譜的發展歷程[J].科學學研究, 2008,26(3):449-460.
[3] 楊國立,李品,劉竟.科學知識圖譜――科學計量學的新領域[J].科普研究,2010,5(4):28-34.
[4] 楊思洛,韓瑞珍.國外知識圖譜繪制的方法與工具分析[J].圖書情報知識,2012,20(6):101-109.
[5] 楊思洛,韓瑞珍.國外知識圖譜的應用研究現狀分析[J].情報資料工作,2013(6):15-20.
[6] 肖明,邱小花,黃界,等.知識圖譜工具比較研究[J].圖書館雜志, 2013,32(3):61-69.
[7] 陳超美.科學前沿圖譜――知識可視化探索[M].北京:科學出版社, 2014.
[8] 鄧君,馬曉君,畢強.社會網絡分析工具Ucinet和Gephi的比較研究[J].情報理論與實踐,2014,37(8):133-138.
[9] 侯月明,喬曉東,孫衛,等.開源分析工具在中文文獻分析中的應用[J].現代圖書情報技術,2013(3):71-76.
[10] 曹樹金,吳育冰,韋景竹,等.知識圖譜研究的脈絡、流派與趨勢――基于SSCI與CSSCI期刊論文的計量與可視化[J].中國圖書館學報,2015, 41(5):16-34.
[11] 趙蓉英,王敏.國際視野下中醫研究的可視化分析[J].醫學信息學雜志,2011,32(7):36-41.
[12] 徐浩,濮文淵,錢愛兵,等.我國中醫學學科交叉領域研究熱點可視化分析[J].中草藥,2015,46(19):2966-2973.
[13] 楊秦,曾莉,李文林.中醫外科關于瘡瘍研究的知識圖譜分析[J].南京中醫藥大學學報,2012,28(6):535-537.
[14] 譚火媛,魏靜,譚定英,等.基于CiteSpaceⅢ的中醫藥治療高血壓前沿與熱點可視化研究[J].現代計算機:專業版,2016(11):50-54.
[15] 王淑斌.中西醫治療2型糖尿病的知識圖譜分析[D].北京:北京中醫藥大學,2014.
[16] 劉俊麗,張秀梅,蔣勇青.基于文本挖掘的乙型肝炎相關文獻知識圖譜分析[J].醫學信息學雜志,2014,35(1):48-53.
[17] 秦義,田元祥.基于CiteSpace的氣虛證證候診斷標準知識圖譜可視化分析[J].中醫雜志,2015,56(18):1588-1592.
[18] 秦義,田元祥.基于CiteSpace的血瘀證證候診斷標準研究的可視化分析[J].世界科學技術-中醫藥現代化,2015,17(12):2656-2665.
[19] 郭棟,童元元,S生權,等.基于數據挖掘的枸杞研究熱點分析[J].中國中醫藥信息雜志,2016,23(9):48-51.
[20] 李祖停田元祥,趙建新.針灸治療腰椎間盤突出癥常用腧穴的可視化分析[J].河北中醫,2016,38(9):1372-1377.
[21] 胡松潔,馬彥平.基于知識圖譜的“中醫五行音樂療法”可視化構建研究[J].長春中醫藥大學學報,2015,31(3):534-537.
[22] 張靜.中醫藥專業人才培養研究的知識圖譜與主題分析[J].濟寧醫學院學報,2017,40(1):51-55.
[23] 陳姍姍,邵英俊.基于中國知網的中醫藥傳播研究的計量分析[J]. 中國中醫藥現代遠程教育,2017,15(3):6-9.
[24] 榮光,謝晴宇,孟慶剛.中醫電子病歷研究領域科學知識圖譜分析[J].中國中醫藥信息雜志,2017,24(1):99-104.
[25] 于彤,劉靜,賈李蓉,等.大型中醫藥知識圖譜構建研究[J].中國數字醫學,2015,10(3):80-82.
[26] 阮彤,孫程琳,王昊奮,等.中醫藥知識圖譜構建與應用[J].醫學信息學雜志,2016,37(4):8-13.
[27] 阮彤,王夢婕,王昊奮,等.垂直知識圖譜的構建與應用研究[J].知識管理論壇,2016(3):226-234.
[28] 賈李蓉,劉靜,于彤,等.中醫藥知識圖譜構建[J].醫學信息學雜志, 2015,36(8):51-53.
[29] 張德政,謝永紅,李曼,等.基于本體的中醫知識圖譜構建[J].情報工程,2017,3(1):35-42.
[30] 王華珍,彭淑娟,緱錦,等.基于隨機森林的中醫數據可視化研究[J]. 系統仿真學報,2014,26(11):2751-2756.