摘要【目:的/意義】主題發(fā)展等級(jí)劃分是信息組織研究的基礎(chǔ)性問題,也是科研人員和科研管理部門進(jìn)行研究選題和學(xué)科服務(wù)的重要工作,對(duì)學(xué)科研究主題進(jìn)行高效的發(fā)展等級(jí)劃分與趨勢(shì)預(yù)測(cè),能夠幫助相關(guān)科研人員和機(jī)構(gòu)把握學(xué)科領(lǐng)域研究態(tài)勢(shì),準(zhǔn)確做出科研決策?!痉椒?過程】本文結(jié)合主題模型、Sen’s斜率估計(jì)法、Mann-Kendall法、指數(shù)平滑法,提出一種學(xué)科研究主題發(fā)展等級(jí)劃分與趨勢(shì)預(yù)測(cè)方法。首先,在主題識(shí)別的基礎(chǔ)上,形成主題發(fā)文度和主題引文度兩個(gè)指標(biāo),并參考波士頓矩陣對(duì)學(xué)科研究主題發(fā)展等級(jí)進(jìn)行劃分;然后,融合研究主題發(fā)文量、被引量和下載量,形成主題熱力度指標(biāo),采用指數(shù)平滑法對(duì)研究主題未來發(fā)展態(tài)勢(shì)進(jìn)行預(yù)測(cè)?!窘Y(jié)果/結(jié)論】以我國“智慧圖書館”研究的實(shí)驗(yàn)表明,本文所提方法能夠?qū)W(xué)科領(lǐng)域研究主題進(jìn)行全方位、細(xì)粒度地發(fā)展等級(jí)劃分和趨勢(shì)預(yù)測(cè)?!緞?chuàng)新/局限】本文所提方法對(duì)其他學(xué)科研究主題的分析具有普適性,為實(shí)現(xiàn)動(dòng)態(tài)情報(bào)分析提供了新的視角,局限在于需要提高主題建模的可解讀性,并進(jìn)一步優(yōu)化趨勢(shì)預(yù)測(cè)方法。
關(guān)鍵詞:主題模型;發(fā)展等級(jí);趨勢(shì)預(yù)測(cè);智慧圖書館;科研決策
1引言
信息科技不斷發(fā)展,帶動(dòng)了Web技術(shù)在學(xué)術(shù)數(shù)據(jù)庫中的創(chuàng)新應(yīng)用,也進(jìn)一步推動(dòng)了科技文獻(xiàn)呈爆炸式增長態(tài)勢(shì)。當(dāng)科研人員針對(duì)某個(gè)學(xué)科研究主題進(jìn)行文獻(xiàn)檢索時(shí),往往能夠獲取期刊論文、科技專利、新聞報(bào)告等多元化海量信息。而面對(duì)海量文獻(xiàn)資源,如何快速準(zhǔn)確地把握學(xué)科研究主題的發(fā)展等級(jí),為科學(xué)研究尋找切入點(diǎn),成為科研工作者面臨的巨大挑戰(zhàn)。為了應(yīng)對(duì)此問題,部分學(xué)者以文獻(xiàn)作為分析單元,通過挖掘?qū)W科領(lǐng)域的熱點(diǎn)文獻(xiàn)、權(quán)威作者,為學(xué)術(shù)檢索和科研實(shí)踐提供有力支持。但隨著學(xué)科研究范式復(fù)雜度的提高和學(xué)科研究邊界的不斷拓展,已有研究和方法并不能有效滿足科研人員對(duì)結(jié)果呈現(xiàn)的精深性需求。
由此,本研究提出一種學(xué)科研究主題發(fā)展等級(jí)劃分和趨勢(shì)預(yù)測(cè)方法,通過對(duì)文獻(xiàn)內(nèi)容進(jìn)行深入挖掘,從更高細(xì)粒度、更深層次方面對(duì)學(xué)科研究主題進(jìn)行分析,幫助科研人員和科研管理部門有效把握學(xué)科領(lǐng)域研究態(tài)勢(shì),快速做出科研決策。本文的研究目標(biāo)是:①以Sen’s斜率估計(jì)法計(jì)算主題發(fā)文度,以Mann-Kendall法計(jì)算主題引文度,將兩個(gè)指標(biāo)映射到二維空間,參考波士頓矩陣的命名方式,對(duì)學(xué)科研究主題發(fā)展等級(jí)進(jìn)行劃分。②構(gòu)建主題熱力度計(jì)算公式,采用指數(shù)平滑法對(duì)學(xué)科研究主題未來發(fā)展態(tài)勢(shì)進(jìn)行預(yù)測(cè)。③應(yīng)用提出的學(xué)科研究主題發(fā)展等級(jí)劃分和趨勢(shì)預(yù)測(cè)方法對(duì)我國“智慧圖書館”研究進(jìn)行探析,為科研人員和機(jī)構(gòu)制定科研規(guī)劃、開展科研選題提供決策參考。
2相關(guān)研究
2.1基于文獻(xiàn)計(jì)量學(xué)的學(xué)科研究主題識(shí)別
通常使用的方法有詞頻分析法、共詞聚類法等,其實(shí)質(zhì)是將文獻(xiàn)中的高頻關(guān)鍵詞作為重點(diǎn)分析對(duì)象,探索學(xué)科領(lǐng)域重點(diǎn)研究內(nèi)容。關(guān)鍵詞可以視為對(duì)研究內(nèi)容及研究方法的高度凝練和概括,而高頻關(guān)鍵詞在一定程度上可以體現(xiàn)學(xué)科領(lǐng)域的研究熱點(diǎn)和前沿主題【1】。因此,通過對(duì)論文中的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,能夠探析一個(gè)學(xué)科領(lǐng)域的熱點(diǎn)和趨勢(shì)。當(dāng)前,文獻(xiàn)計(jì)量學(xué)技術(shù)方法完善,分析工具多樣,從而被廣泛應(yīng)用于學(xué)科領(lǐng)域的計(jì)量分析中。Song等采用共詞聚類算法,對(duì)DBLP會(huì)議中生物信息學(xué)研究的主題進(jìn)行了識(shí)別【2】。
Jung等將研究者興趣引入到主題識(shí)別研究中,探討了虛擬現(xiàn)實(shí)領(lǐng)域的主題演進(jìn)情況【3】。廖遠(yuǎn)麗等結(jié)合文獻(xiàn)計(jì)量學(xué)方法與可視化方法,剖析了我國圖書館空間研究的主題分布【4】。張琬笛等依托VOSviewer的關(guān)鍵詞聚類分析,對(duì)納米技術(shù)領(lǐng)域的研究主題進(jìn)行了分析【5】。但該方法的不足之處是高頻關(guān)鍵詞地閾值設(shè)置及關(guān)鍵詞選取依賴科研人員地主觀判斷,導(dǎo)致遺漏低頻但表征新興研究主題的關(guān)鍵詞,此外,關(guān)鍵詞之間缺少語義關(guān)聯(lián),造成采用此種方法存在一定局限性【6】。
2.2基于機(jī)器學(xué)習(xí)的學(xué)科研究主題挖掘
于機(jī)器學(xué)習(xí)的學(xué)科研究主題挖掘1975年,Salton等提出向量空間模型(VectorSpaceModel,VSM),開啟了基于機(jī)器學(xué)習(xí)的主題挖掘研究方向【7】。
1990年,Deerwester首次將文本語義信息引入文本主題挖掘過程中,提出潛在語義分析模型LSA(LatentSemanticAnaly⁃sis,LSA)【8】。1999年,Hofmann將期望最大化算法引入文本主題提取過程中,提出了基于概率統(tǒng)計(jì)的PLSA模型(Proba⁃bilisticLatentSemanticAnalysis)【9】。2003年,Blei對(duì)PLSA進(jìn)行了完善,將先驗(yàn)概率引入,提出潛在狄利克雷分配的LDA模型(LatentDirichletAllocation)【10】。相比基于文獻(xiàn)計(jì)量分析的學(xué)科研究主題識(shí)別,基于機(jī)器學(xué)習(xí)的主題挖掘通過嚴(yán)謹(jǐn)?shù)臄?shù)理統(tǒng)計(jì)推演過程,具有挖掘內(nèi)容全面、內(nèi)容描述清晰、主題語義緊密等優(yōu)勢(shì),對(duì)語義關(guān)系模糊、語義結(jié)構(gòu)粗糙的文本語料,主題識(shí)別更為準(zhǔn)確。
此外,LDA模型的性能優(yōu)于LSA和PLSA,因此,LDA模型被廣泛應(yīng)用于學(xué)科研究主題挖掘處理任務(wù)中。如Kang等采用主題模型,對(duì)智能家居護(hù)理研究領(lǐng)域進(jìn)行了主題識(shí)別【11】。Balili等構(gòu)建了一個(gè)主題識(shí)別和追蹤框架—TermBall,并以PubMed上的學(xué)術(shù)文獻(xiàn)進(jìn)行了驗(yàn)證【12】。李牧南等基于文本挖掘技術(shù),對(duì)人工智能領(lǐng)域的科學(xué)主題進(jìn)行了探索【13】。李秀霞等基于LDA主題模型,對(duì)國內(nèi)外教育大數(shù)據(jù)研究進(jìn)行了主題識(shí)別【14】。
2.3基于機(jī)器學(xué)習(xí)的學(xué)科研究主題發(fā)展等級(jí)劃分
于機(jī)器學(xué)習(xí)的學(xué)科研究主題發(fā)展等級(jí)劃分基于機(jī)器學(xué)習(xí)的學(xué)科研究主題發(fā)展等級(jí)劃分,是在主題識(shí)別的基礎(chǔ)上,通過構(gòu)建分析模型對(duì)主題發(fā)展?fàn)顩r進(jìn)行劃分。目前存在基于前沿性計(jì)算對(duì)研究主題進(jìn)行分析的研究,在主題挖掘的基礎(chǔ)上,識(shí)別出前瞻價(jià)值更高的研究前沿:如鄭彥寧等提出了基于關(guān)鍵詞共現(xiàn)的研究前沿識(shí)別方法【15】;王效岳等提出了基于基金項(xiàng)目數(shù)據(jù)的研究前沿主題探測(cè)方法【16】;王曰芬等從領(lǐng)域全局演化研究視角,對(duì)人工智能進(jìn)行了研究前沿識(shí)別與分析【17】;吳一平等利用文本挖掘方法,分析了高校論文前沿主題和發(fā)展趨勢(shì)【18】。
此外,也存在基于研究熱度計(jì)算對(duì)研究主題開展探索的研究,通過總結(jié)學(xué)科研究熱點(diǎn)主題,揭示學(xué)科研究態(tài)勢(shì):如李躍艷等以SIGIR年會(huì)2008-2019年的錄用論文作為數(shù)據(jù)源,探索了近十年信息檢索領(lǐng)域的研究熱點(diǎn)【19】;翟姍姍等以2010-2019年間與數(shù)據(jù)有關(guān)的國家社會(huì)科學(xué)基金立項(xiàng)項(xiàng)目為研究對(duì)象,劃分出了重點(diǎn)長線主題和次要熱點(diǎn)主題【20】;李偉超等基于iConference會(huì)議,總結(jié)了國內(nèi)外圖書情報(bào)學(xué)研究熱點(diǎn)【21】;徐小瑩等對(duì)近四年圖書情報(bào)學(xué)科的熱度持續(xù)、熱度增加和熱度減退主題進(jìn)行了挖掘【22】。
分析發(fā)現(xiàn),根據(jù)前沿性和研究熱度對(duì)學(xué)科研究主題發(fā)展等級(jí)進(jìn)行分析,能夠有效幫助科研人員和科研管理部門把握學(xué)科研究態(tài)勢(shì),對(duì)定位科研方向、做出科研決策具有重要的推動(dòng)作用。但已有研究多數(shù)是在文本挖掘的基礎(chǔ)上,從研究內(nèi)容層面,根據(jù)主題詞頻次或關(guān)聯(lián)性劃分學(xué)科研究主題發(fā)展等級(jí),考慮維度較為單一,等級(jí)劃分的細(xì)粒度不夠,導(dǎo)致給出的結(jié)果信息不夠充分。為此,本文在繼承前人研究的基礎(chǔ)上,結(jié)合基于機(jī)器學(xué)習(xí)的主題挖掘方法,從研究主題發(fā)展等級(jí)劃分和發(fā)展趨勢(shì)預(yù)測(cè)兩個(gè)視角出發(fā)展開探索,以期為科研機(jī)構(gòu)和科研人員制定科研規(guī)劃提供實(shí)踐方案和決策支持。
3學(xué)科研究主題發(fā)展等級(jí)劃分及趨勢(shì)預(yù)測(cè)方法
學(xué)科研究主題發(fā)展等級(jí)劃分及趨勢(shì)預(yù)測(cè)方法共涵蓋三個(gè)分析流程:主題提取與文本聚類、學(xué)科研究主題發(fā)展等級(jí)劃分、學(xué)科研究主題發(fā)展趨勢(shì)預(yù)測(cè)。
3.1流程一:主題提取與文本聚類
主題提取即獲取學(xué)科研究領(lǐng)域涵蓋的多個(gè)研究主題,如前所述,LDA模型具有良好的文本潛在主題挖掘能力,能夠高效識(shí)別大規(guī)模文本語料集中的隱含主題,已被應(yīng)用于熱點(diǎn)挖掘、文本分類、用戶推薦等領(lǐng)域,本文也將選擇使用LDA模型進(jìn)行學(xué)科研究領(lǐng)域的主題識(shí)別。
此外,在學(xué)科研究領(lǐng)域相關(guān)文獻(xiàn)中,摘要能夠體現(xiàn)研究方法、研究目標(biāo)等內(nèi)容,是對(duì)論文研究內(nèi)容的高度凝練,因此,對(duì)學(xué)科研究領(lǐng)域進(jìn)行主題提取的過程中,將重點(diǎn)以摘要作為實(shí)驗(yàn)數(shù)據(jù)。通常采用LDA模型較難直接分析不同主題之間的關(guān)聯(lián)關(guān)系,本文在LDA識(shí)別結(jié)果的基礎(chǔ)上,采用多維尺度分析,將高維空間中的主題相似性降維到二維空間進(jìn)行展示,從而可視化LDA提取主題的相互關(guān)系。
本文采用R語言中的LDAvis工具包繪制動(dòng)態(tài)交互性的LDA主題可視化圖譜。在pyLDAvis生成的圖譜中,每個(gè)圓圈表示一個(gè)主題,主題之間的相似程度可以用圓圈之間的距離表示,各個(gè)主題之間互不交叉表明各個(gè)主題之間相似較小;此外,pyLDAvis還可以通過調(diào)節(jié)參數(shù)λ(≤λ≤1)來控制主題和詞語之間的關(guān)聯(lián)度,λ=0,顯示主題下特有的、相對(duì)獨(dú)立的詞項(xiàng),λ=1顯示分布范圍更廣泛的詞項(xiàng),通過調(diào)節(jié)λ值,結(jié)合相關(guān)詞項(xiàng),對(duì)主題內(nèi)容進(jìn)行凝練。
在具體分析過程中,對(duì)檢索到的學(xué)科研究領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行整合形成實(shí)驗(yàn)數(shù)據(jù)集,然后按照以下步驟進(jìn)行實(shí)驗(yàn):①使用SATI抽取關(guān)鍵詞字段,形成學(xué)科研究領(lǐng)域詞典;進(jìn)而,應(yīng)用R語言的jiebaR包對(duì)抽取的文獻(xiàn)摘要進(jìn)行自然語言處理形成實(shí)驗(yàn)數(shù)據(jù)集。②利用R語言中的lda包對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行主題建模,采用LDAvis模型確定最優(yōu)主題數(shù)目。③主題提取完成后,需要確定每篇文獻(xiàn)所屬的研究主題,以備后續(xù)實(shí)驗(yàn)流程的順利開展,所以,本文采用LDA模型和Kmeans算法融合的方式實(shí)現(xiàn)文本聚類【23】。
3.2流程二:學(xué)科研究主題發(fā)展等級(jí)劃分
學(xué)科研究主題發(fā)展等級(jí)劃分的過程共包含三個(gè)模塊:首先,基于研究主題文獻(xiàn)發(fā)表量計(jì)算主題發(fā)文度;然后,基于研究主題被引量計(jì)算主題引文度;最后,將主題的發(fā)文度和引文度在二維空間進(jìn)行可視化映射,并參考波士頓矩陣進(jìn)行研究主題發(fā)展等級(jí)劃分。
(1)主題發(fā)文度計(jì)算研究主題的逐年發(fā)文量,在一定程度上能夠反映該主題的研究趨勢(shì),從研究人員視角來體現(xiàn)研究主題的活躍程度。本文選擇采用Sen’s斜率估計(jì)法對(duì)研究主題的發(fā)文量斜率進(jìn)行計(jì)算。Sen’s斜率估計(jì)法是描述時(shí)間序列趨勢(shì)性的定性方法,抗噪性強(qiáng),相關(guān)研究已將此方法引入到學(xué)科領(lǐng)域研究前沿的識(shí)別中【24】,驗(yàn)證了該方法在研究主題發(fā)文趨勢(shì)分析中的適應(yīng)性和科學(xué)性。
3.3流程三:學(xué)科研究主題發(fā)展趨勢(shì)預(yù)測(cè)
在對(duì)學(xué)科研究主題發(fā)展等級(jí)劃分的基礎(chǔ)上,進(jìn)一步對(duì)學(xué)科研究主題發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),幫助科研人員既能明晰當(dāng)前學(xué)科研究主題的發(fā)展現(xiàn)狀,又能清晰把握主題未來發(fā)展態(tài)勢(shì)。其中,研究主題發(fā)文量體現(xiàn)了研究人員對(duì)主題的關(guān)注度,而主題被引量和下載量體現(xiàn)了科研用戶對(duì)主題的關(guān)注度,將這三個(gè)指標(biāo)融合,形成主題熱力度指標(biāo),用于預(yù)測(cè)研究主題的未來發(fā)展態(tài)勢(shì)。
4實(shí)驗(yàn)結(jié)果
4.1數(shù)據(jù)來源
本文數(shù)據(jù)來源于CNKI數(shù)據(jù)庫,將“智慧圖書館”作為學(xué)科研究領(lǐng)域進(jìn)行文獻(xiàn)檢索。將主題詞限定為“智慧圖書館”,時(shí)間不限,即標(biāo)題、關(guān)鍵詞、摘要中出現(xiàn)“智慧圖書館”,則認(rèn)為該文獻(xiàn)與“智慧圖書館”相關(guān)。檢索發(fā)現(xiàn),2011年之前與“智慧圖書館”相關(guān)的文獻(xiàn)較少,因此,獲取2011-2020年的數(shù)據(jù)進(jìn)行重點(diǎn)研究,共獲得文獻(xiàn)數(shù)據(jù)2176條。
4.2主題提取與文本聚類
題提取與文本聚類根據(jù)研究主題的識(shí)別流程,當(dāng)主題數(shù)目設(shè)置為10個(gè),α=5,β=0.1時(shí),基于LDAvis模型呈現(xiàn)的主題可視化結(jié)果,各個(gè)主題之間相互獨(dú)立,表明主題數(shù)目最優(yōu)。依據(jù)最優(yōu)模型的輸出結(jié)果,首先應(yīng)用“文獻(xiàn)-主題”概率分布矩陣進(jìn)行文本聚類,進(jìn)而結(jié)合研究主題下的相關(guān)詞對(duì)主題進(jìn)行凝練。
4.3學(xué)科研究主題發(fā)展等級(jí)劃分
依據(jù)給出的學(xué)科研究主題發(fā)展等級(jí)劃分流程,計(jì)算每個(gè)研究主題的主題發(fā)文度(公式(1))與主題引文度(公式(2)—(3))。分析發(fā)現(xiàn),“智慧圖書館”領(lǐng)域涵蓋的10個(gè)研究主題,其主題發(fā)文度和主題引文度均大于0,表明“智慧圖書館”領(lǐng)域各個(gè)研究主題的發(fā)文量和引文量均成上升趨勢(shì),體現(xiàn)了國內(nèi)學(xué)術(shù)界對(duì)“智慧圖書館”領(lǐng)域的持續(xù)關(guān)注。由于10個(gè)研究主題的主題發(fā)文度和主題引文度均大于0,為了能夠清晰界定研究主題之間的等級(jí)界限,分別獲取主題引文度和主題發(fā)文度的中位數(shù)為(2.764,5.536),作為發(fā)展等級(jí)界限劃分的閾值。參考波士頓矩陣的命名方式,依據(jù)設(shè)置的閾值進(jìn)行發(fā)展等級(jí)劃分:
(1)第一維度→“明星類”主題,Z>2.764,β>5.536,特指研究主題引文度和發(fā)文度“雙高”的主題群,說明科研用戶對(duì)該研究主題的知識(shí)需求量快速增加時(shí),研究人員的成果供應(yīng)量也在高速遞增,表明研究主題處于快速成長期,需要科研人員重點(diǎn)關(guān)注。
(2)第二維度→“金牛類”主題,Z<2.764>5.536,特指研究主題發(fā)文度高,但主題引文度較低的主題群,說明研究人員的成果供應(yīng)量大于科研用戶的知識(shí)需求量,表明研究主題處于成熟期,科研人員可保持適當(dāng)?shù)年P(guān)注。(3)第三維度→“瘦狗類”主題,Z<2.764,β<5.5364z>2.764,β<5.536,特指主題引文度高,但主題發(fā)文度較低的主題群,說明科研用戶的知識(shí)需求量大于研究人員的成果供應(yīng)量,表明研究主題正處于緩慢成長期,創(chuàng)新潛力強(qiáng),科研人員應(yīng)該增加對(duì)研究主題的關(guān)注度。通過上述方式,實(shí)現(xiàn)了對(duì)學(xué)科研究主題發(fā)展等級(jí)地劃分,為科研人員和科研管理部門明晰“智慧圖書館”領(lǐng)域發(fā)展現(xiàn)狀,把握研究主題發(fā)展動(dòng)向,確定研究切入點(diǎn)提供了參考指引。
4.4學(xué)科研究主題發(fā)展趨勢(shì)預(yù)測(cè)
科研究主題發(fā)展趨勢(shì)預(yù)測(cè)通過以上學(xué)科研究主題發(fā)展等級(jí)的劃分,得到我國“智慧圖書館”領(lǐng)域的4個(gè)“明星類”主題、1個(gè)“金牛類”主題、4個(gè)“瘦狗類”技術(shù)主題、1個(gè)“問題類”主題。由于“明星類”主題是當(dāng)前學(xué)科研究的熱點(diǎn)和前沿,處于快速成長階段,科研人員應(yīng)考慮將其作為重點(diǎn)研究方向,因此,本文依據(jù)學(xué)科研究主題發(fā)展趨勢(shì)預(yù)測(cè)流程,重點(diǎn)對(duì)“明星類”主題進(jìn)行趨勢(shì)預(yù)測(cè)的結(jié)果展示,使用公式(4)—(9)計(jì)算每個(gè)研究主題的逐年熱力度,并使用三次指數(shù)平滑法對(duì)各個(gè)研究主題未來三年(2021-2023年)的發(fā)展態(tài)勢(shì)進(jìn)行預(yù)測(cè)。
在預(yù)測(cè)效果評(píng)估方面,選擇均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)作為判斷預(yù)測(cè)效果優(yōu)劣的指標(biāo),其中RMSE和MAE集中在0.2左右,表明研究主題發(fā)展趨勢(shì)預(yù)測(cè)效果良好。“主題1→圖書館智慧服務(wù)”在2011-2014年的主題熱力度呈下降趨勢(shì),在2017-2020年呈上升趨勢(shì),未來三年的熱力度預(yù)測(cè)仍為上升態(tài)勢(shì)。隨著信息化的高速發(fā)展,傳統(tǒng)圖書館很難滿足用戶多元化的資源需求,這也推動(dòng)了傳統(tǒng)圖書館向智慧圖書館的過渡和轉(zhuǎn)型。
智慧圖書館是智能技術(shù)、智慧圖書館員、圖書館業(yè)務(wù)管理相互融合的結(jié)果,而智慧服務(wù)是智慧圖書館的核心,具有空間虛擬化、流程智能化、內(nèi)容知識(shí)化等特點(diǎn)。如陸婷婷對(duì)人工智能時(shí)代的智能圖書館服務(wù)內(nèi)容、實(shí)現(xiàn)途徑與發(fā)展瓶頸進(jìn)行了研究【27】;陳丹等提出了基于用戶畫像的圖書館個(gè)性化智慧服務(wù)模型框架【28】;陳小平提出區(qū)塊鏈技術(shù)能夠助力圖書館智慧服務(wù)在管理體制、機(jī)構(gòu)庫建設(shè)、知識(shí)交易服務(wù)模式上的轉(zhuǎn)變【29】;董同強(qiáng)等從大數(shù)據(jù)與人工智能雙驅(qū)動(dòng)的視角設(shè)計(jì)了高校圖書館智慧型學(xué)科服務(wù)平臺(tái)【30】。在物聯(lián)網(wǎng)和人工智能等智能技術(shù)的驅(qū)動(dòng)下,智慧服務(wù)將成為未來圖書館發(fā)展的新方向,而宏觀層面的功能定位及微觀層面的業(yè)務(wù)重組為科研人員的持續(xù)探索提供了廣闊空間。
“主題4→圖書館轉(zhuǎn)型”在2012-2015年的主題熱力度呈上升趨勢(shì),在2016-2020年呈平穩(wěn)發(fā)展趨勢(shì),未來三年的熱力度預(yù)測(cè)仍為上升態(tài)勢(shì)。圖書館轉(zhuǎn)型既是當(dāng)代圖書館事業(yè)發(fā)展的關(guān)鍵特征,也是圖書館學(xué)理論研究的關(guān)注焦點(diǎn)。在信息時(shí)代數(shù)據(jù)意識(shí)全面增強(qiáng)的背景下,圖書館作為科研活動(dòng)和文化事業(yè)發(fā)展的重要支撐,其服務(wù)和管理也應(yīng)向數(shù)據(jù)化和智能化轉(zhuǎn)向。相關(guān)研究也從空間、資源、服務(wù)、管理等要素出發(fā),探討了圖書館轉(zhuǎn)型的實(shí)踐路徑。
如邵波等提出以數(shù)據(jù)智能計(jì)算為中心,將數(shù)據(jù)服務(wù)作為新時(shí)代圖書館服務(wù)的主要能力【31】;柯平等對(duì)后知識(shí)服務(wù)時(shí)代的圖書館轉(zhuǎn)型理念、關(guān)鍵要素與路徑問題進(jìn)行了剖析【32】;初景利等提出要加快從資源能力到新型服務(wù)能力的轉(zhuǎn)變,構(gòu)建圖書館新型服務(wù)能力【33】;饒權(quán)提出建設(shè)“全國智慧圖書館體系”,推動(dòng)圖書館由數(shù)字化向智慧化發(fā)展【34】。在新一輪科技和產(chǎn)業(yè)革命引領(lǐng)下,為圖書館的轉(zhuǎn)型發(fā)展帶來了新的機(jī)遇,推動(dòng)圖書館向智慧化轉(zhuǎn)型將引發(fā)科研人員的持續(xù)關(guān)注。“主題7→智慧圖書館前沿技術(shù)”在2011-2020年的主題熱力度持續(xù)呈波浪式的上升,未來三年的熱力度預(yù)測(cè)仍為上升態(tài)勢(shì)。
以人工智能、大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈為代表的新興技術(shù)不斷成熟,如何將新興技術(shù)與圖書館服務(wù)場(chǎng)景相結(jié)合,提升圖書館智慧化服務(wù)水平,引發(fā)了科研人員的廣泛研究。如洪亮等以圖書館的業(yè)務(wù)流程為支撐和導(dǎo)向,構(gòu)建了大數(shù)據(jù)驅(qū)動(dòng)的圖書館智慧信息服務(wù)體系【35】;傅云霞對(duì)人工智能在智慧圖書館的應(yīng)用領(lǐng)域進(jìn)行了研究【36】;周耀研究設(shè)計(jì)了4個(gè)基于區(qū)塊鏈技術(shù)的智慧圖書館應(yīng)用系統(tǒng)【37】;任萍萍構(gòu)建了5G技術(shù)驅(qū)動(dòng)下的智慧圖書館應(yīng)用場(chǎng)景與智慧平臺(tái)模型【38】。
因此,將新興技術(shù)與圖書館業(yè)務(wù)深度融合,創(chuàng)新智慧圖書館業(yè)務(wù)生態(tài),將成為科研人員持續(xù)探索的重點(diǎn)。“主題8→智慧圖書館系統(tǒng)架構(gòu)”在2011-2020年的主題熱力度呈上升趨勢(shì),未來三年的熱力度預(yù)測(cè)仍為上升態(tài)勢(shì)。在國家深入推進(jìn)創(chuàng)新驅(qū)動(dòng)發(fā)展和“云數(shù)智”賦能時(shí)代背景下,新興信息技術(shù)與智慧圖書館的深度融合推動(dòng)了圖書館基礎(chǔ)設(shè)施層、數(shù)據(jù)資源層和服務(wù)應(yīng)用層的系統(tǒng)架構(gòu)變革。
相關(guān)研究也從理論走向?qū)嵺`,優(yōu)秀實(shí)踐案例不斷涌現(xiàn),為后繼者提供范例參考。如李靖等探討了上海交通大學(xué)圖書館自助服務(wù)的轉(zhuǎn)型實(shí)踐【39】;曹畋分析了南京曉莊學(xué)院圖書館采用智能化技術(shù)提升學(xué)科服務(wù)的新思路、新模式【40】;秦中云等以北京聯(lián)合大學(xué)圖書館為例,闡述了云計(jì)算環(huán)境下多校區(qū)圖書館智慧服務(wù)平臺(tái)構(gòu)建的平臺(tái)架構(gòu)【41】;林珍梅設(shè)計(jì)了基于Ha⁃doop的高校圖書館閱讀書目智慧推薦系統(tǒng)【42】。因此,以圖書館的業(yè)務(wù)流程為支撐和導(dǎo)向,重構(gòu)圖書館系統(tǒng)架構(gòu)的業(yè)務(wù)流程,仍存在廣泛的探索空間。
圖書館專業(yè)論文:新時(shí)期地方公共圖書館管理服務(wù)創(chuàng)新思考研究
5結(jié)語
本文結(jié)合主題模型、Sen’s斜率估計(jì)法、Mann-Kendall法、指數(shù)平滑法,提出了一種學(xué)科研究主題發(fā)展等級(jí)劃分與趨勢(shì)預(yù)測(cè)方法。本方法共涵蓋三個(gè)流程:首先是采用主題模型對(duì)學(xué)科領(lǐng)域進(jìn)行主題提取和文本聚類;進(jìn)一步,從研究人員和科研用戶兩個(gè)視角出發(fā),應(yīng)用Sen’s斜率估計(jì)法計(jì)算主題發(fā)文度,應(yīng)用Mann-Kendall法計(jì)算主題引文度,將兩個(gè)指標(biāo)映射到二維空間,并參考波士頓矩陣的命名方式,實(shí)現(xiàn)對(duì)學(xué)科研究主題發(fā)展等級(jí)進(jìn)行劃分;最后,融合研究主題發(fā)文量、被引量和下載量,形成主題熱力度指標(biāo),采用指數(shù)平滑法對(duì)學(xué)科研究主題未來發(fā)展態(tài)勢(shì)進(jìn)行了預(yù)測(cè)。
本文以CNKI數(shù)據(jù)庫為數(shù)據(jù)來源,以“智慧圖書館”為例進(jìn)行了方法實(shí)證,并與共詞聚類分析方法進(jìn)行了對(duì)比,驗(yàn)證了本文所提方法的準(zhǔn)確性和有效性,為科研人員和科研管理部門把握學(xué)科研究主題發(fā)展現(xiàn)狀及未來發(fā)展態(tài)勢(shì)、制定研究規(guī)劃、確定科研方向提供了可靠有效的決策參考。需要說明的是,本文采用LDA模型進(jìn)行主題提取,但主題內(nèi)容凝練依賴主觀判斷,需要探索更加有效的主題識(shí)別方法,提高結(jié)果的語義信息量,以提高主題的可解讀性;此外,在趨勢(shì)預(yù)測(cè)中直接應(yīng)用了三次指數(shù)平滑法,沒有與其他時(shí)間序列預(yù)測(cè)方法進(jìn)行比較,選擇應(yīng)用最優(yōu)方法。這些都會(huì)對(duì)本文的結(jié)論產(chǎn)生影響,我們將在后續(xù)的研究中加以改進(jìn)。
參考文獻(xiàn):
1譚春輝,熊夢(mèng)媛.基于LDA模型的國內(nèi)外數(shù)據(jù)挖掘研究熱點(diǎn)主題演化對(duì)比分析[J].情報(bào)科學(xué),2021,39(4):174-185.
2SongM,HeoGE,KimSY.Analyzingtopicevolutioninbioinformatics:InvestigationofdynamicsofthefieldwithconferencedatainDBLP[J].Scientometrics,2014,101(1):397-428.
3JungS,YoonWC.Analternativetopicmodelbasedoncommoninterestauthorsfortopicevolutionanaly⁃sis[J].JournalofInformetrics,2020,14(3):101040.
4廖遠(yuǎn)麗,羅瑞林.我國圖書館空間研究演進(jìn)的可視化分析[J].情報(bào)科學(xué),2018,36(12):106-110.
5張琬笛,胡志剛,郭佳程,等.基于S曲線的研究主題演進(jìn)分析與可視化技術(shù)[J].信息資源管理學(xué)報(bào),2020,10(3):70-77,101.
6巴志超,李綱,朱世偉.共現(xiàn)分析中的關(guān)鍵詞選擇與語義度量方法研究[J].情報(bào)學(xué)報(bào),2016,35(2):197-207.
7SaltonG,WongA,YangCS.Avectorspacemodelforautomaticindexing[J].CommunicationsoftheACM,1975,18(11):613-620
作者:宋凱1,冉從敬2
相關(guān)閱讀