學術期刊評價是圖書情報機構、高校和學術機構以及相關政府管理部門長期給予高度關注的問題,因此,國內外學者圍繞期刊評價開展了大量研究,取得了豐碩的成果。但是,對于主要是哪些因素決定了期刊的被引用,許多研究的結論迥異,而且對于國外學術期刊的研究結論是否適用于國內學術期刊,也有待驗證。因此,本研究以國內生物學、物理力學、地質學期刊為對象,系統地探討國內學術期刊的相關特征與被引之間的關系,為相關機構和部門的實踐工作和管理決策提供依據。
1研究現狀
現有學者對期刊特征和被引之間關系的研究主要集中在期刊載文量、基金論文比、論文合著者、引文特征、出版時滯等方面,具體如下:
(1)期刊載文量。Elizee等認為,隨著互聯網的發展和讀者數量增加,用戶可以更方便地獲取論文,期刊載文量的增加可以提高期刊被引量。陳留院以36家師范大學學報(自然科學版)為例,發現期刊的學術影響力與載文量成正相關。劉巖等人的研究都得到了相似的結論。但是,也有研究者提出不同的觀點。譬如,王鐘健等以農業經濟類期刊為樣本的研究顯示,期刊載文量的增加與期刊學術質量之間沒有必然聯系。
(2)期刊基金論文比。Shen等對ACMSIGIR、ACMSIGKDD兩個國際會議論文的研究,以及Pqi等對2010~2012年WOS收錄的自然科學論文的研究均表明,基金論文的學術影響力高于普通論文。戚爾鵬和葉鷹通過分析WOS數據收錄的2010~2012年基礎學科論文,發現除邏輯學以外,所有基礎學科的基金資助引用優勢為正,這表明基金論文的被引頻次和影響力普遍高于非基金論文。劉睿遠等人[10-12]的研究也支持了這一觀點。但是,王謙等對中文醫學核心期刊的研究和林麗芳對高校學報的研究卻顯示,基金論文比與期刊評價指標不完全具有相關性,基金論文與其學術影響力之間不存在必然聯系。而徐晶等分析2007~2011年口腔醫學類期刊基金論文的引用情況之后,指出基金論文比在一定程度上可以代表期刊質量,但是不能單純依此評判期刊的質量。
(3)論文合著者。Gl?nzel和Thijs的研究發現,生物醫學、化學和數學領域論文的平均引用率隨著合作者的數量而增長;Leimu和Koricheva進一步指出,4個共同作者的平均引用率高于3個、2個或1個。鐘鎮以2004~2008年WOS圖情學科研究型論文為樣本,發現按照合著人數進行分組,圖情學科4人合著論文的篇均被引頻次最高,但合著者的數量與論文被引影響力之間不能劃等號,合著作者數的提高未必能帶來論文被引頻次的提高。類似的,Gl?nzel和Schubert的國際合著研究也發現,相當一部分國際合著論文的被引績效低于研究樣本的平均水平。Abramo和Ange?lo的研究同樣拒絕了作者數量與期刊影響力之間的正相關假設。論文合著研究除了作者之間的合作,還包括機構之間的合作。趙金燕發現,機構分布數與被引頻次高度相關,對被引頻次有較強的解釋能力。盛麗娜也認為,用作者機構的分布情況評價科技期刊影響力優于使用影響因子和被引頻次。
(4)引文特征。Biglu以SCI和WOS為數據源,發現期刊的引文量和被引量具有一定的線性關系。期刊的篇均引文量越大,相應的被引量也就越高,期刊引文量和期刊的被引量之間會形成“馬太效應”。Didegah和Thelwall也認為適當數量的參考文獻將提高其獲得更多被引用的可能性。在國內,程慧平和萬莉也持相同的觀點,認為平均引文量表明了學術論文的研究起點和深度,可以反映論文的學術水平,而且周吉光等還提出,期刊引用半衰期衡量了期刊刊載文獻的參考文獻的時效跨度,期刊引用半衰期短,意味著該刊對較短期內發表的較新的研究文獻的興趣度。
(5)期刊出版時滯。Tsay等對醫學期刊2000年JCR相關數據的研究發現,出版頻次較高的期刊被引頻次也高。Shen等人以Nature、Science、Cell三種期刊為對象的研究顯示,期刊發文時滯與被引頻次之間存在相關性。與此類似,Pautasso和Sch?fer發現,生態學期刊平均編輯延遲天數與影響因子之間存在顯著的負相關。但是,韓牧哲等對圖書情報學中文核心期刊的研究卻表明,雖然論文的影響力與其發表時滯的長短存在相關關系,具有能使論文影響力最大化的理想時滯區間,但是,發表時滯并非越短越好。同樣,劉俊婉等以Scientometrics和《情報學報》為例,發現期刊論文的發文時滯與論文被引頻次之間僅具有相關性趨勢,但并不顯著。綜上,雖然已有不少研究分析了期刊特征與被引之間的關系,但是,在許多方面并未達成共識。為了準確地揭示國內期刊特征與被引之間的關系,從而有針對性地指導工作實踐和管理決策,本研究在系統梳理現有期刊評價指標的基礎上,提煉出11個期刊特征指標,分析它們與期刊被引之間的關系。
2數據獲取與主成分回歸分析
2.1數據獲取
學術期刊論文效用的體現是一個逐步呈現的過程,因此,本研究以期刊后,5年內累計獲得的被引用頻次作為衡量期刊影響力和質量的指標。為了保證數據來源的一致性,我們以中國知網的《中國學術期刊影響因子年報》、《中國引文數據庫》、《期刊發展要素統計分析》作為期刊特征指標和被引用數據的來源。具體如下:
(1)《中國學術期刊影響因子年報》:可被引文獻量、可被引文獻比、基金論文比、引用半衰期、引用期刊數;
(2)《期刊發展要素統計分析》:作者數、機構數、出版時滯、本刊比重、全國比重;(3)《引文數據庫》:篇均引文量和總被引。由于中國知網最新數據統計截止到2015年底,所以,本研究采用生物學、物理力學、地質學三個學科,共218種期刊2011~2015年的被引頻次,以及各刊2011年的特征指標。
2.2主成分回歸分析
本研究運用因子分析提取原始特征指標的公因子,進而采用多元回歸分析特征指標與被引之間的線性關系。數據分析使用SPSS20.0。
2.2.1因子分析
(1)KMO和Bartlett檢驗。結果顯示,生物學、物理力學和地質學三個學科的KMO分別為0.699、0.726、0.683,Bartlett球形檢驗p值均小于0.001,所選變量適合做因子分析。
(2)貢獻率和載荷矩陣。采用固定提取方法,生物學和物理力學提取出F1、F2、F3、F4、F5、F6六個主成分,地質學提取出N1、N2、N3、N4、N5五個主成分。這些主成分對生物學、物理力學、地質學期刊被引的累計貢獻率分別為92.638%、92.712%、86.413%。
2.2.2回歸分析
(1)模型擬合度R方檢驗。以被引為因變量,以因子分析提取的公因子為自變量,進行回歸分析。結果顯示,生物學、物理力學、地質學三個學科的確定系數R2分別為0.762、0.913、0.699,表明生物學和地質學回歸模型擬合度較高,物理力學回歸模型擬合度非常高。
(2)顯著性檢驗?;貧w模型的F檢驗結果顯示,生物學、物理力學、地質學三組樣本的p值均小于0.001,具有統計學意義。
2.2.3貢獻度分析
對回歸方程進行偏回歸系數t檢驗,以此為基礎進行逐步回歸得出具有顯著相關性變量的貢獻度。對回歸方程進行偏回歸系數t檢驗,結果表明:生物學中F1、F3、F6三個自變量的偏回歸系數t檢驗p<0.05;物理力學中F1、F4、F6三個自變量的偏回歸系數t檢驗p<0.05;地質學中N1、N2、N3、N4四個自變量的偏回歸系數t檢驗p<0.05。同時,采用逐步回歸法分別分析得出:生物學中F1的貢獻度最大為62.9%,F3和F6的貢獻度分別為5.7%和6.2%;物理力學中F1的貢獻度最大為83.1%,F4和F6的貢獻度分別為4.5%和2.1%;地質學中N1的貢獻度最大為40.7%,N2的貢獻度為18.1%,N3的貢獻度為6.3%,N4的貢獻度為6.5%。
3討論
3.1強貢獻度公因子
回歸分析結果表明,F1(N1)公因子與被引顯著相關,并且對被引有較高的貢獻度。尤其是物理力學期刊,其貢獻度高達83.1%。本研究支持了何榮利、王群英、趙金燕、Gl?nzel等人的研究結論,即載文量、作者數和總被引成正相關。期刊論文在文獻傳播過程中,作者數和發文機構數在一定程度上可以擴大論文的傳播范圍,使得其快速地被部分群體所認知,從而形成引用,提高期刊的被引頻次。同樣,引用期刊數反映了期刊的引用廣度,體現了該期刊對相關學科的滲透和交融,引用期刊數越多越容易獲得相關學科的關注和引用。F1和N1公因子均從可被引文獻量、作者數、機構數、全國比重、引用期刊數五個原始變量中提取。五項特征指標的Spearman相關性分析結果顯示,可被引文獻量、作者數、機構數、全國比重彼此之間都具有很強的正相關關系,該結果進一步體現了F1(N1)對被引強貢獻度的合理性。
3.2弱貢獻度公因子
回歸分析結果表明,篇均引文量、基金論文比、本刊比重、引用半衰期、可被引文獻比等指標雖對被引具有一定的作用,但貢獻度相對較低。
(1)基金論文比。將基金論文比作為期刊評價指標是否合理,一直備受爭議。一些學者認為要重視基金論文比的作用;而另一些學者則明確表示,基金論文比是一個欠科學的期刊評價指標,甚至應該被徹底否定;當然,也有部分學者持比較中立的態度,認為基金論文比有一定的作用,應客觀對待。本研究結果顯示,生物學和物理力學期刊的基金論文比對被引頻次的貢獻度分別為6.2%和2.1%,地質學期刊的基金論文比和篇均引文量共同提取的公因子貢獻度為18.1%??傮w而言,基金論文比對期刊被引的貢獻度不高。因此,可將基金論文比作為期刊評價的輔助指標,但不應過分強調基金論文比的作用。
(2)篇均引文量。本研究發現,期刊的篇均引文量對被引存在學科差異。地質學期刊篇均引文量和基金論文比對被引的總貢獻度為18.1%,生物學期刊篇均引文量對被引貢獻度為5.7%,而物理力學期刊篇均引文量與被引不存在顯著相關性。這一結果部分支持了Biglu、梁春慧和葛趙青等的觀點。從引文功能的角度,期刊的引文具有文獻再發現的功能,一篇論文引用的文獻越多,越容易得到相關領域研究人員或機構的關注,其被引用的可能性也就更大;再者,研究人員檢索相關文獻時一般采用關鍵詞、主題詞或者通過引文索引檢索,因而無論是從文獻本身的功能,還是從研究人員查找文獻的習慣,都會導致平均引文數量較高的期刊獲得更多的關注,相應的被引率也會提高。從引文價值的角度,較多的引文數量可以反映該論文的研究基礎扎實,可能具有較高的學術價值,因而獲得更多研究人員的關注和引用。
(3)引用半衰期。引用半衰期是計量學科知識老化水平的重要指標。一般認為,引用半衰期越短,意味著期刊引用的近期文獻越多,表示該刊更關注最新的研究成果。而最新的研究成果會得到更多研究人員的關注,被引用的概率也就越高;反之亦然,期刊引用的文獻比較老,意味著該期刊發表的論文很可能存在重復性研究,其被引用的可能性降低。本研究結果顯示,地質學期刊的引用半衰期與被引雖存在負相關性。這雖然支持了顧璇提出的期刊引用半衰期越短,被引越高的觀點,但是,應該注意到引用半衰期對被引的貢獻度僅為6.5%。而生物學和物理力學期刊的引用半衰期與被引之間的關系沒有通過顯著性檢驗。這組數據的分析結果提示,將引用半衰期作為評價期刊質量或辦刊水平指標的依據似乎并不充分。
(4)本刊比重和可被引文獻比。地質學中N3(本刊比重、可被引文獻比共同提取)對總被引的貢獻度為6.3%,物理力學中F4(本刊比重)對總被引的貢獻度為4.5%。本刊比重雖然可以體現期刊的專業化程度,且對期刊被引具有一定貢獻,但是整體影響有限。如何評價該指標與期刊影響力乃至期刊質量之間的關系,仍需進一步探索。
3.3無貢獻度因子
許多研究者認為,出版時滯長會導致文獻老化,從而降低甚至失去被引用的機會。Tsay、Pautasso以及高慧芳等的研究都支持了上述觀點。但是,本研究結果卻顯示,無論生物學、物理力學還是地質學期刊,出版時滯與被引之間的關系均不顯著。這種現象是僅存在于這三個學科還是普遍現象,抑或國內外期刊存在差異,尚有待進一步驗證。
4結論
通過對國內生物學、物理力學、地質學三個學科期刊的分析發現:
(1)期刊的規模和擴散力(可被引文獻量、作者數、機構數、引用期刊數、全國比重)對被引頻次具有較高的貢獻度,對期刊被引有較大的影響,在一定程度上決定了期刊的被引頻次。
(2)基金論文比、篇均引文量、本刊比重、引用半衰期、可被引文獻比對被引頻次貢獻度較弱,而且影響程度存在學科差異,同一特征在不同學科對期刊被引頻次的影響不同,在分析以上期刊特征對期刊被引頻次的影響時應考慮學科本身的特點,不能一概而論。
(3)出版時滯與被引不存在具有統計學意義的相關關系,出版時滯的長短不會影響期刊的被引用情況。當然,由于本研究目前只選取了生物學、物理力學和地質學三個學科的期刊,在時間跨度上選擇后五年內的被引用情況,上述結論能否應用于其他學科和時間跨度還需進一步驗證。