當下,大數據正以極快的速度融入我國社會的諸多方面。據2018年7月的最新大數據統計,“過去5年,在全球范圍內,中國論文投稿量增幅顯著”。學術期刊作為出版業的重要領域,有必要站在行業發展的前沿,承擔學術期刊的使命,在享受大數據帶來便捷的同時,也要重視其可能帶來的一系列法律風險。
一、學術出版大數據化的新趨勢
在以大數據為背景的網絡技術應用中,從音頻、視頻主打的慕課、微課,到學術講座實時網絡直播,再到以交互問答為基礎的學術交流社群等,都在以不同的形式影響著期刊出版的發展。學術出版也呈現出因網絡技術和大數據平臺發展而加速更新換代的新趨勢。在2017年年底,由國家新聞出版廣電總局融合重點實驗室主持的公益性科研項目開發的開放科學(數字資源)識別碼(OSID)讓學術出版翻開了新的一頁。據開發人施其明講述,截至2018年7月,已有幾百家各類學術刊物使用了該技術。開放科學(數字資源)識別碼可以讓學術期刊自身的學術影響力得到巨大提升,同時也吸引了更多的讀者持續關注其感興趣的特定主題,增強了學術用戶黏性。此外,還有學者指出:“大數據可以幫助學術期刊實現優化選題策劃、提高編審效率、提升用戶體驗等,從而實現全方位的知識服務和智慧出版。”在大數據背景下,以前讓普通讀者覺得高高在上的學術類出版和普通讀者的距離開始縮小。
二、大數據時代學術出版的風險分析
“勵德·愛思唯爾出版集團的數據庫Science Direct每年共收錄25萬篇論文,每年下載量10億多篇;中國知網是目前國內大數據利用的領頭羊,依托其年均20多億次的檢索次數,以及年均近10億次的下載量,匯集了大量用戶信息和用戶痕跡”。不難看出,大數據既給學術期刊的采編和出版發行帶來了極大便利,也蘊藏了巨大的風險。
1.學術期刊對大數據時代的認識不足,風險防范意識有限
學術出版的風險防范存在于大數據應用的方方面面。大數據就像一把“雙刃劍”,一方面體現在它所帶來的大數據產業的機會與約束上,目前對數據的利用率還不到7%,可見數據的挖掘使用還存在著不可預想的發展空間。而另一方面,在移動互聯網盛行的當下,網絡處處留下了我們的“數據”,一定程度下,衍生了網絡安全問題。從全國范圍來看,“我國大數據應用水平落后, 數據管理意識有待進一步提高”。長期以來,學術期刊因為出版事業和產業分開的緣故,缺乏適應新變化的動力,多是采取傳統的出版方式辦刊,但也正因如此,學術期刊容易因傳統優勢較強而墨守成規,缺乏對新技術、新形勢的應對能力。大數據的海量信息為各領域的系統分析提供了數據,但其不可控的潛在風險可能會日積月累。若忽視大數據對出版行業的影響,“危機意識不夠、管理方式落后”,當風險最終以某種形式集中爆發時,當事人卻可能因缺乏前期了解和防范而難以有效應對。
2.大數據的應用在技術上還存在短板
大數據的應用和普及已成為一種時代的必然。大數據在出版應用上的一個典型例子就是中國知網,其近幾年推出的基于其龐大論文數據庫之上的論文學術不端檢測系統,保證學術期刊數據來源的合法性,最重要的是為避免學術不端行為提供了極大的便利,但它僅僅是一個幫助編輯進行稿件質量判斷和取舍的輔助性工具。據筆者多年的使用經驗,學術不端檢測系統并不是萬能的“靈丹妙藥”,它在帶來便捷、高效的同時,也有一些力所不及之處。一是知網目前無論從時間維度上還是內容覆蓋上,都還不能囊括國內所有文獻,比如年代久遠的文獻、現在出版的大部分圖書以及其他數據庫(維普、龍騰等)專屬的文獻等。二是由于技術原因,同一文獻的檢測結果有時前后不一致、檢測內容不準確以及時效性問題等。三是有專門的“降低重復率”的服務可以購買,利用大數據識別重復率的規則和漏洞,用人工方法來調整字序或替換文字,以達到檢測過關的目的。
3.大數據的普及使傳統意義上的不法行為呈現重復性、高發性
傳統意義上的盜版等不法行為,在大數據時代的開放性環境下主要表現為“復制和粘貼”,其難度和成本相比過去極大降低,而維權的難度和成本卻大大增加,導致這些不法行為呈現出明顯的重復性和高發性。在司法實踐中,涉及數字出版物的侵權問題大部分會依據《著作權法》來進行裁定,面對紛繁復雜的不法行為是難以做到全面覆蓋依法追責的。造成這一現象的主要原因:一是由于我國目前缺乏操作性強的數字版權保護制度措施,加之廣大作者的版權保護意識比較薄弱,導致涉及網絡版權的不法行為頻頻出現。二是我國很多的網民認為網絡上提供的資源都是免費的,缺乏網絡付費購買的意識,“知識付費”的習慣尚未養成,從而加劇了盜版等不法行為的發生。三是網絡出版物的盜版行為非常容易模仿和復制,一旦形成“破窗效應”,就會催生越來越多的不法行為??傊瑳Q策層有必要在現有法律法規基礎上,針對大數據時代的特點,適時頒布數字出版物版權保護條例、行政規章,也可以對現行法律法規進行目的性解釋。
4.大數據的特點讓法律風險更難以發現和預測
一般來說,大數據有4個特點,分別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),稱之為4V。當前的大數據時代,一些有實力的學術期刊就充分利用以上特點,以數字學術刊物或學術性手機軟件的形式來進行紙質文獻的數據化利用,讓讀者可以更加便捷地進行學習和研究。大部分的學術期刊在人力資源和技術力量上不夠,就采用授權開發模式,和專業的網絡文獻運營公司合作,推動刊物的數字化。移動互聯網的發展,人手一臺的手機移動終端讓知識的傳播力大大增強,形成遠較紙質刊物更大的學術影響力。但是也正是由于大數據的普及,讓潛藏其中的法律風險更難以察覺、預測和監控。不少網絡利用人工智能寫稿軟件對原始文獻進行再加工,一般的做法就是洗稿。其充分利用了大數據的海量信息的優勢,從過去簡單拼湊兩三篇文章、“剪刀加漿糊”的低級抄襲模式,升級為隱性抄襲多篇文獻中的文字,其“對別人的原創內容進行篡改、刪減,使其好像面目全非,但其實最有價值的部分還是抄襲的”。洗稿后的文字重新到了網上,標注為各網站或自媒體的“原創”內容,有些甚至集結公開出版。這些行為實質上已經構成了多重侵權,既侵犯了作者的著作權,也侵犯了刊物的發行權和匯編權,還涉及侵犯信息網絡傳播權等。這類侵權行為不容易被系統檢測出來,更難以被普通讀者發現,具有高度隱蔽性。
三、學術期刊大數據應用的法律風險規避
首先要尊重學術作品本身的著作權。著作權的權屬可以分為兩大類,一是人身權利,二是財產權利。在大數據背景下,讓人們利用其他人的作品的行為產生了全新的變化。大數據技術的發展讓獲取和使用他人作品的行為變得前所未有的便捷,違法成本大大降低。這一趨勢要求學術期刊在出版工作中,要注意區分“合理使用”與“法定許可”的立法目的、適用范圍和實現形式,將二者與一般的侵權行為相區分,以便準確識別法律風險和防范法律風險。其次是要保護作者的個人信息和隱私等人身權利。由于學術資源數據庫的建設還存在著一定的漏洞和風險,編輯部的技術水平也不足以應對潛在的風險,這些漏洞就容易成為網絡黑客的攻擊對象,導致很多的個人信息面臨著泄露的風險。學術期刊的作者,大多都是高校中有一定知名度的專家或教授,他們對自身的人身權利尤為重視。所以學術期刊要在網絡上收集和處理作者的信息過程中務必要注意對作者個人信息的保護。有知識產權法的專家從法律的角度提出了應對之策:“在堅持利益平衡原則的基礎上,設計大數據時代版權技術措施利用個人信息的‘告知與許可’規則和‘規避免責’規則是應對上述風險的有效途徑?!弊詈笫且獌灮瘜W術期刊編輯部的內部采編和出版發行環節的程序。現在絕大部分的編輯部都采用了網絡化的采編系統來處理來稿、退稿、審稿和用稿等環節,這些環節無一不涉及大量數據處理。采編系統的各類用戶在使用的過程中,就存在一定的信息泄露風險。比如個別學術期刊工作人員可能會利用工作之便將學術期刊的內部信息售賣給第三方的商業出版機構,從中獲取非法收入。還有些黑客利用采編系統漏洞直接侵入數據庫。類似情況一旦發生,不僅會對學術期刊產生不良的社會影響,還極易造成學術期刊內部信息的泄露。為了應對這種情況,學術期刊需要制定完善的內部監督制度,以及對采編系統進行升級。
四、法律風險規避的“把關人”——學術期刊編輯的責任定位
一直以來,學術期刊的責任編輯在學術期刊的采稿、用稿、編校和發行等過程中,都起著舉足輕重的中樞作用,被人們譽為學術刊物的“把關人”。在大數據背景下,編輯“把關人”的身份不僅需要再定位,而且“編輯面臨新的適應性挑戰,從提升編輯素養著手積極應對是邏輯的必然選擇”。學術研究涉及國家政治經濟等不同的領域,從長遠來看,甚至會對國家的安全、社會的穩定產生一定的影響。學術期刊的責任編輯作為法律風險規避“把關人”,面對大數據時代的海量信息來源,更應該要妥善處理文稿中的敏感信息,規避可能存在的法律風險,不能僅依據大數據來進行學術期刊的流水線式的生產和決定學術稿件的取舍,特別要“警惕大數據主義,處理好學術監督與保護作者隱私權的關系、學術期刊的學術性與政治性之間的關系”。學術期刊的主辦單位或管理部門要加強對編輯人員的法律教育培訓,增強風險意識,讓他們能夠樹立起牢固的法律規范意識和版權保護意識。學術期刊在版權聲明和約稿公示中要考慮到紛繁復雜的情況,對潛在的法律風險提前預判和規避,盡到合理注意義務。
五、結論
學術期刊的出版周期相對較長,讀者受眾群體相對較小,但對于一個國家而言,學術期刊刊載文章的學術水平決定了國家文化層面需求的高度。這種學術需求在大數據的推動下蘊藏著不可忽視的發展動力,不斷促進科研和學術的深入和細化,與此同時,法律風險也會隨之潛藏其中。因此,學術期刊應重視對相關法律風險的研究,采取科學且可行的規避方法。