時間:2023-03-14 15:12:39
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇大數據分析論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
1.引言
目前發展大數據產業已經上升為國家戰略,大數據的價值也得到了社會的廣泛認可。眾多研究[1-5]表明,大數據不僅為政府治理開辟了新思路,還是企業創新的重要源泉和高校科研的重要支撐。大數據交易平臺是整個大數據產業的基礎與核心,它使得數據資源可以在不同組織之間流動,從而讓單個組織能夠獲得更多、更全面的數據。這樣不僅提高了數據資源的利用效率,更重要的是,當一個組織擁有的數據資源不斷豐富和立體化,有助于其通過數據分析發現更多的潛在規律,從而對內提高自身的效率,對外促進整個社會的不斷進步。
在現有的大數據交易平臺上,數據供應方和需求方各自供需信息,交易雙方瀏覽這些信息,如果發現合適的交易對象,則進行大數據資源的買賣,交易平臺只作為信息中介存在。這類大數據交易的本質,其實是單獨的大數據資源交易,現有平臺可以統稱為第一代大數據交易平臺。第一代大數據交易平臺在供需平衡、數據定價和時效性三個方面都存在較大的不足。本文針對這些不足進行改進,設計了一種全新的第二代大數據交易平臺,命名為:融合數據分析服務的大數據交易平臺,該平臺將數據資源交易與數據分析服務進行深度融合,實現了數據與服務的一體化交易。本研究不僅為當下正在建設的各類大數據交易平臺提供有益的借鑒,也豐富了大數據交易的基礎理論體系。
2.相關研究
目前大數據交易的相關研究中,比較有代表性的有:
(1)大數據的財產屬性和所有權。王玉林等[6]對大數據的財產屬性展開研究,認為大數據的法律屬性會直接影響大數據產業的發展,而大數據交易實踐本身就反映出大數據具有財產屬性。但大數據與傳統的財產權客體存在較大不同,它符合信息財產的特征,是信息財產權的客體,應受到相關法律的保護。齊愛民等[7]從宏觀的角度分析了國家對于其主權范圍內數據的所有權,剖析了個人擁有的數據權以及數據的財產權。
(2)大數據的定價問題。劉朝陽[8]對大數據的定價問題展開研究,首先分析了大數據的基本特征、價值特征等定價基礎。接著討論了效用價格論、成本價格論等定價模式。最后分析了大數據的定價策略,并對大數據定價的雙向不確定問題進行了詳細論述。劉洪玉等[9]認為在大數據交易過程中,由于缺乏足夠的歷史參考,其數據資源的交易價格很難確定,因此提出一種基于競標機制的魯賓斯坦模型,用于大數據交易雙方進行討價還價,以求達成一個交易的均衡價格。翟麗麗等[10]從資產的期權價值角度來評估大數據資源的價值,并指出數據在不斷變化和更新,加上數據的非獨占性等情況的出現,數據資產的價值可能會下降,最后綜合這些因素構建了一個評估模型來計算數據資產的價值。
(3)大數據交易的安全與隱私保護。史宇航[11]認為非法的數據交易會對個人數據等高價值信息的安全造成影響,對非法數據交易的購買方和協助方都應進行處罰。提出應先明確數據的法律屬性,再以數據交易所為平臺進行交易,并對數據交易所的法律地位進行了分析。殷建立等[12]為應對大數據時代數據采集、交易等過程中的安全問題,綜合考慮技術、政策和管理平臺等方面的因素,構建了一種個人數據溯源管理體系,該體系可在數據應用時實現個人數據的追蹤溯源,從而保護其個人隱私。王忠[13]認為大數據環境下強大的數據需求會導致個人數據的非法交易,為應對這種情況,應該建立個人數據交易許可機制,通過發放交易許可證、拍賣授予等措施實現隱私保護。
(4)大數據交易的發展現狀與問題。楊琪等[14]認為我國的大數據交易還處于行業發展的早期,大量數據源未被激活,原因是大數據產業價值鏈的各個專業環節發展滯后,并且對數據交易中的安全問題和隱私泄露等有較大的擔憂。應該對數據產品進行改造,使其更商品化,并且通過政府開放公共數據等措施逐漸消除數據流通中的安全顧慮。唐斯斯等[15]首先分析了我國大數據交易的發展特點、交易類型等現狀,接著指出目前大數據交易存在法律法規相對滯后、行業標準不完善、交易平臺定位不明確、數據質量不高等問題,最后提出應加快相關法律和標準建設,并推動數據開放,加強交易方式的創新。
除了上述四個主要研究方向以外,李國杰等[16]從理論的角度分析了大數據研究在行業應用和科學研究方面的重要作用,這從客觀上反映了大數據流通的必要性。涂永前等[17]認為大數據時代企業管理和運用數據資源的相關成本會成為企業的主要交易成本,這會改變企業的組織結構,并導致企業邊界的變化,企業會進行多方向的擴張,這為促進大數據產業發展的相關法律的制定提供了理論支持??偟膩砜矗捎诖髷祿灰妆旧韺儆谳^新的領域,因此相關研究總體上較少,已有研究也大多集中在上述幾個研究方向上。實際上,大數據交易平臺是實現大數據交易的重要載體,是大數據資源流通轉換的主要節點,交易平臺本身需要隨著整個大數據產業的發展,不斷的改進和升級,而現有研究中恰恰缺少對大數據交易平臺本身進行創新的研究。由此,本文針對現有大數據交易平臺的不足,結合實際設計了一種全新的融合數據分析服務的大數據交易平臺,為實踐和科研提供借鑒和參考。
3.現有大數據交易平臺的不足
大數據本身作為一種新興事物,當把它作為一種商品進行交易時,其交易平臺的設計很自然會參照傳統的商品交易模式,即:交易雙方先供求信息,再經過討價還價,達到一個均衡的價格則成交,賣方將大數據資源經過脫敏處理后,交付給買方。目前無論是政府主導的大數據交易所,還是企業或者高校創建的大數據交易平臺,都是采用類似的交易模式,這也是第一代大數據交易平臺的突出特點。實際上大數據與傳統商品有很大的區別,照搬傳統商品的交易模式會出現很多問題。本文將從供需平衡、數據定價和時效性三個方面分析現有大數據交易平臺的不足。
3.1 數據供需的錯配
現有大數據交易平臺的第一點不足就是數據供需的錯配,即:供應方提供的數據資源往往不是需求方所需要的,而需求方需要的數據在交易平臺上找不到,即使有相近的數據資源,也存在很大的數據缺失或冗余,買回去也無法使用。對數據供應方來說,由于無法準確預知數據買方多樣性的需求,它只能從自身角度出發,將可以公開的、并且自認為有價值的數據資源放到平臺上待售。對需求各異的買方來說,供應方提供的標準數據很難與自己的應用方向精準匹配,這也是目前大數據交易還不夠活躍的原因。當然,當供需雙方建立初步聯系以后,供應方甚至可以為需求方個性化定制大數據資源,但即使這樣,供需錯配的問題仍然無法解決,原因就在于單個的數據供應方無法提供多維的數據資源,只有多維的數據資源才具有較高的分析價值。
3.2 大數據資源定價困難
大數據資源定價困難是現有大數據交易平臺的第二點不足。大數據資源和普通商品不同,普通商品可以直接消費或者作為再加工的原材料,其價值都可以通過最終的消費品價格得到體現。而大數據本身的價值無法直接衡量,需求方購買它的目的是作為數據分析的信息源,但是否能發現潛在的規律還未可知。因此無法在購買前,準確判斷出待售數據資源的價值大小。此外,需求方在不確定某大數據資源是否能真正能給組織帶來收益情況下,很難給出一個較高的價格,這在客觀上會影響數據供應方的交易積極性,加大了供需雙方達成交易的難度。
3.3 數據的時效性不強
現有大數據交易平臺的第三點不足,就是數據資源的時效性不強。目前很多大數據交易平臺上待售的數據資源都以歷史數據為主,這是因為數據資源在交易前需要經歷脫敏處理,將涉及政府信息安全、企業商業機密和個人隱私等敏感信息進行變換和替代。此外,供應方還需要對原始數據進行初步的清洗,整理成一定的數據格式集中存貯和交付,方便需求方進行數據分析。由于一般的數據供應方并不具備對大數據進行實時脫敏和清洗的能力,只能將采集到的數據資源,經過一段時間的離線處理后,再放到交易平臺上,所以只能供應歷史數據。隨著社會節奏的不斷加快,歷史數據很可能并不能反映當下的真實情況,越來越多的數據分析都需要用到實時數據作為信息源,這是未來大數據交易必須克服的一個短板。
4.融合數據分析服務的大數據交易平臺設計
本文提出將數據分析服務融合到目前的大數據交易中,以此來克服現有交易平臺的不足,本節將首先對數據分析服務進行概念界定,再依次介紹平臺設計的總體思路和核心模塊的設計,具體如下。
4.1 數據分析服務的概念界定
數據分析是指運用各類數據處理模型和信息技術手段,對數據資源進行深度的挖掘,從而發現其中蘊含的規律,作為管理決策的依據。數據分析本身是一種能力,如果一個組織將其數據分析能力提供給其他組織或個人,并收取一定的費用,這就是數據分析服務。在大數據環境下,數據資源不僅體量巨大而且種類多,對數據分析能力的要求不斷提高。在這種情況下,只有少數組織具備獨立處理大數據的能力,其他的組織比如大量的中小企業,都需要從組織外部尋求專業的數據分析服務,來滿足自身的需要。因此,數據分析服務和大數據資源一樣存在巨大的市場需求。
4.2 平臺設計的總體思路
本文將提出的融合數據分析服務的大數據交易平臺,定位為第二代大數據交易平臺,它將大數據資源交易與數據分析服務兩者進行深度融合,在交易平臺上實現數據與服務的一體化交易。大數據交易平臺的角色也從原來的數據資源買賣的信息中介,轉變為大數據綜合服務商。在融合后的大數據交易平臺上,數據需求方不再提交數據資源的需求信息,而是直接提出自己的應用方向和想要得到的結果,交易平臺再根據需求方的應用方向,反向匹配數據資源和數據分析服務。這個匹配的過程不是單一的數據集或服務的查找,而是對全平臺的數據資源進行有效整合,形成高價值的多維數據,再結合復合型的數據分析技術,得到最終的分析結果,最后將分析結果與基礎數據一同交付給需求方。交付基礎數據的目的,一是方便需求方進行分析結果的對照,為決策提供更精準的參考。二是需求方可以根據基礎數據進行衍生挖掘,進一步提高數據的利用效率。平臺設計的總體思路繪制成圖1。
圖1 平臺設計的總體思路
4.3 核心模塊的設計
融合數據分析服務的大數據交易平臺共劃分為四大模塊,具體如圖2所示。
圖2 融合數據分析服務的大數據交易平臺的主要模塊
系統管理模塊具體又分為用戶管理、系統維護和安全管理。安全管理是系統管理模塊的重點,主要包含三個方面的功能:第一,負責整個交易平臺的系統安全,通過對交易平臺進行實時監控,阻止外部的非法入侵行為,保障平臺的正常運行。第二,對數據供應方提交的數據資源進行審核,如果發現是非法數據,則阻止其交易,并及時將有關情況反饋給相關的政府監管部門,由它們進行調查處理。第三,檢查所有數據是否經過脫敏處理。如果發現部分數據存在未脫敏或者脫敏不合格的情況,交易平臺將負責對該數據資源進行脫敏處理,從而保護數據中的隱私不被泄露。
大數據資源池模塊、數據分析服務模塊和協同模塊是交易平臺的三大核心模塊,是數據與服務兩者融合并實現一體化交易的關鍵,本文接下來將對這三個核心模塊的功能進行詳細設計。
4.3.1 大數據資源池模塊
大數據資源池模塊主要包含三個方面的功能:數據資源格式的整理、數據的多維度整合、大數據資源的云存貯。具體如下。
(1)數據資源格式的整理。由于大數據交易平臺上的數據資源來自不同的數據供應方,因此其數據資源的格式會有較大的差異。如果不經過格式整理就直接進行數據分析,很可能會因部分數據無法準確讀取,而影響數據處理的效率,嚴重者還會導致數據分析中斷。數據資源格式整理的主要任務是將同一類型數據的格式進行統一,對部分缺失的數據屬性進行補充,對錯誤的數據格式進行修正。
(2)數據的多維度整合。在上文3.1中提到供需錯配的一個重要原因,就是單個數據供應方無法提供高價值的多維數據。所謂多維數據是包含用戶或者行業多個背景和情境的大數據資源,這些多維數據使用戶或行業多個側面的信息產生了關聯,有利于發現深層次的潛在規律。融合數據分析服務的大數據交易平臺應該作為數據整合的主體,將單個數據供應方提供的零散的數據資源,進行多維度的整合,當缺少某一個維度的數據時,再向相應的數據供應方進行定向的采集,最后得到相對完整的多維數據,具有很高的分析價值。
(3)大數據資源的云存貯。大數據資源經過格式整理和多維度整合以后,已經可以作為數據分析服務的信息源。下一步就是將這些數據資源進行統一的云存貯,以便數據分析服務調用。以往部分大數據資源由于體量巨大或實時更新的需要,無法上傳到交易平臺上,或者只提供部分調用接口。融合數據分析服務的大數據交易平臺通過建立云存貯中心,將整合后的多維數據進行統一存放和調用,有助于提高數據資源的存取效率。
4.3.2 數據分析服務模塊
數據分析服務模塊首先根據數據需求方的應用方向,匹配出合適的多維數據資源,再選擇相應的數據分析模型分配所需的計算能力,最后將得到的分析結果反饋給需求方。本文將數據分析服務劃分為三個大類:基礎性分析服務、高級分析服務、深度定制的分析服務。具體如下。
(1)基礎性分析服務?;A性分析服務是指那些常規的數據統計,比如:總體中不同對象的占比分析,基于不同屬性的關聯分析或相關性分析等。這些分析服務耗時較短,分析技術較為簡單,只要數據資源本身完備,就可以迅速得到結果?;A性分析服務由大數據交易平臺本身來提供,可以面對不同的需求方,實現快速交付。
(2)高級分析服務。高級分析服務是指那些較為復雜的數據分析服務,比如:精準的趨勢預測、全面的用戶興趣畫像、非結構化的信息挖掘等。這些分析服務需要大量專業的數據處理技術,比如:興趣建模、視頻分析,音頻分析、深度語義分析等,必須由大數據交易平臺對接第三方的數據分析服務商,由它們來提供高級分析服務。大數據交易平臺在同一數據分析領域,應引入多家數據分析服務商,通過動態的競爭,來保證服務的質量。
(3)深度定制的分析服務。大數據分析目前還處在快速發展階段,很多前瞻性的技術還在試驗當中,應該說數據分析技術的發展相對于旺盛的現實需求來說是滯后的。當需要用的某一數據分析技術,在目前的市場上還找不到現成的提供方時,就需要大數據交易平臺為其進行深度的定制,交易平臺通過多方位的研發能力評估,尋找合適的技術主體來進行專門的技術攻關。
4.3.3 協同模塊
協同模塊主要包含兩個方面的功能:數據分析服務之間的技術協同、交易各方的管理協同。具體如下。
(1)數據分析服務之間的技術協同。在面臨較為復雜的數據分析任務時,可能需要用到多個領域的數據分析技術,這時單個的數據分析服務商可能無法獨立完成。因為不同的行業領域,都有其行業技術的獨特性,需要長時間的專業積累。在這種情況下,就需要多個數據分析服務商相互合作才能完成。數據分析服務之間的技術協同,就是通過一定的技術標準和操作規范,讓多個數據分析技術提供方,能夠在完成同一任務時,在技術上不沖突,能夠相互并行的完成對數據資源的處理,按時按質的交付最終的分析結果。
(2)交易各方的管理協同。在融合數據分析服務的大數據交易平臺上,交易的參與者一共有四類,分別是數據資源的供應方、數據分析服務商、需求方和交易平臺自身。數據需求方在提交自己的應用方向和預期結果的同時,提交自己的交易預算。交易平臺根據需求方提交的應用方向和預期結果,對數據資源和數據分析服務進行反向的選擇。如果數據分析任務中只用到了基礎性分析服務,則整個交易為平臺方、需求方、數據資源供應方的三方交易。如果某數據分析任務,平臺自身無法完成,需要用到第三方的數據分析服務商,則整個交易包含了全部四類參與者,是一個四方交易。交易的基本原則是實現參與各方的利益共享。交易各方的具體利益分配如圖3所示。
圖3 交易各方的利益分配
需求方希望在獲得預期結果的同時,其支付的成本在可接受的范圍內。交易平臺在對數據和服務進行反向匹配后,會出現兩種不同的情況:第一種情況是在原交易預算下,可以達到需求方預期的結果,則可成交。第二種情況是,原交易預算較低,在該預算下無法達到需求方要求的結果,這時交易平臺會和需求方溝通,提出新的報價,需求方經過考慮后,與平臺進行討價還價,它們在價格上達成一致時才能完成交易。由于交易數據是整合后的多維數據,因此原始數據資源供應方的收益,由平臺從總交易價中支付,具體的支付方式可分為平臺一次性買斷或按次數支付。同一數據資源對于不同的需求者來說,其價值是不一樣的,融合數據分析服務的大數據交易平臺根據最終的一體化交易成交價,反向對數據資源進行定價,相對于現有的大數據交易平臺來說,是一種進步。交易平臺的深度參與,會使數據交易的頻率加快,原始數據資源供應方會獲得更多的收益。數據分析服務商根據具體的數據分析任務,直接參與由平臺發起的競價,達成交易后由平臺支付。交易平臺本身的收益則是需求方支付額減去其他各方收益的差價。
5.融合數據分析服務的大數據交易平臺的優勢
本文3.1到3.3中指出現有大數據交易平臺存在數據供需錯配、大數據資源定價困難、數據的時效性不強三大不足。融合數據分析服務的大數據交易平臺作為改進后的第二代大數據交易平臺,可以很好地克服上述三點不足。除了這三個方面的優勢以外,由于融合后可實現數據與服務的一體化交易,這將擴大交易對象的覆蓋范圍,提升交易的活力,具體如下。
5.1 直接面向應用,從根本上避免了數據供需的錯配
在融合數據分析服務的大數據交易平臺上,需求方對交易平臺直接提出應用方向和預期結果。交易平臺對全平臺的數據進行多維度整合,如果缺失某個維度的數據,可以進行定向的采集和補充,最后形成高價值的多維數據。這些多維數據才是真正具有分析價值的數據資源,這是單個數據供應方無法提供的。在得到多維數據后,結合平臺自身和第三方數據服務商的分析能力,得到最終的分析結果。交易平臺最后交付給需求方的是數據分析結果和基礎數據,這種直接面向最終應用的大數據交易方式,從根本上避免了數據供需的錯配。
5.2 融合后定價更有根據
在現有的大數據平臺上,數據需求方是將數據資源買回去以后自己分析,而在購買數據資源之前,不能預知數據分析效果的好壞,因此無法進行有效的價值判斷,這是定價困難的關鍵點。在融合數據分析服務的大數據交易平臺上,需求方不再直接對數據資源付費,而是對最終的數據分析結果付費,并且數據分析結果是根據需求方的要求反向定制的,是符合需求方利益的。需求方可以通過評估預期結果對自身的重要性或收益的改進程度,給出適當的交易預算。交易平臺以該預算為參照,對數據和服務進行選擇,若出現原預算約束下無法實現預期結果的情況,交易平臺再與需求方進行溝通,雙方討價還價后達成交易。這樣相對于現有的大數據交易平臺來說,融合后定價更有依據。
5.3 融合后可提供實時數據
在融合數據分析服務的大數據交易平臺上,數據資源采用云存貯的模式,由平臺進行統一管理,這提高了數據資源的安全性。在數據安全有保障的前提下,由交易平臺出面和數據資源供應方進行實時數據的對接,將實時數據納入大數據資源池中。對于單個的數據資源供應方來說,實時的數據脫敏難度太大。但大數據交易平臺不一樣,它可以利用規模優勢,組建強大的計算能力,對大數據資源進行實時的脫敏和清洗,極大地提高了數據資源的時效性。
5.4 融合后將擴大交易對象的覆蓋范圍,提升交易的活力
融合后可實現數據和服務的一體化交易,讓很多自身不具備數據分析能力的組織和個人,也能方便地利用大數據,特別是大量的中小企業,這將大大增加交易對象的覆蓋范圍。
交易對象的增多會促進交易頻率的增長,從而為數據資源供應方帶來更多的收益,這樣會提升它們參與交易的積極性,鼓勵它們供應更多的數據資源,從而提升交易的活力,整個大數據交易行業就形成了正向循環的良好發展態勢。
6結語
本文對大數據交易平臺本身進行了改進與創新,設計了一種全新的第二代大數據交易平臺,即:融合數據分析服務的大數據交易平臺。該交易平臺可以直接面向需求方的應用方向,實現數據和服務的一體化交易,不僅從根本上避免了數據供需的錯配,還使大數據交易的定價更有依據,平臺的深度參也讓提供實時數據成為可能,這些將從整體上提升大數據交易的效率。融合后數據和服務的一體化交易降低了大數據應用的技術門檻,鼓勵更多組織和個人參與,增加了交易活力。未來筆者將繼續關注大數據交易平臺的創新研究,為實際應用和學術科研提供更多有益的參考。
參考文獻
[1]趙強,單煒.大數據政府創新:基于數據流的公共價值創造[J].中國科技論壇,2014(12):23-27.
[2]徐繼華,馮啟娜,陳貞汝.智慧政府:大數據治國時代的來臨[M].北京:中信出版社,2014.
[3]李文蓮,夏健明.基于“大數據”的商業模式創新[J].中國工業經濟,2013(5):83-95.
[4]侯錫林,李天柱,馬佳,等.大數據環境下企業創新機會研究[J].科技進步與對策,2014,31(24):82-86.
[5]張峰,張迪.論大數據時代科研方法新特征及其影響[J].科學學研究,2016,34(2):166-170,202.
[6]王玉林,高富平.大數據的財產屬性研究[J]。圖書與情報,2016(1):29-35,43.
[7]齊愛民,盤佳.數據權、數據主權的確立與大數據保護的基本原則[J].蘇州大學學報:哲學社會科學版,2015(1):64-70.
[8]劉朝陽.大數據定價問題分析[J].圖書情報知識,2016(1):57-64.
[9]劉洪玉,張曉玉,侯錫林.基于討價還價博弈模型的大數據交易價格研究[J].中國冶金教育,2015(6):86-91.
[10]翟麗麗,王佳妮,何曉燕.移動云計算聯盟企業數據資產評估方法研究[J].價格理論與實踐,2016(2):153-156.
[11]史宇航.個人數據交易的法律規制[J].情報理論與實踐,2016,39(5):34-39.
[12]殷建立,王忠.大數據環境下個人數據溯源管理體系研究[J].情報科學,2016,34(2):139-143.
[13]王忠.大數據時代個人數據交易許可機制研究[J].理論月刊,2015(6):131-135.
[14]楊琪,龔南寧 .我國大數據交易的主要問題及建議[J].大數據,2015(2):38-48.
關鍵詞:大數據背景;專業技術;技能探究
中圖分類號:G64 文獻標識碼:A 文章編號:1009-3044(2016)33-0123-01
Abstract : With the theme of declare big data and applied technology major, this thesis was written by author from telecommunications engineering academy. It has researched and analysed the composition of big data, related technologies, application requirement about the data mining and the problems has been solved by big data technology; Also it described what kind of related knowledge and skills need to be master by higher vocation education students in school, analysed the teaching qualities contrast with the needs of modern enterprises in details, by all means this thesis will focus on practically personnel training and explore the thinking of vocational colleges’ big data application technology major.
Key words : big data background, professional technology, skills exploration
隨著網絡和數據信息科學的發展,數據在量和復雜度上的爆炸式增長讓人類進入了大數據時代。根據IDC監測,人類產生的數據量正在成指數及增長,大約每兩年翻一番,以此速度在2020年之前會持續保持下去。大量數據源的出現則導致了非結構化、半結構化數據爆發式的增長即數據結構日趨復雜。大數據分析意味著企業能夠從這些新的數據中獲取新的洞察力,并將其與已知I務細節相融合。大數據對各種行業似乎產生了前所未有的巨大影響,從制造商到旅游業,從產品設計到消費者行為分析,大數據能提供前所未有的信息,幫助公商行業做出最好的決策。公商行業對合格的數據分析師或者數據工程師的需求很大。
人才市場需要會分數據并以有用的方式呈現信息的雇員。根據市場需求,高職院校需要培養學生成為具有數據應用技能的人才以滿足市場需求。我們研究方向是調查公司企業所需要的技能和大學教的數據分析技能,對比兩方面的技能的差別。人才需求調研裼昧宋示矸絞講杉專家的意,專家分為相關專業學科教授和企業內本行業專家。
大數據應用技術專業的課程設置應跟隨新技術的應用,跟隨社會及企業需求,在新專業中重視培養專業技能和項目經驗人才,課程設置應貼合社會需求培養相應的就業技能。需要研究關于合格的數據分析師或者數據工程師應該具有什么資格及知識技能。調研的結果可以幫助學院開設有關大數據學科的學校及大數據有關的課程教材。
調研內容如下表格:
綜上所述,十報告傳達的是要重視高等職業教育,強調“要全面實施素質教育,深化教育領域綜合改革,著力提高教育質量,培養學生創新精神。”中國的職教體系也在深入發展改革的過程中。本調研是針對高等職業院校的大數據應用技術專業的課程設置的進行探究,通過對大數據應用技術專業在市場人才需求的研究,對全面實施素質教育,重視學生的創新能力的培養具有重要意義。
參考文獻:
[1] 王星.大數據分析:方法與應用[M].清華大學出版社,2013.9.
[2] 曹正鳳.數據分析統計基礎[M].電子工業出版社,2015.2.
[3] 屈澤中.大數據時代數據分析[M].復旦大學出版社,電子工業出版社,2015.7.
[4] Hames R.Evans.Business Analytics:Methods,Models,and Decisions[M].電子工業出版社,2015.7
關鍵詞 大數據;CiteSpace;教育
中圖分類號:G642 文獻標識碼:B
文章編號:1671-489X(2016)18-0069-03
Abstract The advent of the era of big data has brought new vitality
and challenges for educational research. This paper uses bibliometric visualization software Cite Space to analyze thesis with key words data and education from CNKI based on Co-occurrence analysis of keywords, explore the hot issues in the field of educational research, summarize the research status and trends.
Key words big data; CiteSpace; education
1 引言
近年來,教育領域研究者開始關注大數據背景下的教育管理模式轉變、教育決策研究等內容,大量基于大數據背景的教育領域研究論文逐年增加。以“大數據”“教育”為主題關鍵詞在CNKI中國知網進行搜索,僅選擇SCI、EI、中文核心、CSSCI四類來源期刊截止到2015年12月出版的文獻,共檢索到417條數據,從2010年開始呈現出逐年上升的趨勢。對這些文章進行瀏覽和篩選,選擇與本研究主題相關的論文,共247篇。對這247篇文章的關鍵詞信息進行研究,分析大數據的出現對教育領域研究熱點及發展趨勢的影響。
2 教育領域熱點問題研究知識圖譜
CiteSpace軟件是一款引文可視化分析軟件,著眼于分析科學知識中蘊含的潛在信息,通過可視化的手段呈現科學知識的結構、規律和分布情況[1],能對文獻進行作者分析、關鍵詞共現分析、機構分析、作者共被引分析、文獻共被引分析等。關鍵詞共現分析是一種內容分析技術,通過分析在同一個文本主題中的款目對(單詞或名詞短語對)共同出現的形式,確認文本所代表的學科領域中相關主題的關系,進而探索分析學科領域的發展,發現學科的研究熱點和研究趨勢[2]。
使用CiteSpace軟件對下載的文獻進行關鍵詞共現分析,生成圖1所示關鍵詞共現知識圖譜,分析大數據的出現對教育領域研究熱點和趨勢的影響。關鍵詞出現的頻次由圓圈代表的節點反映,圓圈越大,表明關鍵詞出現次數越多,最大圓圈代表的關鍵詞是“大數據”。
根據圖1得到表1所示文獻關鍵詞、被引頻次、中心性等指標數據。中心性代表共現程度的高低,中心性越強,表明該關鍵詞與其他關鍵詞共同出現的幾率就越大,也就表示該關鍵詞在共現網絡中的影響力越大。從知識理論角度分析,頻次和中心性高的關鍵詞一般是某一段時期內研究者共同關注的問題,也就是研究的熱點和前沿。表1中,“大數據”是頻次最高也是中心性最高的關鍵詞;“學習分析”頻次為23,中心性為0.22;“數據挖掘”頻次為13,中心性為0.15,等等這些都是熱門的研究主題。
3 大數據背景下教育領域的熱點研究
依據圖1和表1所示結果,將大數據背景下教育領域的熱點研究總結為以下幾個方面。
學習分析和數據挖掘 教育數據挖掘是數據挖掘在教育領域的新型應用,主要目標為知識發現、決策支持和推薦等。學習分析是測量、搜集、分析和報告學生及其相關的學習環境的數據,用以理解和優化學習過程和學習環境[3]。
教育數據挖掘專注于技術層面,側重教育數據模型和模式的抽取,強調挖掘結果的自動化反饋;學習分析更注重研究有利于改善學習的干預措施。
2012年,美國教育部了報告《通過教育數據挖掘和學習分析促進教與學》[4],提出“數據驅動學校,分析變革教育”的大數據時代已經來臨,要綜合運用教育數據挖掘和學習分析,構建教育模型,探索教育變量,為教育教學提供有效支持。
在CNKI中以“學習分析”和“教育數據挖掘”為關鍵詞進行檢索,得到圖2所示的文獻數量趨勢圖。如圖2所示,2010年以前的文獻數量很少,但2010年之后開始呈指數式增長;2016年1―2月份刊登的相關主題期刊論文已有5篇,可以預計本年度,學習分析和數據挖掘仍將是大數據背景下教育領域的研究重點和熱點之一。
在線教育――興起與變革 以“在線教育”和“大數據”為關鍵詞進行搜索,得到圖3所示文獻數量趨勢圖。目前在線學習的發展趨勢主要有如下表現。
1)移動學習是大方向:隨著無線網絡的覆蓋,移動終端特別是手機用戶的增多,移動學習逐漸發展起來。
2)免費是大趨勢:目前在線學習存在各式各樣的免費現象,如免費試用、前期付費后期免費等形式。
3)細化管理是要求:任何一種在線學習方式,都離不開資源開發、管理和優化等工作,需要設定管理要求,細化規則。
4)實現互動是必然:交互功能是在線學習軟件必然要設計的功能,大多數在線學習使用者表示學習過程中希望能有更多的互動交流。
5)個性化學習是亮點:學習分析和教育數據挖掘的出現,使得在線學習存儲的大量數據能夠被更快速分析和使用,學習者可以隨時掌握學習狀況,開發商也可以掌握學習者的興趣點、學習特征等,為學習者推薦或制訂個性化的學習方案。
教育信息化 我國的教育信息化主要包含兩層含義:一是把提高信息素養納入教育目標,培養適應信息社會的人才;二是把信息技術手段有效應用于教育,注重教育信息資源的開發與利用。教育信息化的核心是教學信息化,要求在教育過程中較全面地運用現代信息技術,促進教育改革,適應信息化社會提出的新要求,深化教育改革,實施素質教育。隨著大數據時代的來臨,教育信息化也在不斷進步,未來的教育信息化將在教育云平臺上進行展現,現有的教育網、校園網將全面升級,實現互聯網、電信網、廣電網等跨平臺使用并支持移動設備。
在CNKI中以“教育信息化”和“大數據”為關鍵詞進行檢索,2013年共有3篇學術論文,2015年共有10篇,研究主題包括大數據時代的信息化教學、教師培訓、課程資源建設、教育輿情監控等。
教育決策 以“教育決策”為關鍵詞搜索到上千篇學術論文,以“教育決策”和“大數據”為關鍵詞,2013年以來共有8篇論文。大數據將在教育決策中發揮越來越重要的作用已成為共識,但如何利用大數據進行決策是目前面臨的難題,如何解決這個難題也是研究者重點關注的領域。教育決策離不開數據,大數據背景下的數據更加復雜、凌亂,呈現碎片化的特征,并且摻雜一些虛假數據,如何收集、選擇數據,是第一步需要做的事情。大數據對于教育決策的價值在于為教育服務,將數據轉化為支持決策的信息,需要數據分析者具備綜合、全面的數據分析素質和能力。大數據的核心是預測,隨著教育信息化和在線學習的持續發展,數據呈爆炸式增長,需要對數據進行整合、分析,發現新知識,為教育優化服務。
4 數據推動決策
傳統決策過程主要依靠決策者的經驗,主觀性較強,或多或少存在一些不足,難以充分發現教育過程中的潛在問題,無法真正有效地優化教學、提高學生表現。信息化推動了人類發展,逐漸成為人類生活必不可少的重要部分;信息化技術普及的同時,也產生前所未有的海量數據。大數據時代的來臨,顛覆了傳統數據分析方法;大數據背景
下,利用數據挖掘方法發現問題、支持決策具有多方面的意義。
1)優化教學、提高教育質量。教師若能充分利用學生學習數據,分析學生學習過程,可以更加快速、便捷、有效地了解學生,發現不足之處并及時反饋,提供改進意見等[5]。
2)為學校管理者制訂更加合理的教學計劃和方案提供決策支持。基于數據的教育決策能夠為管理者提供更加準確、合理的決策支持?;跀祿慕逃龥Q策能夠提供從數據到決策,實施決策后產生的數據再到決策的一種良性循環過程[6]。
3)幫助地區甚至是國家級決策者進行科學判斷。數據推動決策具有相當明顯的優勢,能為決策者提供全方位的視角。大數據分析得到的結果具有全面性、多視角性、參考性強等特點,能夠更好地為決策者提供決策支持。
5 結語
上文所分析出的教育領域熱點研究問題,都緊緊圍繞“數據推動決策”這一主題,學習分析和教育挖掘是分析方法和技術;在線教育是數據來源;教育信息化是信息化大數據環境;教育決策則是根據數據制定決策并運用于教育教學。可見,利用數據推動決策已成為教育領域在大數據背景下最為重要的研究問題之一。
參考文獻
[1]陳悅,陳超美,胡志剛.引文空間分析原理與應用:Cite Space實用指南[M].北京:科學出版社,2014.
[2]潘黎,王素.近十年來教育研究的熱點領域和前沿主題:基于八種教育學期刊2000-2009年刊載文獻關鍵詞共現知識圖譜的計量分析[J].教育研究,2011(2):47-53.
[3]Siemens G. Learning and Knowledge Analytics-Knewton-the future of education?[EB/OL].[2011-04-17].http:///?p=126.
[4]Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics[DB/OL].[2012-10-12].http://ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf.
關鍵詞:大數據時代 數字圖書館 機遇與挑戰
中圖分類號:G25 文獻標識碼:A 文章編號:1672-3791(2016)10(b)-0150-02
在科學技術的影響下,學術資源建設速度越來越快。例如:中國最大的學術資源建設商――中國知網,已經從期刊論文向國內外期刊論文發展,在圖書資源收藏方面收集了大量資源,可以給行業機構、學術等提供大量文獻。在此種發展形式下,數字圖書館承受了較大壓力,如何在未來發展中更好生存,已經成為人員研究的主要問題,必須及時對其進行分析。
1 國內外研究與啟示
1.1 國內外相關論述對我國的影響
隨著大數據時代的到來,人們對數據的需求量不斷增大。目前國外相關研究已經從理念、技術和數據等方面進行了很多研究。美國加州大學伯克利分校圖書館的Huwe在《構建數字D書館》一書中明確指出,大數據與數字化圖書館的發展方向吻合,可以借助數字圖書館進行信息采集和收集,進而挖掘用戶行為,幫助人們了解閱讀行為與信息的聯系。Borgman等人將嵌入式技術成功安裝于數字圖書館系統中,增加了數字圖書館功能,可以實現圖書分類、收集處理和關聯等各項操作,促進了數字圖書館與網絡技術的融合,發揮了大數據的作用。
國內研究人員曾建勛曾在《數字圖書館論壇》中明確指出,大數據時代將數據數字圖書館數據管理、收集等服務的深層次發展,對數字圖書館人員提出了較高要求。另外武漢大學生陳傳夫等也從理念、發展知識和財政投入機制等,分析了圖書館素質等問題,并提出了相關應對措施。
從上述研究均可看出大數據對數字圖書館帶來的發展機遇和挑戰,促進了數字圖書館和大數據的融合。為了促進高校圖書館和我國公共圖書館在大數據時代的發展,發揮數字圖書館在人們的生活或科學研究中的作用,必須深入思考,及時轉變觀念,提高數字圖書館的競爭力。
1.2 啟示與思考
從當前的發展狀況來看,學術資源建設商已經在大數據時代取得了很大進展,不僅包含網絡資源與期刊,還涉及各種文獻資源,可以查找作者、文獻關系與學者等關系,給數字圖書館的發展帶來了很大壓力。所以圖書館相關人員必須提高思想認識,將資源建設商帶來的威脅作為新的機遇。在實際工作中,必須積極吸取圖書館建設資源,擴展圖書館資源范疇,進行各種資源的有機結合,同時還要充分發揮資源價值,促使各種資源的整合,深入挖掘數據規律,認真分析數據規律,發現數據潛在價值。從服務角度上分析,圖書館還要向眾多資源建設商學習,從用戶角度探索問題,給用戶提供人性化服務,滿足用戶對資源的需求。
經過分析發現,大數據時代,必須要改變傳統的思維模式,形成適合數字圖書館發展的模式,適應大數據時代的發展,充分利用大數據促進數字圖書館的發展,讓數字圖書館在人們的生活、學習和工作中發揮更大作用。
2 淺析數字圖書館的大數據思維
數字圖書館的大數據思維主要表示從大數據角度思考并分析數字圖書館發展中存在的問題,實現數字圖書館和大數據時代的有機融合,增加數字圖書館產品種類,提高數字圖書館服務水平。
2.1 建設數字圖書館資源
第一,擴大數字圖書館資源范圍。資源是數字圖書館發展的基礎,也是提高數字圖書館服務質量的主要方法。在長期發展中,圖書館非常重視資源建設,主要是圖書、期刊及學位論文等資源。為了在大數據時代下發展,必須創新思維,引入一些數據庫資源或一些社會熱點信息等內容,以用戶的搜索習慣作為數字圖書采集參考,深入挖掘各種數據之間的聯系,實現可再生資源的生產、收集和儲存,擴大數字圖書資源范圍。第二,提高數字圖書館資源整合度。大數據時代的主要特點是數據類型較復雜,單純的文本信息已經不能被大數據時展用戶吸取,可以實現資源整合向綜合信息服務轉變。為了滿足不同用戶的需求,還可以實現文獻和政府等信息的整合,擴大社會資源和數字圖書館的聯系,將公眾最關注的問題引入到社會資源整合中。第三,加強數字圖書館資源加工深度。在大數據時代,雖然數字圖書館結構信息具有較強的表現形式,但主要體現在資源庫內部。在大數據時代下,必須及時擴展數字資源和外界的聯系,構建全社會數字圖書館資源架構。同時進行圖書館資源深度加工時,必須從知識結構向知識建構加工方向發展。例如:從圖書館文獻資源中分析知識結構,利用知識單位和文獻建立知識建構,形成新知識。
2.2 靈活應用數字圖書館技術
大數據時代,數字圖書館技術已經開始從處理局部數據向更廣的區域發展。從圖書館技術體系分析主要進行信息處理、組織架構、分析預測、服務技術等操作。
第一,應用語義技術。大數據環境中可以采用語義實現復雜數據的聯系。當前數字圖書面臨的主要問題是將語義加入數字文獻信息中。所以必須將本體技術、人工智能等先進技術應用到實際工作中,讓數據間形成語義關系,促進收錄資源和知識挖掘等各項操作。目前語義技術已經廣泛應用到圖書領域中,如:漢語主題詞表、圖書分類法等均是依靠語義發展起來的。知識相互間的語義關系,不僅可以幫助用戶及時獲取知識,還可以獲得有用知識途徑。第二, 數據聚類技術。數據聚類是實現信息相互聚集的過程。在繁雜的數據中,只有靈活應用聚類技術,才能發揮信息服務、處理等各種功能。在大數據背景下,利用數據聚類可將不同數據劃分成相互聯系、主體相近的小數據,給用戶信息檢索、選擇和分析提供很大方便,給用戶個性化服務提供了數據支持。第三,信息分析技術。大數據時代可以充分利用信息分析技術??梢詫⒋髷祿夹g融入到書籍圖書館中,拓展了數據分析工作,給用戶提供了高端服務。例如:聯機分析技術可給在線用戶提供數據支持;定量定性分析技術可以在數字圖書館中得到充分應用。
2.3 數字圖書館的定位
第一,打破傳統資源框架束縛。大數據給圖書館提供了較廣闊的發展空間,滿足了用戶對不同信息的需求,在信息采集、收集和服務等方面均發生了變化。數字圖書館進行定位時,必須打破傳統資源框架,將數據理念融于到數字圖書館建設中,所以不僅要采用傳統的方法進行信息采集,還要進行網絡信息自動獲取,構建語義關系、數據聯系等信息組織框架。
第二,建立全方位服務信息。傳統圖書館主要進行文獻服務。數字化圖書館服務資源發生了變化,服務形式開始從被動化向主動化發展。一方面向全社會提供服務;另一方面,提供全新資源服務;最后不斷擴展服務與傳播方式,全面擴展數字圖書館服務。
第三,定位數字圖書館員。大數據時代對圖書館員提出了更高要求,每館員都要有敏銳的數據分析能力;及時了解學術變化;掌握大數據分析技術;熟練使用各種數據分析工具和軟件,準確定位網絡資源,促進數字圖書館的發展。
3 結語
大數據時代給數字圖書館帶來了挑戰,是數字圖書館的一種巨大轉型,可以擴展數字圖書館數據資源,提高數字圖書館服務功能;同時,還要不斷思考資源框架、技術應用模式和服務功能,與廣大學術資源建設商共同發展。
參考文獻
Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.
Keywords big data;open data;library service;knowledge discovery;information organization
大數據帶來的信息風暴正在變革人類的生活、工作和思維[1]。在大數據時代,滲透到各個行業、領域的數據成為了推動社會發展的要素之一,因此有人稱大數據時代的數據就是“金礦”。但這種“金礦”的價值挖掘與實現需要借助相應的技術與平臺,也需要人類智慧的參與,于是,對大數據資源的高效利用成為了相關業界如IT、企業、科研等普遍關注的問題。以信息組織、信息利用為所長的圖書館,也感受到了大數據時代所帶來的變化,在近年來也展開了大量的圖書館視野下的相關理論研究。
大數據帶給圖書館的影響與變化主要是數據的變化,即圖書館從面對傳統的有序、單一、少量的結構化數據如數據庫數據向無序、多元、海量的非結構化數據、半結構化數據方向轉移。其中,作為大數據組成部分、集合了理念與實踐的開放數據(Open Data)也受到了關注與研究。本文在概述大數據與開放數據的基礎上,對開放數據視角下的圖書館角色進行了審視與分析,最后對大數據時代開放數據環境下的圖書館創新服務如數據監管、知識發現等服務進行了列舉和概述。
1 大數據與開放數據概述
1.1 大數據
目前,業界對大數據還沒有一個明確的定義,但也一般都認為大數據是不可能用常規軟件和分析工具進行分析的巨大數據集[2]。此外,大數據既有結構化數據,也有非結構化數據和半結構化數據,涵蓋了文本、數字、圖像、視頻等多種類型,并可跨越多個數據平臺,如社交媒體網絡、網絡日志文件、傳感器、智能手機的定位數據、數字化文檔及歸檔的照片和視頻等[3]。
1.2 開放數據
互聯網與開放獲?。∣pen Access,OA)運動的發展,既使得人們的信息交流更加便捷與方便,也讓對開源和開放知識、數據、資源的利用逐漸成為人們獲取信息的主要組成部分。由此而產生的自由開放思維也成了人們信息獲取的主要思維,總是期待著出現解決不局限于軟件、開放格式和數據自由公開與再使用的開放信息,于是一種實現了更廣范圍的公開與再使用數據即開放數據便應運而生。
對開放數據的定義存在爭論,不同的組織、機構也存在不同的理解視角,但對于開放數據的內涵即其是一種理念及實踐、數據不受版權與專利等機制限制、可以被任何人自由獲取還是都能接受與認可。有學者也曾對開放數據的內涵闡釋為:按照用戶特定的需求和一定的互聯網協議、規則、框架,對Web數據進行存儲和組織的活動,而利用的數據來自不同的數據源或是不同的數據類型,最終目標是實現信息在網絡空間的開放、共享與重用,以尋求信息數據最大可能的無限獲取與重用[4]。
開放數據與一般的數據相比,其最大的特征就是數據集增值方式,即對象數據包含了所有的事實、數據、信息乃至智慧和知識,也不如其它傳統數據可以直接獲取、利用和分析,依賴于見證者而存在,不是我們接受或不接受的數據或其它,是我們給予、分享和接受的記憶[5]。同時,開放數據還具有開放性增值方式,因而在用戶多、普及率高的政府網站及公共信息服務、商業應用等領域應用廣泛,目前,英、美、澳等政府和淘寶等商業組織都應用開放數據進行信息公開等服務,以增強與公眾、用戶之間的交流與互信。
2 基于開放數據視角的圖書館角色審視與定位
在開放數據的具體實踐如開放存取運動、開放研究出版、科學家電子實驗筆記開放及科學知識的出版與交流等形式中,圖書館都是各個實踐形式的主要參與者與推行者,但由于開放數據運動目前在各國的實踐主體主要是政府,并且世界主要發達國家如美國、英國、法國等也均承諾政府將把公眾的需求放在重要位置,通過征求公眾意見逐步開放有價值的數據集,體現了政府在開放數據運動中的絕對推動者、踐行者地位。在這種環境下,圖書館必須準確定位自己的角色,發揮自身優勢為開放數據的發展提供服務,如基于開放數據的館藏目錄、開放獲取等。
Hope Leman認為在開放數據運動中,圖書館員是知識工具箱與支持專家,即實現對概念的知識注釋、實驗及相關技術研發的知識支持[6]。我國學者劉春麗、徐躍權則認為在開放數據環境中,圖書館可能扮演與研究周期各個階段的科學產出匹配的知識服務中心和開放數據的管理和保存中心兩大角色[7]。
(1)知識服務中心。隨著科學研究的周期不同,圖書館在科研過程中所發揮的作用和提供的服務也隨之不同,如在科學研究的概念階段,圖書館可為進行科學理念、研究計劃討論的用戶提供開放書目等服務,并將討論結果等形成新的知識分享數據;在數據分析與出版階段,圖書館可借助于在開放存取期刊發表、提交到機構知識庫中等途徑將科學研究的結論、實驗數據、科研過程等進行開放獲取與共享交流;在同行評審階段,圖書館可以發揮科研情報中心的作用,基于學術社交網絡及開放存取平臺,分析科學研究論文與數據的使用與評價活動,提取基于使用與評價的選擇性計量指標(Altmetrics),對科學論文和科學數據的科學價值進行評價,進而評估論文與作者在某一個研究領域的學術影響力[7]。
(2)開放數據的管理與保存中心。歐洲研究圖書館協會主席Paul Ayris博士認為在科學研究的開放工作流中,要增加專業圖書館的可見度,要重視科學數據的再利用及科學數據保存的可持續性[8]。筆者以為在以數據密集型為科學研究特征的第四代科研范式下,數據特別是產生于實驗、記錄了科研過程等重要信息的科學數據是科學研究所重視和再利用的數據對象,圖書館有責任與義務扮演開放數據管理與中心的角色,以為科學家等用戶群體提供開放數據的檢索、分析、保存等服務?;陂_放數據的連續利用視角,圖書館還需進行諸如開放數據的關聯與、標示與引用等服務。
3 大數據時代的圖書館開放數據服務
大數據帶給社會以數據驅動的社會創新與發展動力,因此如美國總統科學技術顧問委員會給總統和國會的報告所說“聯邦政府的每一個機構和部門,都要制定一個應對大數據的戰略”[9]一樣,包括政府在內的社會各個機構如美國政府、歐盟等都制定了應對大數據的戰略對策。2010年11月,歐盟通信委員會向歐洲議會提交了“開放數據: 創新、增長和透明治理的引擎”報告[10],首次將開放數據與大數據關聯到了一起,并以開放數據為核心,對大數據時代的挑戰進行了戰略部署。但將大數據概念應用到開放數據上,則首先意味著數據的規模和類型有了變化,產生于社交媒體、智能終端、傳感器上的海量非結構化數據、半結構化數據都是開放數據的范疇;其次,意味著數據的應用發生了變化,即數據不再是單一領域的數據,而是覆蓋了用戶的所有需求領域,并可直接獲取和應用。
大數據賦予開放數據的新要求也意味著大數據時代的圖書館開放數據服務將被賦予新的要求,筆者認為,大數據時代的圖書館開放數據服務,主要有:
(1)多領域數據源的整合與開放服務。從目前的開放數據運動發展來看,主要實踐有開放政府數據、開放存取學術期刊與機構知識庫,距大數據時代所要求的多類型、多領域發展程度要求尚遠。圖書館由于有著涵蓋了所有領域的豐富館藏資源,是大數據時代數據開放與整合的最佳實踐者。因此,圖書館可整合多方資源,如科技、人文、氣象、政務等諸多領域的報告、實驗數據等資源,進行數據的整合與開放,讓公眾通過圖書館的一站式檢索服務平臺來獲取所需的數據。
(2)基于知識聯盟的數據開放與共享服務。由于大數據時代的開放數據是整合了不同系統、政府和部門之間的數據集,這就需要建立一個數據共享和互操作的框架,如新澤西州運輸部利用采集到的數據(在汽車制造商的管轄下)能夠發現諸如擁堵和交通流等問題,而這些功能通常是由當地或全國的政府交通運輸部門負責[11]。圖書館可借鑒這些成功的案例進行構建或參與到由政府、企業、社會機構組成的知識聯盟,利用協作分析技術對數據和系統進行無縫隙整合。
(3)基于一站式服務平臺的知識發現服務。數據“開放”的核心是為了用戶更高效的發現和利用,以縮小信息所有者和用戶的信息不對稱距離。EDS、PRIMO、SUMMON等一站式知識發現平臺的應用為圖書館的開放數據知識發現服務提供了方便,圖書館可應用這些平臺對用戶提供知識咨詢等服務。
(4)數據的開發、創建、共享與轉換服務。此類服務在圖書館界已有著成功的實踐,如開源站點biblios.net采用了類似維基模式向圖書館界提供開放MARC數據的開發、創建、共享、轉換服務,目前以3000萬余條數據成為為全球最大的免費圖書館編目數據平臺[12],德國國家圖書館[13]、大英圖書館[14]也宣布對外提供開放數據服務。
(5)數據監管服務。開放數據的檢索、價值挖掘與應用實現,必須經過一定的排列、存檔與管理過程,而這些數據有可能是來自于有數據組織經驗和能力的政府、企業、公益組織等,也可能是來自于只提供數據而沒有數據組織或沒有組織意愿的公眾、機構。圖書館可發揮自身的信息組織、信息分類特長,對這些數據進行修改、合并、標引、分析與索引,即提供數據監管服務,使數據集合之后獲取最大收益。
關鍵詞:大數據; 湖南?。痪G色大數據港灣;戰略對策
0 引言
隨著信息技術網絡化、泛在化、智能化的發展,人機物三元世界開始深度融合。大數據將有力支撐教育、文化、健康、電子商務、制造等產業以及在線服務、社會管理等行業,解決未來信息社會結構下生產力發展的重大瓶頸問題;有助于解決交通出行、醫療衛生、應急搶險、人口教育等各類社會發展問題,大幅提升民生領域的智能化程度和服務水平。如果能有效地篩選和使用大數據,將有效為地方經濟、科學研究、社會治理等方面積極服務。因此加快大數據開發利用,一方面有利于促進產業轉型,提升社會活力、促進經濟增長和提高生產效率,另一方面也有利于攻破體制機制障礙,推進依法行政和促進政府職能轉變,提升國家綜合實力,保障社會安全。
1 構筑湖南省大數據港灣的戰略目標
開展若干面向重點區域與行業的大數據示范應用,建設科學研究、電子政務、智能制造、公共安全、醫療衛生、文化教育、互聯網服務、城市管理、社會公共服務等領域的大數據應用,為湖南省經濟社會發展提供大數據科技支撐保障,加快湖南省大數據分析應用的產業化布局,服務湖南省經濟社會建設,促進經濟結構調整和產業轉型。促進行業融合發展、推動產業轉型升級、助力智慧城市建設。
2 構筑湖南省大數據港灣的戰略措施
通過對大數據發展趨勢的研究,預測大數據對經濟、政府與社會運行所帶來的影響,制定五年或十年的發展規劃,協同政府各部門、各行業主管單位、企事業單位及個人各方面力量出謀劃策、發揮聚合效用,促進可持續共同發展。其戰略重點主要集中在以下幾個方面:
2.1 突破大數據的關鍵技術
建設開放共享的大數據分析平臺,發展大數據條件下的類人視覺和類人思維決策計算模型,突破類人視覺技術,研究基于深度神經網絡的圖像視頻中目標檢測、跟蹤、分類以及行為和事件識別,研制類人視覺傳感器,構建類人智能計算和理解的核心系統,為相關產業提供實時智能服務。突破互聯網、物聯網和廣電網視覺大數據中視覺場景理解、多目標檢測跟蹤、人員身份識別、視頻信息檢索、大范圍安全監控等關鍵技術,面向公共安全等重大需求提供透明時空示范應用。
2.2 加快大數據基礎設施建設
當前,大數據相關的基礎軟硬件設施、分析方法、領域應用及數據生產等方面已經形成了一批企業和技術系統,大數據產業生態系統的雛形已經明確。大數據產業生態系統涵蓋了大數據的獲取、存儲、處理、分析、服務、安全等諸多環節,并逐步與傳統產業結合釋放出巨大的生命力。重點推進信息產業園、軟件園等園區開展大數據基地建設,加快建成湖南數據中心,支持建O金融機構和企業數據中心及嘗試縣級大數據應用服務園區。吸引國內外知名大數據龍頭企業,創新研發平臺,突破大數據關鍵技術,培育新興業態領域。
2.3 重視大數據人才培養
為培養我省大數據技術研發、服務咨詢、市場推廣等應用型人才,應加大鼓勵高校與行業企業、科研院所深度合作,支持大數據企業與高校建立生產性實訓教學基地,建立院士工作站和博士后工作站,協同創新我省與大數據知名專家學者長效科技人才培養機制,為我省大數據產業發展提供人才支撐與智力支持。
2.4 啟動大數據產業試點
面向國計民生重大需求,重點選取教育、健康、公共安全、醫療衛生、金融證券、智能制造、智能交通等具有大數據基礎的領域,集成大數據基礎理論、類腦智能、視覺語音文本大數據分析、多源異構數據融合的研究成果,探索大數據分析應用的創新服務模式,在特定領域發展多源感知網絡(物聯網、互聯網、電信網、廣電網)大數據智能分析的綜合集成系統,建設具有示范引領意義的大數據應用。
2.5 完善大數據立法
在地方立法的權限范圍內,在信息采集、數據處理、敏感數據保護、數據交換標準和規則、個人隱私等方面設立大數據地方性法規和政府規章,確保大數據相關信息安全。加強建立大數據信息安全集中保障體系,開展基于大數據背景下信息安全認證體系建設,針對數據的收集、清先、存儲和運用等環節明確數據安全與保護的規則;明確劃分大數據生態中各不同主體的責任。同時鼓勵和支持企業在電子認證、安全測評、數據加強應急防范、容災備份等數據安全技術方面提供服務。
3 構筑湖南省新型綠色大數據港灣的應注意的問題
大數據為管理者創造了新的機遇和挑戰,在應用大數據推進我省建設的同時,需要特別注意潛在的問題,加強應對策略的研究。
3.1 重視數據的質量
在利用大數據解決具體事務時,要客觀地認識大數據。數據本身有時也是存在缺陷的。有些數據收集時本身就是不正確的,有些數據之間還存在沖突、不一致等現象,因此,在運用這些數據時,“數據噪聲”則此產生,不同程度影響分析和決斷。公共部門或企業管理層在利用這些大數據進行分析時,需要對其收集的數據進行清洗、檢查、篩選,從而保障其運用的數據的質量。
3.2 防止對數據過分依賴
科學預測與決策的有力武器是數據,通過數據分析,從而為實現管理的智能化、增強管理能力及提高管理水平出謀劃策。但是,也應該看到數據不是完全可靠的,過度依賴數據,一方面,會讓我們做很多沒有價值的數據分析;另一方面,也會限制本來應有的靈感和創意。只有讓讓數據真正嵌入到設計與決策中,讓直覺創造的心智能力,情感理解的社交能力,與大數據相結合,切實解決用戶的實際問題,真正做到“用戶洞察”,讓產品或措施體現用戶需求,服務用戶,超出用戶的預期想象。
3.3 加強信息安全機制建設
新技術新業務帶來大數據日見漸長的網絡安全問題,建議與實體經濟安全相結合,進行統籌處理,同時建立關鍵信息安全管理制度,對互聯網平臺的職責劃分予以明確。制定數據安全風險評估機制,不僅關注數據本身,而且關注到數據資源整體的安全性,對特定類型的主體從事相關數據分析設定一定的條件。通過政府提供適當的政策和務支持,創設輕松環境,加強相關的法律法規建設,保護數據透明開放同時保障信息安全。
4 構筑湖南省大數據港灣的預期價值:
隨著商業企業,政府公共事業應用的大量數據,新產業數據大量涌現,湖南新增經濟增長空間,大數據形成新的產業鏈。圍繞上游與下游,必將推動智能終端的應用,促進云計算等行業快速發展。
大數據能有效減少社會經營成本,提高經濟與社會效率。例如在醫衛行業,可以通過大數據的分析避免重復治療、過度治療及減少錯誤治療,提高工作效率,提升治療質量。公共管理領域,利用大數據提高教育部門、就業部門的服務效率,有效推動稅收工作開展,零售業領域,利用大數據改善和提高整體供應鏈和業務流程的效率,提高其經營利潤60%以上。
大數據改變了傳統的商業模式,帶來了準確的營銷。有效提升企業數據資源利用率,提高從數據到信息的轉換率,使業務決策更加準確,提高整體運營效率。
大數據推動政府政務公開,提高公共決策的預見性和準確性。例如通過對社交網絡和手機短信中的信息進行分析,從而對失業率、疾病暴發等進行趨勢預測分析。利用大數據實現政府行政管理方面的運作效率提高,節省開支。
大數據有助于破解社會轉型中的難題。中國經濟已進入轉型期,社會進入矛盾凸顯期,改革進入攻堅期。宏觀經濟形勢錯綜復雜、各種社會改革盤根錯節、頻發等突出問題,僅僅依靠現有的管理手段與方法已明顯落后。有效地組織和使用大數據,將對社會經濟、科學研究、社會治理等產生巨大的推動作用。
5 結語
關鍵詞:大數據媒體;廣告營銷
2012年以來,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。數據正在迅速膨脹并變大,它決定著企業的未來發展,雖然很多企業可能并沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多地意識到數據對企業的重要性。哈佛大學社會學教授加里?金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。作為傳統媒體的廣告來說,在大數據時代將會面臨更為嚴峻的挑戰和考驗,同時也出現新的發展和機遇,廣告媒體需要抓住歷史性的機遇實現創新和發展。
廣告營銷是指企業通過廣告對產品展開宣傳推廣,促成消費者的直接購買,擴大產品的銷售,提高企業的知名度、美譽度和影響力的活動。隨著經濟全球化和市場經濟的迅速發展,在企業營銷戰略中廣告營銷活動發揮著越來越重要的作用,是企業營銷組合中的一個重要組成部分。大數據時代的廣告營銷在數據分析上的基礎上明確了廣告信息受眾。趣味廣告,互動廣告和個性化廣告是廣告營銷的發展趨勢。
1.數據分析與廣告信息受眾
大數據時代廣告信息傳播目的性更強,信息受眾經過一系列數據挖掘與數據分析將更為準確。傳播媒體在大數據時代的作用將更為突出。傳媒作為溝通人類的橋梁,在移動化,社交化、智能化的今天已經成為人們生活中必不可少的“陪伴”人們通過媒介使用在持續產生著海量數據,這些數據將成為大數據時代的重要資源,同時傳媒也是溝通各種類型商家與用戶的紐帶,在數據分析的基礎上能夠通過傳媒使商家與用戶建立起深入、持續、穩定的互動關系。
大數據時代的數據分析使得市場細分和目標市場選擇變得可視化。商家和媒體通過各種渠道收集和整理用戶數據,并根據聚類分析劃分不同類型的信息受眾,使得市場細分和目標市場的選擇更加客觀,廣告的設計和投放能夠直接面對有相關需求的客戶。這種客觀性和直接性不僅表現在對廣告內容的把握,更體現在對廣告投放渠道的選擇。
廣告營銷最重要的是效果,讓不同地域的受眾看到不同產品的廣告,利用獨有的區域定向模式技術,將網民以地域 (精準到地級市) 為單位加以區分,打破了以往互聯網傳播只可泛不可精的區域傳播壁壘。大數據時代的市場細分將用戶的信息行為,包括瀏覽路徑,瀏覽內容,停留時間,最終選擇等,轉化為可用數據,并進行數據清洗與數據篩選,最后進行聚類,將屬性相同的用戶集中到一起,根據其特點選擇廣告投放內容和途徑。并深入分析各節點之間的關系,找出其中規律,有目的地進行廣告,從而避免了廣告投放的盲目性,實現“不同人看不同廣告”的效果。
2.趣味廣告
通過對營銷以及傳媒發展歷史的梳理可以發現,很多經典的成功案例都與“趣味”這一因素密不可分,“笑聲”已經成為廣告制勝的重要法寶,許多廣告因為幽默、生動、有趣而受到廣大觀眾的歡迎。觀眾的好感度直接影響著消費者對廣告產品的接受程度。好感度越高的產品和品牌更能得到消費者則的青睞。如此看來,廣告的“趣味”性是決定廣告是否成功的重要因素。
創意廣告出現的形式有很多種,其中主要有搞笑型、公益型、驚奇型、諷刺型、雷人型、夸張型、無聊型等多種形式,最主要的是要有創意,想象力。因網絡文化的發展創意廣告也隨之高登,受萬眾的歡迎。創意廣告具有滲透性、流傳性。能憑借吸引人的創意在網絡上迅速自發以葡萄藤形式推廣流傳。并讓廣告元素深入移植。主要以視頻的形式表現出來。趣味廣告要緊跟時代潮流或選擇有吸引性的主題。在廣告風格和廣告臺詞的設計上可以選擇網絡流行風向中的語言和表達。比如愛奇異視頻中的奇葩說欄目,將廣告宣傳內容和節目選手結合起來,既幽默風趣,又體現產品的風格特點,牢牢地吸引了觀眾。很多廣告選擇電影中的經典橋段進行設計,比如《大話西游》中的“如果上天能夠再給我一次機會,我希望是一萬年”臺詞的應用,益達廣告中經典老歌“如果沒有你”的應用。
3.互動廣告
廣義的互動廣告是指所有互動形式的廣告,包括傳統媒體中的互動形式的廣告。西奧多?萊維特在其營銷哲學理論中提到“成功的營銷像是一場成功的婚姻,會不可避免地變成一種長久的關系,而買賣之間的相互交往界面也就變成可相互依存”。相互交往成為決定現代傳播成功與否的重要因素。Web2.0,web3.0技術的成熟發展為互動廣告提供了技術保證。微博,微信的廣泛使用為互動廣告提供經驗?;ヂ摼W電子商務白熱化發展和小米粉絲營銷取得成功為互動廣告指明方向。大數據時代互動已經成為現代傳媒業的一個重要特征。
由于PC、手機、平板電腦的終端特性,以及由此而產生的用戶與視頻之間的交互行為,讓視頻廣告產生了無限的互動可能,如圖所示:
圖1.互動廣告作品示意圖
4.個性化廣告
在大數據時代,個性化將顛覆一切傳統商業模式,成為未來商業發展的終極方向和新驅動力。大數據為個性化商業應用提供了充足的養分和持續發展的沃土,基于交叉融合后的可流轉性數據,全息可見的消費者個體行為與偏好數據等等,未來的商業可以通過研究分析這些數據,精準挖掘每一位消費者不同的興趣與愛好,從而為他們提供專屬的個性化產品和服務。大數據改變了商業模式,未來市場是一個性化消費者為中心的,“未來廣告的核心變化方向,是從現在每個人看同樣內容的廣告,演化為每個人看不同內容的廣告”所以營銷活動也要依托消費者這一中心展開創意的策劃和實施。
我們都知道以往的廣告模式是一對多的,廣告商不知道自己的廣告方式和手段是否滿足用戶的需求,但是隨著媒體掌握越來越多的用戶數據,能夠方便地讓企業通過技術分析出關注企業的用戶具體屬性和用戶行為的畫像。通過這些洞察分析出來的這些用戶畫像,能夠讓企業對每類用戶進行有針對性的廣告服務。企業做廣告不僅是要針對新用戶,更重要的一點是對老用戶的激活。但是怎樣激活老用戶,以及和用戶更好地進行有效溝通,幾乎是廣告行業都撓頭的問題。但是運用大數據技術可以讓企業對 用戶生命周期進行管理和挖掘,讓企業對不同生命周期的用戶進行標簽化管理,讓企業及時把把相關運營信息推送給不同生命周期的用戶。
小結
大數據時代對于廣告營銷來說即使機遇,又是挑戰。廣告營銷要時刻注意時代和技術的發展和變遷才能在數據化的浪潮中處于不敗之地。趣味廣告、互動廣告、創意廣告是廣告營銷為適應時代的發展而產生的不同的緊跟時代的營銷形式,是發展的起點而不是中點。因此隨著人類邁向數據化的腳步越走越快,廣告也需要有更新更有效的營銷方式,而這將成為以后學者研究的重點。
參考文獻:
[1]歌曉.大數據 落地“三道坎”與信息安全[J].上海信息化.
[2]吳娜娜,任紅丹,張璨 .以多芬為例淺析廣告營銷[J].產業與科技論壇,2009(08):6-7.
[3]劉峰.大數據時代的電視媒體營銷研究[J].華東師范大學博士論文,2014.