時間:2022-04-15 05:50:38
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇企業數據分析報告范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
關鍵詞:財務分析;大數據;教學改革
作者簡介:王暉(1973-),女,黑龍江雞西人,北京信息科技大學經濟管理學院,講師;段文軍(1969-),女,山東蓬萊人,北京信息科技大學經濟管理學院,副教授。(北京 100192)
基金項目:本文系北京信息科技大學教學提高-專業建設項目(項目編號:5028023501)的研究成果。
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2013)25-0111-02
當今時代不斷涌現各種新型信息方式,例如博客、社交網絡等;不斷興起各種新技術,例如云計算、物聯網等。數據的產生不受任何的限制,數據以前所未有的速度不斷增長和累積,大數據時代已經來到。[1]《華爾街日報》認為大數據時代是引領未來繁榮的三大技術變革之一。麥肯錫公司在一份報告中提出數據是一種生產資料。企業每天面對海量的財務數據,如超市的銷售記錄、銀行的交易記錄、淘寶網站數千萬筆交易記錄(產生量超過50TB,存儲量40PB①)。企業如能利用這些巨大的數據集挖掘出有價值的信息,那么企業就能掌控下一個創新、競爭和生產力提高的關鍵。大數據時代,尤其是財務大數據時代,呼喚創新型人才。[2]呼喚具備綜合財務分析能力的人才,利用財務大數據為企業創造財富。
如何培養財務分析人才?在財經類高校本科,一般都開設“財務分析”課程,該課程教學目的是培養學生對真實企業進行綜合財務分析,并能獨立撰寫財務分析報告的能力。[3]本文以北京信息科技大學(以下簡稱“我校”)為例,探討大數據時代下財務分析人才的需求特點,對高?!柏攧辗治觥闭n程設置的影響,并提出改進“財務分析”課程教學的建議。
一、大數據時代下財務分析人才需求特點
相較于其他類型數據,財務數據更大、更復雜,蘊藏著更多寶貴信息。麥肯錫公司2011年報告推測,利用大數據分析,零售商可增加運營利潤60%,制造業設備裝配成本會減少50%。[2]在財務大數據環境下,如何整理與統計這些雜亂無章的數據?如何讓財務數據開口說話為企業管理者經營決策提供科學依據?朱東華(2013)認為,大數據時代下,傳統的數據分析方法已經不再適應當前的數據環境,同時,各種企業對數據的依賴與日俱增,甚至定量分析方法將逐步取代定性分析方法。[4]財務大數據和大量的財務數據分析需求助長了企業對統計和數學背景的人才需求。
可見,大數據時代下財務分析人才應該具備扎實的統計學和數學功底,能夠熟練運用定量分析方法分析數據以獲取信息,撰寫分析報告為企業相關利益人決策提供依據。
二、“財務分析”課程教學現狀
張先治(2007)認為,財務分析是財務分析主體為實現財務分析目標,以財務信息及其他相關信息為基礎,運用財務分析技術,對分析對象的財務活動的可靠性和有效性進行分析,為經營決策、管理控制及監督管理提供依據的一門具有獨立性、邊緣性、綜合性的經濟應用學科。[5]財務分析課程是為我校經濟管理學院財務管理專業本科三年級開設的一門專業必修課。學生前期已經學過數學、經濟學、會計學、財務管理、統計學等課程。財務分析課程正是在學生掌握前期所學各門課程的基礎上,培養學生綜合運用所學專業知識,分析判斷企業的財務狀況,并根據數據分析結果找出企業存在的問題,提出解決方案。[6]為了更好地實現“財務分析”課程教學目的,課程組的老師們經過討論,決定修改2008級財務管理專業教學計劃,將原來課堂教學的方式改為1/2的學時用于課堂教授基本理論,1/2學時用于實踐教學。筆者自2011年開始,按照新的教學計劃給三屆學生講授了“財務分析”課程。
1.理論教學部分
教材選用東北財經大學出版社出版,張先治和陳友邦主編的《財務分析》(第五版)。該教材體系完整,內容豐富,全書以一家虛擬的ZTE公司為例,演示財務報告分析、財務效率分析和財務綜合分析。每章設有案例和復習思考題,該書還有配套的習題集。在課堂教學中,以教材為主線,突出介紹各種財務分析方法的使用,以及根據分析結果得出結論,提出解決方案。
2.實踐教學部分
一人一企,邊學邊分析。每位學生選擇一家上市公司作為分析對象,利用學校購買的金融數據庫以及相應網絡資源,結合所學財務分析理論知識進行上機實驗,在Excel內完成數據分析,并將分析結果形成財務分析報告。學生分析判斷和決策能力在實戰中得以鍛煉,教學效果得到改善。
但是,隨著大數據時代的來臨,外部環境對數據分析能力要求的提升,僅僅學會利用Excel進行水平分析、垂直分析、趨勢分析、比率分析和因素分析,已經遠遠不能滿足市場對財務分析人才的需求,學生就業的競爭力無從談起。結合前面大數據時代下財務分析人才需求特點,我校學生財務分析能力的培養存在著以下問題:
1.學生數據收集、整理和分析能力弱
定量分析方法應用的基礎是數據,財務分析人員必須學會從海量的網絡資源中搜集并篩選與自己的分析對象和分析目的相關性較強的資料信息,[7]這些資料信息可能是結構化數據,例如金融數據庫等;也可能是非結構化數據,例如網頁等。從實踐教學環節反映出學生數據收集和整理能力弱,分析其原因主要是:
(1)學生不熟悉對財務分析有幫助的網絡資源。搜集有價值的數據需要一定的技巧,其中最為重要的是熟悉一些重要的網站,知道相應的數據應該在哪里找到的概率比較大,做到有的放矢。
(2)學生無法將非結構數據快速地轉換成所需的數據形式。類似金融數據庫這樣的結構數據,學生基本能夠篩選出所需信息。但是,對于類似網頁這樣的非結構數據,他們就只能運用最原始的復制粘貼的方法提煉數據信息,耗時且耗力。2013年2月1日,人保財險執行副總裁王和在中國第七屆“保險業管理信息化高峰論壇”上指出,在過去的兩三年里,結構和非結構數據發生了本質性的逆轉。過去就整個社會來講,絕大多數的數據是結構數據,而現在非結構數據正呈快速增長的趨勢,現在以及未來,非結構數據將占到95%,甚至更多。
“財務分析”課程講授的基本方法主要是比率分析和因素分析法等。目前,無論是學術界還是業界,研究人員大量使用統計模型進行財務數據分析,例如聚類分析、多元回歸、因子分析、時間序列預測法等。因而,我校學生數據分析能力急需加強,尤其是統計學和數學的基礎要扎實。
2.學生財務分析報告撰寫水平有待提高
財務分析的結果是以財務分析報告的形式展示給企業利益相關人,為其進行財務預測、財務決策、財務控制和財務評價等提供可靠信息。財務分析報告是對企業經營狀況、資金運作的綜合概括和高度反映。李寶智(2012)認為,報告應具備八要素:準確、完整、可比、用戶導向、相關、問題的解決方案、及時和易用。[8]從我校學生提交的財務分析報告看,與上述要求還有很大差距。
三、“財務分析”課程教學改革建議
1.培訓網絡資源使用
重點介紹幾個數據庫的使用:
(1)金融數據庫。我校購買了兩款金融數據庫,北京聚源銳思數據科技有限公司金融數據庫(http://)和深圳市國泰安信息技術有限公司CSMAR財經系列研究數據庫(http://)。登陸金融數據庫后,輸入查詢條件即可下載上市公司財務數據,速度快且數據量大,數據格式可以任意選擇。
(2)中國資訊行(國際)有限公司高校財經數據庫(http://),INFOBANK于1995年在香港成立,是一家專門收集、處理及傳播中國商業、經濟信息的香港高科技企業,信息范圍涵蓋19個領域、197個行業。
(3)國務院發展研究中心信息網(國研網)(http://.cn)。國研網已建成了內容豐富、檢索便捷、功能齊全的大型經濟信息數據庫集群,包括:六十幾個文獻類數據庫、四十多個統計類數據庫等。
網站資源:中國證券監督管理委員會(http://)、上海證券交易所(http://.cn)、深圳證券交易所網站(http://)、巨潮資訊網(http://.cn)和相關協會網站等。
2.培養數據預處理和建模能力
收集到數據之后,需要對數據進行預處理,利用統計學的理論和方法將數據轉換成一個分析模型。[9]學生在統計學、計量經濟學課程中,已經完成基本模型理論、SPSS或者Eviews三分析軟件的學習。但是,若想實現對大數據的整理和分析,應該掌握R或者Matlab統計分析軟件,同時,還要掌握一種編程語言,例如C++、JAVA、C#等。利用編程語言調用統計分析軟件,從而實現大數據的分析。另外,建議學生了解Perl語言編程,該語言擅長處理非結構數據。
3.培養文獻閱讀及財務分析報告撰寫能力
數據分析之后,需要撰寫財務分析報告,為各方利益相關者的決策提供依據。不同財務分析的目的,形成的財務分析報告具體要求會有所差異,但是撰寫財務分析報告的基本步驟相同。首先查閱文獻,閱讀相關學術文章、財務分析師分析報告、評級機構報告等;其次,模仿寫作,組織財務分析結果,形成報告。此中沒有捷徑,需多看、多寫。
注釋:
①1TB 等于1000GB,1PB 等于1000TB。
參考文獻:
[1]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,(1).
[2]鄔賀銓.大數據時代的機遇與挑戰[J].求是,2013,(4).
[3]張肖飛.財經類高?!敦攧辗治觥氛n程案例教學改革研究[J].商業會計,2013,(1).
[4]朱東華,張嶷,汪雪鋒,等.大數據環境下技術創新管理方法研究[J].科學學與科學技術管理,2013,(4).
[5]張先治.財務分析理論發展與定位研究[J].財經問題研究,
2007,(4).
[6]陳衛軍,徐文學,陳平.基于上市公司網上資源的《財務分析》實訓教學探討[J].財會通訊,2012,(2).
[7]王楨.網絡環境下財務分析案例教學方法的改進[J].中國教育信息化,2012,(1).
1.重策略執行而輕戰略制定,企業整體運作意識不強
戰略是企業發展的長期性、全局性指導思想,策略則是戰略的具體化。從決策邏輯上來說,企業必須先確定營銷戰略,然后再根據戰略制定策略。具體在營銷模擬實驗中,學生先要進行SWOT分析,明確企業的優勢、劣勢、機會和威脅;然后進行STP分析,把握各細分市場之間的差異性,明確公司的目標市場,確定產品的市場定位;之后再制定公司的具體發展目標,如市場占有率目標、銷售額目標、利潤目標,這些內容基本都屬于公司戰略決策的范疇,對企業后階段的策略制定起著方向性的指導作用。但在實驗操作實際中,很多學生對戰略分析不夠重視,把大部分時間和精力都放在了策略制定與執行上,熱衷于進行新產品的開發、新品牌的推出、價格的制定與調整、渠道的選擇、廣告促銷等,至于為何要這樣去制定和執行,以后要怎樣去制定和執行,則缺少全盤考慮。實際上,由于學生前期的戰略分析不全面,戰略目標不明確,很多策略的針對性和實用性不強,甚至有些策略就憑主觀感覺或估計來確定。
2.決策過程不嚴謹,數據分析能力弱
由于市場環境越來越復雜,決策風險越來越大,企業的決策日趨客觀嚴謹,決策中越來越重視數據的支撐作用。數據是市場的真實反映,揭示了事物發展的客觀規律,本身就是決策的重要參考,培養學生的數據分析能力和嚴謹思維也是營銷模擬實驗教學的一個重要目標。市場模擬營銷實驗中包含大量的數據,比如銷售量、銷售額、增長率、利潤額、利潤率、生產成本、投資收益率、知名度、股價等等,另外還有許多圖表,如折線圖、餅形圖、柱狀圖及矩陣圖等,每一次營銷計劃執行后,這些數據或圖表就會發生相應的變化。這些數據中蘊含著豐富的市場信息,非常值得我們去挖掘,但這些數據或圖表并沒有被學生很好地利用,學生對數據的敏感度不夠,不擅長去分析其中包含的信息,對它們的認識有些表面化,往往是在進行簡單的了解后便很快制定出營銷策略,決策過程欠嚴謹。
二、市場營銷模擬實驗教學的優化對策
1.科學分組,確保競爭公平
為使每一位同學都能始終保持實驗興趣,也為了保證小組競爭的公平,教師在實驗開始前必須對全班進行科學分組。分組時要考慮以下幾點:首先要確定每組的人數,每組人數不宜過多,太多了影響決策效率,還可能導致人浮于事,一般三人一組比較好,團隊比較精干,也便于協商或討論;然后要確定小組成員選擇標準,每一小組至少要有一位專業能力相對突出的同學,以保證決策過程的專業性和合理性,并帶動其他同學積極參與。確定組隊標準后,學生可以先行組合,然后把組隊名單交給老師,老師根據實際情況對各組成員進行適當調整,盡量使各組的實力保持相對平衡。
2.突出戰略決策,做好市場分析與戰略定位
企業的決策需要有戰略思維,要預先做好市場及產品的規劃,在此基礎上再制定出不同階段的營銷策略。為此企業需要對營銷環境做出全面細致的分析,了解企業的優勢、劣勢、機會和威脅,并在市場細分的基礎上做出目標市場的選擇,確定產品在目標市場的定位,最終形成成熟的營銷方案。這種戰略分析能力體現出了學生的宏觀視野和邏輯思維,但往往也是很多學生的弱項,需要教師在實驗環節中予以特別重視,通過一系列強化訓練來培養。比如要求學生在每次實驗中必須提交兩份戰略分析報告,一份是SWOT分析報告,一份是STP報告,報告中必須對營銷環境、戰略定位、營銷目標做出詳細分析和具體明確,并闡述原因和依據,在分析報告沒有提交之前,不能進入下一個實驗環節。在每一年度的營銷實驗結束后,教師還要對全班所有同學的分析報告進行評比,將評比結果作為期末成績的參考。通過這種硬性規定,讓學生重視戰略分析,逐步提高從全局把握問題的能力。
3.強化數據分析,做到嚴謹決策
數據分析能反映一個人看待問題的深度以及思維的嚴謹性,但對于很多學生來說,由于營銷分析工具掌握不牢固,對數據分析的方法比較生疏,難以從多個數據中發現事物之間的內在聯系或規律,更多是根據主觀感覺或個人經驗,再結合一些表面的數據來制定營銷對策,決策過程存在某種隨意性。為改變這一不良決策習慣,教師在實驗中必須強調一點,就是所有的決策必須有數據支撐,必須有數據分析,用數字說話。這并非提倡決策的“數據主義”,只是強調嚴謹決策的重要,這種訓練對學生以后的行為習慣和邏輯思維將產生積極影響,讓學生更理性地看待問題和解決問題。以營銷模擬實驗中的廣告投放決策為例,就要求學生先了解企業本年度的營銷預算、廣告的目標、媒體的成本、媒體的傳播效應、企業目前的知名度等數據,然后對這些數據進行科學計算,得出廣告投放的時間、次數和費用,而不能憑估計隨意給定一個數字。
4.加強課堂管理,確保實驗效果
無論是政治,還是經濟形勢,任何政府、企業、個人,面對未來進行投融資等項目決策,不經過數據分析論證就簡單的決定會帶來巨大的危害,已經漸漸的被人們認同。所以,只要參與社會政治、經濟等活動,進行投融資,期望帶來一定的經濟效益,或者社會效益,就必須加強數據分析工作,對投融資意向進行評估,為決策提供科學的依據。
(一)項目數據分析
1、什么是項目數據分析工作
項目數據分析就是研究將經濟學理論用數學模型表示,并應用于項目投資分析的方法論。項目數據分析過程是:提出項目(研究機會)、初步可行性研究(市場、技術、資源、環境研究、效益、風險分析評價)、測算經濟效益、評估和決策、可行性研究(市場、技術、資源、環境研究、效益、風險分析評價)、評估和決策、項目實施。
2、項目數據分析工作的內容、特點
(1)項目分析工作的內容
一般來說,項目數據分析的內容包括項目的經濟效益評價、項目的風險分析和項目的比較選擇。
項目的經濟效益評價主要是在假設項目沒有風險情況下的經濟效益,主要針對非貼現指標(會計收益率和投資回收期)和貼現指標(凈現值、內部收益率、獲利指數和動態投資回收期)。
項目的風險分析,主要是進行盈虧平衡分析、敏感性分析和概率分析。
項目的比較選擇,主要是獨立方案、互斥方案和不完全互斥方案的設計、評估等選擇。
(2)項目分析工作的特點
項目數據分析工作是一門邊緣科學,其特點是以定量分析為主要分析手段,通過分析翔實的數據進行項目的論證得出定性結論,并以定量數據進行說明。顯然,項目數據分析,必須通過建立數學模型的方法進行分析涉及經濟學、數學、統計學和預測學。
(二)什么是投融資
1、項目投融資的概念。
投資是指 “為了在獲得預期的收益而作出的確定的墊支或犧牲的各種經濟行為” 。因此,投資并不局限于與基礎建設相關的經濟活動,還包括證劵投資、信貸投資和信托投資。
2、項目投資的特點
項目投資的特點是現在投入資金進行經濟效益的博弈,通過對該項目的管理進行長期或者未來的收益,不僅具有時間性,而且具有較強的風險性,其本質就是獲得預期的收益。
一些大型的投資項目,通常都由一家專業的財務顧問公司擔任其項目的財務顧問,財務顧問公司做為資本市場中介于籌資者與投資者之間的中介機構憑借其對市場的了解以及專門的財務分析人才優勢,為項目制定嚴格的,科學的,技術的財務計劃以及形成最小的資本結構,并在資產的規劃和投入過程中做出理性的投資決策。
(三)項目數據分析工作對投融資具有重要的意義
1、數據分析工作提高了工作效率,增強了管理的科學性。無論是國家政府部門、企事業單位還是個人,數據分析工作都是進行決策和做出工作決定之前的重要環節,數據分析工作的質量高低直接決定著決策的成敗和效果的好壞。
2、越來越多的企業將選擇擁有中國項目數據分析師資質的專業人士為他們的項目做出科學、合理的分析,以便正確決策項目;越來越多的風險投資機構把中國項目數據分析師所出具的項目數據分析報告作為其判斷項目是否可行及是否值得投資的重要依據;越來越多的企業把中國項目數據分析師課程作為其中高管理層及決策層培訓計劃的重要內容;越來越多的有志之士把中國項目數據分析師培訓內容作為其職業生涯發展中必備的知識體系。
二、從事項目數據分析工作的感受
(一)從數據分析師的角度,項目數據工作需要做到以下幾個方面的服務,才可以為被服務對象提供優質的有價值的投融資報告。
1、真誠服務
所謂真誠服務,主要是因為投融資報告的價值來自于數據分析師精湛的業務能力,細致的數據搜集能力、閱讀能力、分析能力和預測能力。無論是競爭性項目、還是基礎性項目,由于數據分析工作時一門邊緣科學,需要對真實和翔實的數據進行定量或者是定性分析,需要對國家或者國際政策進行審讀,需要對經濟形勢進行判斷,需要對項目所屬的行業進行科學的宏觀把握,因此,項目數據分析師在搜集相關數據,在分析相關數據時,在閱讀國家或者國及政策時,在斟酌行業趨勢時,都需要真誠的付出,否則,閉門造車或者移花接木式的投融資報告,只能是危害客戶,只能給客戶帶來更大的風險,而不是豐厚的收益。
2、真心服務
所謂真心服務,主要是指項目數據分析師在服務客戶時,需要站在客戶的角度思考問題。由于項目數據分析師,是從屬于某公司,因此從公司利益出發,需要為公司賺取一定的利潤,這部分利潤就來自于數據分析師所服務的客戶。從客戶角度思考,實際上客戶委托數據分析師針對企業的項目意向而進行的數據分析,實際是希望數據分析師提供的項目方案,不僅是可行的,能夠為公司獲得預期利益,而且是風險較小的,可以操作實施的投融資報告。
3、真實服務
所謂真實服務,就是指數據分析師在進行項目數據分析,通過建立數學模型的方法進行分析并提出具有科學性的、前瞻性的、科學性的、可操作性的投融資項目預測報告時,需要是真實服務。一般來說,客戶在提出項目設想時,是充滿了憧憬,也具有天真的幻想,那么數據分析師提出的可行性報告如果是刻意逢迎客戶的主張,那么對客戶來說將是災難性的打擊。
4、真情服務
所謂真情服務,主要側重于項目付諸于實踐中,項目數據分析師跟蹤調查項目實施的禁毒,以及修正項目風險分析和比較選擇。
(二)從數據分析師所服務的客戶角度來看,客戶也需要做到以下幾個方面的工作:
1、信賴數據分析師的服務
對數據分析師服務的企業來說,信賴數據分析師是必要的。一方面,投融資項目報告,制定嚴格,具有科學性,是理性的投資決策;另一方面,
2、忠誠數據分析師的服務
3、誠摯和數據分析師的合作
數據分析師在進行投融資項目分析時,一方面,客戶的意項是否描述清晰、完整、完全,是非常重要的,它決定了投融資項目報告的起點和方向;另一方面,企業的真實經營狀況,也對項目報告具有決定性的意義。因此,企業需要同數據分析師進行誠摯的、真誠的合作,否則,項目數據報告就存在不可預知的、本可避免的巨大風險。
三、為項目方和投資方案例分析
支持創新 不忘避險—“倍愛康”生物科技項目作為股東類項目,“中投信?!睘椤氨稅劭怠碧峁?筆貸款擔保,累計擔保余額1900萬元,實現保費收入28.5萬元。
“倍愛康”是由冶金自動化研究院投資興辦的高新技術企業,主營磁分離酶聯免疫檢測系統等醫療器械和試劑的購銷與制造。企業貸款用途為引進加拿大的磁酶免系統。但貸款后對該產品的市場推廣未見成效,研發費用又較高,在銷售無法取得突破的情況下,使得公司的凈利水平偏低。同時,下游各地方醫院壓款情況嚴重。雖引入的國外先進技術不如預期般成功,企業仍按時還貸,該項目順利完結。
2016年,中國互聯網的發展風起云涌、波瀾壯闊。人工智能技術引發新革命,席卷全球并改造著各行各業,中國企業在人工智能領域的角色日益重要;《國家網絡空間安全戰略》,建設網絡強國成為國家戰略;大數據國家戰略加速落地,大數據基礎設施建設如火如荼。尤其是工信部近日印發了《大數據產業發展規劃(2016-2020年)》,特別提出加快推進大數據產業應用能力,到2020年,大數據相關產品和服務業務收入突破1萬億元,年均復合增長率保持30%左右。
顯然,大數據的產業應用能力建設不容忽視。
截至目前,國雙已在商業、運營商、政府、新媒體、司法等五條業務線方向取得了優勢和突破。
數據洞察
2017年2月28日下午,“關鍵洞察――國雙2017年數據報告會”于在北京召開。
會上,國雙除了重磅《2016中國互聯網發展報告》外,還展示了基于用戶的電商購買、品牌搜索和自媒體評論等行為數據分析提煉而成的定制化報告《數往知來――用戶競爭態勢分析報告》。另外,還推出了其全新的CMP汽車營銷解決方案。
2013年和2016年,國雙先后兩次被國家知識產權局評為“北京(中關村)審查員實踐基地”;2014年和2015年,連續兩年發明專利申請量位居中關村前十,并連續入選中關村知識產權領軍企業,2016年入選國家知識產權優勢企業。
國雙聯席總裁李峰表示:“國雙數據中心自2013年成立以來,每年都會中國互聯網發展報告,揭示中國互聯網用戶行為發展態勢和趨勢。迄今為止,國雙已經連續五年這一主題報告。”一直以來,國雙“專注數據,創造價值”,在數往知來的趨勢中,洞察關鍵動向。他們協助企業主從海量數據中,找到關鍵數據,形成決策依據。
國雙數據中心基于獨有的交互式數據挖掘平臺,全方位采集Web端、移動端等源頭的海量數據,運用多維度數據剖析方法,打造了《2016中國互聯網發展報告》(以下簡稱《報告》),從全網概況、訪問特征、渠道分析、行業視角等四個方面,以女裝、IP影視劇植入、汽車、美妝等四個行業領域為典型案例,多維透視解讀了2016年中國互聯網的發展大勢。
會上,國雙數據中心總監徐瑛對《報告》進行了解讀,指出2014年以來手機端訪問量增長率呈逐年上升的趨勢。2016年手機端訪問量較去年再創新高,全年增長率由7.4%上升至20.4%;與此同時,PC端訪問量增長率逐年下降,由-7.9%跌至-19.2%。而訪問終端方面,來自于國產手機品牌華為的訪問量超越三星位居第二位,與蘋果的差距進一步縮小。
網民每日上網時間分布方面的統計顯示,在PC端,人們的活躍時間依然呈現出雙峰“馬鞍”狀的分布,即最高峰出現在早10時,下午15時;但是在移動端,訪問的高峰期出現在夜間的21時左右,對于新媒體內容營銷運營者來說,要掌握消費者上線訪問的時間點,非常關鍵。
在IP影視劇的植入方面,2016年飲料、食品、美妝等行業較多品牌選擇IP影視劇植入,其次是手機、零售、汽車等。就單一品牌來看,OPPO、三只松鼠等植入更多IP影視劇??祹煾导鞍俣鹊貓D因分別植入《青云志》及《從你的全世界路過》等IP電視劇獲得較高關注,收獲了很好的品牌效益。
而在汽車行業方面,2016年人們對汽車行業的關注度呈上升趨勢。緊湊型車關注度占比45.9%,位居第一位;SUV關注度占比達19.2%,超越中型車,成為本年熱議的細分市場。緊湊型車在經歷4月、10月的兩個關注高峰后,均出現平緩回落趨勢,SUV關注度則成波動式爬升,表明近年來興起的SUV熱還在持續燃燒。
數據解讀
本次會上,國雙產品市場總監張桐介紹了國雙為客戶推出的系列定制化報告《數往知來――用戶競爭態勢分析報告》(以下簡稱《競爭態勢報告》)。《競爭態勢報告》基于用戶的電商購買行為數據、品牌搜索行為數據和自媒體評論行為數據,去量化分析品牌搜索競爭格局、品牌電商競爭格局和品牌口碑競爭格局,幫助品牌主實現清晰化運營、優化營銷內容和指導媒介投放。
在市場瞬息萬變的今天,對于企業來說,時刻關注競爭對手變得尤為重要,而大數據帶來了更大范圍的競品監測,更高效率的情報反饋,更有效的橫向對比。國雙“數往知來”系列報告是以競品情報為核心的報告體系,通過追蹤每個用戶的搜索行為,購買行為和評論行為,深度刻畫用戶競爭格局,找出用戶的品牌篩選因素、購買決策因素和二次傳播因素,從而幫助品牌實現清晰化運營,量化指導營銷內容決策和投放媒體的選擇。會上所展示的用戶競爭態勢分析報告,通過動態可視化的數據分析呈現,讓企業主可以很直觀捕捉數據分析結果,快速調整營銷策略。
數據支撐
近年來,中國汽車銷量增速放緩,市場趨于飽和,競爭加劇。數據顯示,77%的購車者從萌生購車想法到成交提車只花了不足90天時間,購買決策窗口期更短。而在比較篩選階段,高達61%的消費者改變了他們原有的車型偏好,消費者更加善變。這些都為汽車企業帶來了嚴峻的挑戰,預示著車企需要在研發、制造、營銷、售后等從上下游產業鏈環節,隨時掌握消費者需求變化,靈活應變調整,才能在競爭中穩步發展,立于不敗之地。
從現在來看,對經濟的統計調查分析報告有兩方面的意義,一是認清現狀,及時改正,通過對過去的數據的統計調查和分析可以發現已經存在的問題,并可以就其中的聯系進一步剖析和研究,發現問題真正的原因,對于沒有收益或者收益日漸下滑的項目應該馬上停止,把不適合企業發展的部分剔除掉,保證經濟健康快速的發展。二是抓住機會,創造利潤,大多數我們得到的都是數量上的,表面的東西,我們要做的就是通過一系列的調查分析,將數量轉化為質量。我們要通過對當前經濟的分析來找到在當今社會大多數行業市場飽和的情況的商機,抓住稍縱即逝的機會,創造更大的利潤。
2 經濟統計調查分析報告策略現存的問題
2.1 經濟調查中存在的困難
在調查中,我們不可能把所有地區,所有企業的經濟都進行一遍盤查,那樣不僅耗費大量的人力,物力,更會使得到的調查數據太過冗雜,不便于分析,那么如何正確的進行抽樣調查,保證選擇的樣本具有代表性,能夠代表大多數的經濟狀況,而不具有特殊性就成為了經濟調查的難點。而且調查得到的數據繁多,如何從大量的數據中找到有用的數據,成為了重點和難點,由于統計調查人員的個人素質和統計數據的繁多,給統計調查工作帶去了很大難度,在數據的統計調查上,如何保證調查得到的數據的正確性也是一個難點,經濟的統計調查是一切數據分析的開始,如果統計調查得到的數據出現錯誤,將會影響接下來的工作。
2.2 經濟統計分析中存在的困難
如果說統計是基礎,那么對經濟的分析就是得出我們需要的結果唯一手段,經濟分析、就是運用當前所有的數據,把數量上的東西,把一些數字化的東西變成結論,變成指導下一步運作和計劃的準則。如何根據現有的大量的數據,得出正確的,對企業,國家經濟發展有力的分析結果,就要看分析人員的素質了,分析人員要有超前的洞察力和分析能力,才會真正地得出有用的結論。
2.3 經濟統計報告中存在的困難
經濟的變化是十分迅速的,上一秒還在盈利,也許下一秒就已經虧損,在得出經濟分析的結論之后,有效,快速,及時的送達分析報告也是十分重要的環節,但是由于工作人員的怠慢等原因很有可能耽誤信息的送達,導致不能對當前經濟已經發生的錯誤做出及時的改正,造成虧損。
3 經濟統計調查分析報告策略
3.1 經濟統計調查策略
在經濟統計調查中,要建立統一的機制,制定一套完整的調查程序,各個部門及時溝通在調查中出現的問題,并予以解決,根據國家的統計報表制度,建立自己的半年或季度統計報表制度。從制度建設入手,健全信息溝通渠道。建立培訓制度,對調查人員進行培訓,提高其調查工作的方法和手段,使調查工作更好更快地開展。還可以建立考核制度,對調查人員的工作進行及時考核,以監督和激勵調查人員的工作。
3.2 經濟統計分析策略
對于經濟統計的分析的重要性已經不用再強調了,那么如何保證分析結果的正確性呢?首先要使用正確的分析方法,由于統計分析的復雜性,所以在分析中要用到管理學,社會學等多個學科的知識?,F有的統計分析方法有靜態經濟分析,動態經濟分析等多種方法,采用正確的,適合的分析方法是得出分析結果的首要保證。其次,要建立完善的分析體制,對于不同的經濟體按照不同的分析體制進行分析,力求更快,更好的對數據進行分析。再次,要提高分析人員的素質,正因為分析工作的復雜和困難,對分析人員的素質就提出了很高的要求,分析人員要了解當前局勢,要了解各個學科方面的內容,要能夠正確運用分析方法,能夠變量分析,將經濟學,數學,統計學很好的運用到一起去,才能統攬全局,得出最正確,最客觀的分析結果。
3.3 經濟統計報告策略
經濟統計報告存在的問題可以說是最好解決的,但是我們也要引起重視,在得出了分析結果之后,要把它體現在報告書上。首先要規范報告內容,要嚴格按照報告書的格式,根據分析結果填寫,要保證報告書將分析結果清晰明了的呈現出來,做到全面不丟失分析結果信息。其次,要提高報告人員的意識,要讓他們做到及時的將報告送達到上一級領導手中,保證分析結果的不延誤,以免影響下一步的進行。
關鍵詞:大數據;復合人才;教學內容;實踐形式;校企合作
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2014)45-0201-03
一、引言
隨著計算機軟硬件技術的快速發展,計算技術已從傳統的PC平臺計算模式發展到嵌入式計算、移動計算、并行計算和服務計算等多種計算系統并存及融合的計算模式,處理的對象也呈現出網絡化、多媒體化、大數據化和智能化需求的特征,而物聯網、移動互聯網的快速發展促進了這一趨勢,從而迎來了大數據時代的到來。大數據是繼云計算、物聯網之后興起的又一新興發展方向,被學術界、工業界乃至政府機構密切關注和廣泛研究。
大數據又稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極的目的的資訊。在維克托?邁爾?舍恩伯格及肯尼斯?庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據的方法。一般說來,大數據具有4V的特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
二、大數據時代對人才的要求
從廣義上講,大數據人才就是具備大數據處理能力的科學家和工程師。目前,國際上開設了大量的數據科學方面的課程、數據科學學位計劃以及數據科學短期培訓班。從國際上設置的培養計劃來看,大數據人才應該系統地掌握數據分析相關的技能,主要包括數學、統計學、數據分析、商業分析和自然語言處理等,具有較寬的知識面,具有獨立獲取知識的能力,具有較強的實踐能力、創新意識和團隊合作意識。具體來說,大數據人才首先應具備獲取大數據的能力,例如能根據任務的具體要求,綜合利用各種計算機手段和知識,收集整理海量數據并加以存儲,為支撐相關的決策和行為做好數據準備。其次,應具備分析大數據的能力,對于經過預處理的各類數據,能夠根據具體的需求,進行選擇、轉換、加載,采用有效方法和模型對數據進行分析,并形成分析報告,為實際問題提供決策依據。最后,應具備良好的團隊合作精神,大數據時代下的數據分析任務通常無法依賴個人能力來完成,需要在團隊制度的約束下,與他人一同攜手、互相鼓勵、分工合作來實現既定目標,因此具備較強的責任心與團隊合作精神也是大數據從業人員必備的基本條件。
三、大數據人才培養的探索
大數據產業的發展,對大數據人才提出了新的需求,國內各高校在積極進行大數據學術研究的同時,也開始考慮將大數據相關課程納入培養體系,以滿足社會對大數據人才的需求。以下結合作者在數據庫及分布式技術系列課程中的教學經驗,以及大數據分析與處理方面的實踐經驗,探討大數據系列課程教學內容和實踐形式的設置。
在教學內容的設置上,大數據系列課程建議可分為理論教學和技術教學兩個方面,因為理論是大數據認知的必經途徑,也是被廣泛認同和傳播的基線;而技術是大數據價值體現的手段和前進的基石。在理論方面,講授的理論內容可涵蓋如下幾點:
(1)大數據概念:大數據概念出現的歷史,關于大數據定義的各種流派以及說明,大數據的四個特征,大數據與云計算、物聯網的關系,大數據與大規模數據、海量數據的差別。這個部分主要突出“大數據”概念中應包含的“對數據對象的處理行為”。
(2)典型的大數據應用實例:精選有新意的大數據分析典型案例,可幫助學生更清晰的理解大數據的概念和含義,這樣的案例如:美國梅西百貨的實時定價機制(根據需求和庫存的情況對多達7300萬種貨品進行實時調價)、百度搜索的實時熱點排行榜(以數億網民的搜索行為作為數據基礎,建立權威的關鍵詞排行榜與分類熱點)、沃爾瑪的搜索引擎Polaris(利用語義數據進行文本分析、機器學習和同義詞挖掘使得在線購物的完成率提升了10%~15%)、谷歌流感趨勢工具(通過跟蹤搜索詞相關數據來判斷全美地區的流感情況)等。在教學過程中,教師應注意將授課的重點放在系統化的開發步驟和關鍵性問題的求解上,介紹案例的設計思想、主要方法和應用過程等。
(3)大數據關鍵技術與挑戰:介紹大數據時代面臨的新挑戰,包括大數據集成(數據異構性和數據質量問題)、大數據分析(數據形式多樣化、數據處理的實時性、索引結構的復雜性等)、大數據隱私問題(隱私保護和數據分析的矛盾)、大數據能耗問題(低功耗硬件的設計)、大數據處理與硬件的協同、大數據管理易用性問題以及性能測試基準。
(4)大數據存儲和管理技術:介紹如何把采集到的大數據存儲起來,建立相應的數據庫,并進行管理和調用。主要內容包括:分布式文件系統(HDFS)、去冗余及高效低成本的大數據存儲技術、新型數據庫技術(鍵值數據庫、列存數據庫、圖存數據庫以及文檔數據庫等)、異構數據融合技術、分布式非關系型大數據管理與處理技術、大數據索引技術和大數據移動、備份、復制等技術。
(5)大數據分析及挖掘技術:介紹從大量數據中尋找其規律的技術,通常由數據準備、規律尋找和規律表示3個階段組成。數據準備是從上述大數據中心存儲的數據中選取所需數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含規律找出來;規律表示則是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。根據挖掘任務可分為分類或預測模型發現、數據總結、聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等。
在技術方面,可考慮分別從云計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到形成結果的整個過程,具體可包括以下幾點:
(1)NoSQL技術:NoSQL產生的背景、NoSQL現狀、NoSQL數據庫與關系數據庫的比較、聚合數據模型、分布式模型、數據一致性、典型的NoSQL數據庫分類、NoSQL數據庫開源軟件。
(2)MapReduce:MapReduce模型概述、編程模型:Map和Reduce函數、MapReduce工作流程、并行計算的實現、實例、Yarn等
(3)Hadoop分布式文件系統:Hadoop出現的背景、Hadoop的功能與作用、為什么不用關系型數據庫管理系統、Hadoop的優點、Hadoop的應用現狀和發展趨勢、Hadoop項目及其結構、Hadoop的體系結構、Hadoop與分布式開發、Hadoop應用案例、Hadoop平臺上的海量數據排序。
(4)還可進一步包括數據流的管理與挖掘、云數據庫、圖數據庫等。
由于大數據系列課程所涉及的技術具有很強的應用背景和實踐意義,因此應摒棄傳統教學模式中“重理論、輕實踐”的思想,在掌握大數據相關的理論知識和技術知識之后,還需重點培養學生的綜合實踐能力,以滿足社會就業的需要。為此,應設立一定的大數據技術實踐課程內容,幫助學生從知識型向能力型轉變。結合上一節分析的大數據時代對人才的具體要求,建議按以下流程設置實踐環節的內容:
(1)分組。如前所述,大數據時代下的數據分析任務通常需要以團隊的形式來完成,因此首先要求學生根據自身情況,結合各自的技術優勢,合理進行分組。
(2)選題。在具體選題上,可使用校企合作的具體項目或以Apache Hadoop、MongoDB、Dremel、Gephi等一系列的開源大數據分析軟件作為實踐平臺,以Kaggle為數據科學平臺來進行選題。
(3)明確需求并撰寫大數據分析任務書。明確選定的題目范圍內,數據分析要研究的主要問題和預期的分析目標。只有明確了數據分析的目標,才能正確地制定數據收集方案,即收集哪些數據,采用怎樣的方式收集等,進而為數據分析做好準備。
(4)數據收集及預處理。由于大數據分析最終的結果與其獲取的數據質量緊密相關,因此收集的數據是否真正符合數據分析的目標是必須注意的重要問題。該步驟要求學生從分析目標出發,從浩瀚的數據中正確的收集高質量且服務于既定分析目標的數據,然后對數據進行必要的加工整理,包括填寫空缺值、平滑噪聲數據、識別和刪除孤立點、解決不一致性、規范化(消除冗余屬性)和聚集(數據匯總)等。
(5)探索性數據分析。由于大數據分析的數據量通常達到PB甚至YB級以上,因此希望直接選定一個分析模型是不現實的,而且面對高維海量數據,也很難直接看出數據的規律。在這個步驟中,應指導學生通過基本描述統計量的計算、基本統計圖形的繪制、用各種形式的方程擬合等手段,計算某些特征量等方法探索規律性的可能形式,幫助學生快速掌握數據的分布特征,這是進一步深入分析和建模的基礎。
(6)模型選定分析。在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。有時選擇幾種統計分析方法對數據進行探索性的反復分析也是極為重要的。每一種統計分析方法都有自己的特點和局限,因此,一般需要選擇幾種方法反復印證分析,僅依據一種分析方法的結果就斷然下結論是不科學的。
(7)模型的驗證及分析報告。指導學生對選擇的數據分析模型及結果進行分析,可使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。觀察模型提供決策的信息是否充分、可信,所發揮的作用是否與期望值一致,數據分析方法是否合理,是否將風險控制在可接受的范圍。
以上這種項目式實踐形式的優勢是:在學生參與完成某一具體的大數據分析任務過程中,通過主動地學習來自主地進行知識的建構,讓學生經歷項目開發的整個過程,從中去發現和掌握相關知識,達到既能熟悉大數據分析過程,又完成了經驗的積累,還能實現學習知識、培養能力的目的。在這里,教師不再是知識的傳授者,而是項目活動的組織者和咨詢者。
四、校企合作推動人才培養
一方面,大數據的核心業務必然是一種扎根于特定行業,綜合運用已有的存儲、分析、挖掘、展現技術,根據用戶需求并融入行業特色技術模型的一站式大數據平臺業務。另一方面,對于企業來說,各類業務產生的數據為數據分析創造了非常好的基礎條件。大數據解決方案是有價值的,但是苦于找不到既懂數據分析技術,又懂得業務的專業人才。由此可見,既懂得相關技術,又諳熟企業業務的復合型人才才是企業部署大數據應用最迫切需要的人才。因此,企業可以與學校聯合培養自己所需要的大數據人才,這種方式有兩方面的優勢:一是大數據技能訓練的對象,即大量的數據,只有企業才具備;二是在企業的支持下,學校也能通過針對性的實踐訓練來培養學生的大數據處理技能。
大數據時代下的校企合作的形式多種多樣,可通過聯合辦學、聯合制定人才培養方案、合作開發課程和教學內容、設置實訓項目、教學管理和共建“雙師”結構教學團隊等形式展開。
五、結語
關鍵詞:國庫統計 大數據 分析與預測
一、大數據時代國庫統計分析轉變
(一)樹立大數據思維
“大數據時代預言家”維克托認為:世界的本質就是數據,大數據將開啟一次重大的時代轉型,一直以來所延續的傳統統計分析思想已變得陳舊且落后。國庫統計分析思維應當在大數據背景下加以轉變。一是關于大數據抽樣調查工作的思想。抽樣調查是目前統計分析工作中的重要調查方式,但應該清醒地認識到,傳感器、網絡和數據處理技術,為獲取全局數據提供了可能,抽樣調查方式越來越多的被大數據取代成為必然。二是大數據統計思想:允許數據存在不精確性??v觀目前的各類數據,一方面,數據來源不斷擴展,另一方面數據處理方法飛速發展,我們應該把重心放在統計分析效率上,而不是一味地追求數據的精確性上。三是大數據相關關系的思想,由驗證因果向尋求關聯轉變。統計分析報告是統計工作的下游產品,對決策的意義常常大于常規報表。大數據的應用,統計分析也將發生轉變,在做好因果分析的基礎上向尋求關聯轉變,原因分析更加精準和深刻,對策建議更具參考價值。
(二)被動統計到主動分析,從人工統計到智能統計
在這樣一個信息爆炸的大數據時代,無論政府機構還是社會公眾都可以通過多種途徑獲取信息,國庫統計分析部門也不例外,更應該變被動為主動,對經濟轉型期的一些重大問題尤其是關系到可持續發展的重要問題,做好數據統計分析,提高發展質量,實現經濟轉型。涂子沛指出人類使用數據的巔峰形式,是通過數據賦予機器“智能”。大數據在包括國庫統計分析中應用的終極形式就是分析智能化。
(三)從事后統計向事前預測轉變
統計分析報告是統計工作的重要產品,完整的進度性常規分析應該包括對未來一定時期數據的預測。但由于小數據和信息量的局限,預測一般很少作為報告的重點,多是在假定發展條件、相關政策不變的情況下對未來情況做出的粗略研判,影響了統計對決策的參考價值。而大數據的核心就是將數學算法與海量的數據有效結合,來預測事情發生的可能性。大數據的廣泛應用,將有利于統計報告實現由單一的事后分析,向注重事前預測轉變。
二、大數據在國庫統計分析全流程應用的探討
當前,大數據浪潮帶來了一場新的革命,面對經濟發展的新形勢新要求,國庫統計分析要學會積極的運用大數據的思想和方法,來應對各種新挑戰。國庫統計分析要積極主動建立大數據分析應用機制,破解新常態下面對的各種問題,實現工作的創新與發展。本文重點分析國庫統計分析全流程下大數據的應用。
(一)數據源:建立國庫統計分析數據池
目前國庫統計分析所用數據主要通過“3T”系統產生基礎數據和監管類數據,通過收集各類型政策文件、影像資料、領導講話、內網信息等形成綜合性數據。但這些數據遠未達到支撐大數據統計分析的基礎。國庫統計分析應當建立“數據池”這一基礎工程,通過人行內部數據整合、銀行和其它機構數據接入、互聯網數據抓取和引入等多渠道擴充基礎信息源和數據庫,為國庫統計分析的大數據應用奠定數據基礎。
一是加速整合現有國庫數據。我國國庫匯集了各級政府財務數據和各級國庫管理數據,包括從中央到縣鄉的各級機構化和非結構化數據,也包括稅務、海關、財政、銀行等部門處理的各類收支退存等國庫資金運行數據,涵蓋面極廣。但現有數據資源存在著部門隸屬、無法共享等問題,大數據要求建立統一、高效、共享的國庫業務大數據池,就必須打破現有藩籬,盡早實施“國家金庫工程”,完善內部數據源。
二是擴大國庫統計分析數據源。最重要的是打通各級政府及其下屬各部門之間的數據傳輸通道,實現政府辦公、工商行政、招商引資、外貿出口、仲裁訴訟等政府活動所產生的數據接入共享。其次是實現一行三會、商業銀行、行業協會、企業實體等生產運營數據的持續傳輸和報送。最后是互聯網數據,互聯網是大數據的重要載體,也是數據收集的快捷途徑,通過各類互聯網平臺,門戶以及行業網站,可以收集海量數據來增加國庫統計分析領域數據采集的前置性和時效性。
(二)數據采集與存儲:軟件與硬件結合
大數據的應用中,由于數據來源非常廣泛且類型多樣化,需要存儲和分析挖掘的數據量也是十分龐大的,因此數據展現和處理的高效性以及可用性十分重要。因而,大數據的收集和存儲應當通過先進的計算機技術自動實現,并結合線下需求采取人工收集等傳統方法,以補足系統無法收集的數據的遺漏。國庫統計分析數據的采集應當在國庫大數據資源池基礎上,通過構建云計算應用平臺,統籌整合各直屬國庫大量分散的數據和軟硬件資源,通過應用云計算平臺的資源和功能,以提升和優化整體效能,從而實現全國國庫統計分析的大集成、大整合以及大應用。對于其他橫向聯網數據,比如一些保密性較強的科學研究數據和企業生產經營數據,則可以與研究機構和企業建立合作關系,使用特定系統接口等相關方式采集數據。
在數據存儲方面,在通過完善的物理存儲技術和云計算平臺等軟硬件設施的基礎上,按國庫統計層級建立分級倉儲式數據中心,以人行總行為總庫,各項業務與非業務數據達到匯總存儲,各級行通過內部接口或云計算平臺實現數據上傳下載,同時本級行建立分中心數據存儲倉,采集本級區域內縱向和橫向數據并存儲。同時按照保密和信息安全等要求,實施分級授權和設置防火墻、實時加密存儲數據和卷標存儲加密等技術。
(三)數據清洗與結構化處理
國庫海量的、不規則的數據無法提供有效決策支持,只有通過數據清洗技術將大數據轉變為結構化和規則化的數據,才能體現大數據價值。數據清洗包括檢查數據一致性,處理無效值和缺失值等,是發現并糾正數據文件中可識別的錯誤的最后一道程序。經過數據清洗技術處理殘缺數據、錯誤數據和重復數據后將有效數據寫入數據庫。
在國庫大數據統計分析上,通過數學知識(概率、統計、離散化等)建立合理模型,充分利用和挖掘數據內容。綜合運用開源類和非開源類數據分析工具包括R、Python、MATLAB、SPSS、EVIEWS等軟件進行數據分析。具體實現統計分析、數據挖掘和模型預測等功能,并以可視化的結果予以呈現。統計分析包含假設檢驗、差異分析、相關分析、方差分析、回歸分析、logistic回歸分析、因子分析、聚類分析、主成分分析、判別分析、bootstrap技術等。數據挖掘包含相關性分組或關聯規則、聚類、描述和可視化、復雜數據類型挖掘等。模型預測包含預測模型、機器學習、建模仿真等。
在統計分析過程中,國庫統計分析應該重點實現云應用的創新與共享。統計人員可以根據業務的新要求,在云平臺數據開放接口的基礎上,自由構建合理的數學模型和算法,實現業務應用的創新和擴展。與此同時,以算法的方式將統計人員的智力成果和業務知識固化,當經驗證為可信任應用時,可自動進入云平臺的應用共享庫,在得到授權的前提下,自由使用或補充完善,實現知識固化、資源共享。
(四)國庫運行智能化統計分析
在云應用平臺上,國庫統計分析首先要將日、旬、月和年作為數據的時間維度,將國庫收入、國庫支出以及國庫庫存等統計指標作為數據的為空間維度,利用云計算的強大能力,并借助數據分析展示工具,預先計算處理數據?;蛘吒鶕脩羰孪忍峤坏臄祿诰蛐枨笞詣油瓿上嚓P數據預處理。統計分析人員隨時可以從兩個維度上深度挖掘數據,并使用QLikView等數據分析工具,實現統計大數據的多維度、可視化展示。
二是實現常規統計分析的智能化生產??梢酝ㄟ^完善和豐富大數據應用平臺的分析功能,實現機器式的學習,輸入必要的參數后,系統將自動計算數據,并關聯提取大數據池中的相關數據和信息,進而依據特定的模板輸出分析報告,最后由分析人員對輸出的分析報告進行質量把關和進一步的補充完善。
三是構建統計分析數據模型,提高預警預測水平。不斷進行新的分析預測數學模型的探索和構建,充分利用國庫統計大數據平臺上的海量數據和動態實時數據,不斷提高預測水平。
(五)數據展示與反饋
以智能化統計分析為主的大數據應用技術,為數據結構化和可視化的展示提供了支持。簡要國庫運行數據、系統化運行指標、國庫資金運行報告、國情和輿情監測報告、企業和金融服務報告、國庫運行情況預測等為中央銀行、各級政府部門制定有關政策提供統計信息和參考依據,充分發揮國庫在國家預算執行中的促進、反映和監督作用。同時建立信息反饋機制,對現有統計分析結果予以反饋,還包括對未滿足需求提出反饋,豐富和完善大數據應用成果,充分發揮國庫統計分析應用大數據的社會價值。
綜上所述,從全流程看,大數據應用自數據端建立“”數據池“”到處理端智能分析在到應用端數據展示,大致可以通過下圖(圖1)形象展示:
三、有效提升大數據應用的政策建議
(一)從制度層面保障大數據統計分析的有效開展
制定專門的大數據應用法律法規,在由總行統一部署、統一實施的基礎上,各地區分支機構結合當地實際制定特色大數據應用和發展規章制度。從數據產生、采集、存儲、挖掘和應用等大數據處理全流程做出明確安排。一是通過總行層面的發文、通知等鼓勵通過大數據方法加強國庫統計分析,建設大數據共享和應用平臺;二是強化大數據統計所需軟硬件采購、數據源互聯互通及模塊化分割等作出具體安排;三是要求大數據應用所應達到的在信息、統計報告、預測與預警等功能上的目標和績效予以明確,充分利用大數據平臺提供統計分析支持;四是強化信息技術安全,防止信息泄露、網絡攻擊、系統失靈等問題,明確應急處置方案。做到嚴格立法,有法可依,有章可循。
(二)加大基礎設施建設和人才投入,滿足大數據應用的軟硬件要求
大數據基礎設施可分為硬件和軟件兩類。硬基礎設施主要包括用于收集、存儲、分析和應用大數據的信息化系統架構;軟件基礎設施主要包括各類數據信息、數據挖掘和大數據應用專業軟件以及金融企業的人力資源。人民銀行應通過專項資金投入等方式構建大數據應用的軟硬件設施和和培養專業人才,并通過持續培訓使全體員工了解并使用大數據進行國庫統計分析。也可邀請專業的大數據解決方案服務商作為咨詢顧問,整合國庫不同生產系統數據,優化數據應用行為,加快統計系統建設步伐。
(三)提高大數據管理和應用能力
國庫統計分析應不斷的加強國庫運行數據的采集、儲存、保護和管理工作,不斷提升統計分析水平。加強對國庫統計分析中涉及的地方債、營改增、房地產、小微企業經營、財政專戶、盤活庫存等熱點領域可以設計建立相應跟蹤監測指標體系。與此同時加強改革數據的統計制度、方法以及程序,研究大數據共享制度,為宏觀經濟分析提供便捷、堅實的大數據基礎。
建立國庫大數據分析應用機制是新形勢下的當務之急。國庫統計分析需不斷改革創新,強化大數據的思維,提高大數據的意識和駕馭大數據的能力,積極探索新的大數據應用方法和途徑,從而在國家宏觀決策、服務經濟社會發展、服務國庫管理方面,進一步提升國庫統計分析服務的能力和水平。
參考文獻:
[1]沈昱池.大數據時代我國財政信息共享的思考[J].地方財政研究,2015(11):47-67
[2]陳健慧,趙昕.國庫統計分析數據集中系統建設[J].金融電子化,2010,03:89-90