時間:2023-08-23 16:26:18
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇統計學的論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
[關鍵詞] 醫學期刊 統計學問題 編輯
[中圖分類號] G230 [文獻標識碼] A [文章編號] 1009-5853 (2013) 05-0067-03
醫學統計學是一門以統計學原理和方法為基礎,探索醫學科研工作中遇到的有關數據的收集、整理和分析方法的應用科學,又可被看成一個收集信息、處理信息、分析信息,進而從中提煉和總結分析出新的信息的過程[1]。隨著醫學科研水平和醫療技術水平的不斷提高,醫學科研和臨床實際工作中,人們對待科學的態度逐漸從原來的“經驗主義”轉變為“論據先行原則”,無論是在一些醫學相關學科的基礎實驗中,還是在一些臨床疾病的診治等工作中,人們遇到問題時不再“想當然”,而是首先考慮為什么,有何依據,而這些依據大多需要通過統計學中的信息收集、整理、分析來提供。因此,醫學統計學在醫學工作中的地位越來越重要,統計學應用的正確與否直接影響著醫學科研結論的科學性、嚴謹性和可靠性,具體到醫學期刊方面,就會出現因統計學應用不恰當而導致醫學期刊不嚴謹、不科學、不可靠和不具有影響力[2]。鑒于醫學統計學在醫學期刊中的重要地位,作者結合《腫瘤基礎與臨床》雜志2011年的240篇文章中出現的統計學問題,對目前我國醫學期刊中常見的統計學問題進行分析,同時提出一定的解決方案,為醫學編輯工作能力的提高以及醫學期刊整體水平的上升提供一定幫助。
1 醫學期刊中常見統計學問題
統計學的誤用、錯用和不用問題廣泛存在于許多醫學期刊中,統計學錯誤率處于較高水平,有文獻報道期刊論文統計學錯誤率為38%—80%,而且統計學問題的種類幾乎涉及統計學的每個方面,包括實驗設計不合理、未進行統計學處理、統計分析軟件未介紹或介紹不清、統計學數據的描述方法不當、統計學方法的描述不清或錯用、統計值或P值不全或描述不清、統計學結果分析或描述錯誤等[3-4]。王倩等[5]對5種“中華”系列雜志刊登的文章的統計學應用進行回顧性分析,發現1985年統計學方法應用的錯誤率占24%,1995年占36%。沈進等[6]選取8種醫學期刊,分析發表于1998年至2005年的544篇論著文章的統計學方法應用情況,結果顯示,136篇的統計學出現明顯錯誤,錯誤率達到25%,其中以資料處理方法不當所占比例最高,達到61.76%,其次為圖表錯誤、未作統計學處理等。我刊2011年刊登的240篇論文中,排除個案報道、教學論文、棕色行論文36篇,剩余的204篇論文中有126篇論文采用了統計學處理,占61.76%(126/204),現結合本刊統計學應用現狀針對醫學期刊中常見的統計學問題進行分類分析如下。
1.1 統計研究設計不合理問題
大多數非統計學專業的學者在進行統計研究設計(包括實驗設計、調查設計、臨床試驗設計)時僅僅從本專業的角度考慮,根據主觀想要得到的結果進行分組設計,而完全沒有考慮該實驗設計的可行性、組間數據是否具有可比性等問題,主要表現在實驗設計時不遵循隨機化原則、未設置對照或對照不合理、均衡性原則貫徹不徹底等[7]。常見的統計研究設計不合理問題包括缺少對照或對照不合理、單因素設計取代多因素設計、樣本量選擇不具有代表性或樣本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鱗狀細胞癌組織中的表達及意義》一文,在實驗分組設計時未對各組間數據是否具有可比性進行統計學分析。
1.2 未進行統計學處理問題
許多醫學期刊論文雖然也進行了分組設計、設立對照等,但是文中未說明采用何種統計方法,也未對這些數據進行統計學處理,僅僅通過對實驗所得的實際數據的直觀判斷就得出結論[9]。例如,本刊《肺尖癌26例療效分析》一文中,作者在分析不同治療方法對肺尖癌的療效時并未采用任何統計方法,而是直接得出了“綜合治療較單純治療更能延長肺尖癌患者生存期”的結論,這不符合現代醫學科研的結論需有據而立的原則。
1.3 統計方法的描述不具體或錯用問題
1.3.1 統計方法的描述不具體
一些醫學期刊論文中列出的統計方法過于簡單,甚至未列出,主要有以下幾種情況[10-12]:在“材料與方法”部分中的“統計學處理”中未列出所用的統計學軟件或僅列出所用軟件而未說明所用軟件的版本;對于何種數據采用何種統計方法僅籠統描述,未具體列出文中的那些數據應該用何統計方法;對于定量數據僅列出采取t檢驗或方差分析,而未列出是否進行正態性檢驗和方差齊性檢驗;對于兩組定量數據無論是應該采用成組設計t檢驗還是配對設計t檢驗,均僅描述為“兩組定量數據比較采用t檢驗”;對于兩組或多組定性數據的比較,無論是僅需用 2檢驗,還是需要采用矯正 2檢驗或 2分割檢驗,均描述為“兩組或多組定性數據的比較采用 2檢驗”;統計學符號書寫不規范,例如,根據GB/T3358-82,F檢驗、P值、 2檢驗、t檢驗等中的字母應為斜體,不符合上述規定的書寫均為錯誤情況,這在論文中非常普遍;未列出檢驗水準 ,檢驗水準 是事先設定的判斷小概率實踐的標準,實際意義是允許犯假陽性錯誤概率的最大值,需要根據不同的研究目的進行設定。例如,本刊《 -連環蛋白和層粘連蛋白的表達與垂體腺瘤侵襲性的關系》一文在“統計學處理”僅說明數據的比較采用t檢驗,而未說明t檢驗的類型。
1.3.2 統計方法的錯用
一些醫學期刊論文中的統計方法的應用存在明顯的錯誤。對于所有定量數據,常見的錯誤有[13-14]:無論是否符合正態分布、是否方差齊,一律盲目應用t檢驗或單因素方差分析等參數檢驗方法進行比較分析;無論數據分為幾組,一律采用t檢驗進行比較分析,把其當做定量數據比較的萬能工具;無論各組數據是何關系,一律采用成組設計t檢驗或單因素方差分析。例如,本刊《癌癥相關性乏力與TGF- 1的關系分析》一文中,定量數據進行比較分析之前未說明是否進行了方差齊性檢驗和正態性檢驗。對于所有定性數據,常見的錯誤有:把 2檢驗當做所有定性數據的萬能統計工具,忽略了其應用的前提條件是, 2檢驗適用于正態分布的定性數據,且樣本量最好>40,列聯表數據進行 2檢驗時不能有1/5以上的格子其理論頻數
1.4 統計結果的描述及分析錯誤問題
許多醫學期刊論文中均可見到統計結果的描述或分析錯誤,常見的有以下幾種[15-17]:1)對于定量數據應當根據是否符合正態分布而采用不同的描述方法,符合者一般采用“均數±標準差”或“均數±標準誤”表示,而不符合者則采用中位數和四分位間距來進行表示,不按上述規定進行描述者均屬于錯誤描述;2)對于定性數據,常見的錯誤是構成比和百分率不分,計算率或構成比等相對數的樣本量過??;3)解釋有統計學意義時僅根據P值的大小得出相應結論,例如對于A、B組2組的療效(假定A組療效優于B組),其“P
1.5 統計值和(或)P值描述不清以及統計值缺失問題
許多醫學期刊對統計結果進行描述時,通常不能完整清晰地描述出統計值和P值,常見的有以下幾種情況[18-19]:統計結果僅用“P0.05”得出結論,缺少相應的統計值;統計結果包括統計值,但是P值僅寫出“0.05”,未列出具體的P值;僅列出具體的P值,而統計值缺失,上述幾種情況均不利于文獻閱讀者進行數據驗證和meta分析。例如,本刊《同步放化療治療局部晚期食管癌臨床觀察》一文中,所有統計結果均僅列出了“P0.05”,未列出具體的統計值和P值。
2 針對醫學期刊中常見統計學錯誤的解決對策
目前,醫學期刊論文的統計學問題已經成為衡量論文質量高低的重要標準,統計學的錯誤可能會導致論文學術水平和學術質量的降低,甚至有可能導致嚴重的后果。近年來,隨著廣大醫學科研工作者和醫學期刊編輯及審稿專家對醫學統計學應用的重視,醫學期刊論文中的統計學問題已經明顯減少,但仍然處于較高的水平,這可能與以下幾點有關[20-22]:論文作者、編輯及審稿專家思想上不夠重視論文統計學應用;期刊編輯的統計學應用知識匱乏;選擇審稿專家只注重其專業領域內的影響力,而未關注其統計學應用水平。因此,要想提高醫學期刊的統計學應用水平,從而更進一步提高期刊總體質量,需要做到以下幾點:作為醫學期刊編輯,必須不斷進行統計學相關知識的學習,例如參加相關培訓班、旁聽醫學院校的統計學課程及請教統計方面的專家等,以提高自身的統計學應用水平,并從思想上重視統計學應用的審查,在給新投稿件的作者的初步意見中就強調統計學應用的重要性,規定一旦統計學有問題,論文可隨時退稿;聘請醫學統計學專家進入期刊編委會,負責所有論文的統計學審稿;應通過各種途徑,向廣大科研工作者宣講統計學在醫學科研工作中的重要性,使其養成良好的正確應用統計學的習慣;在科研課題設計過程中要求有統計學相關專家的參與;科技期刊中增加統計學應用欄目,刊登與本刊論文關系密切的統計學方法,或者刊登一些常見的統計學錯誤,與作者或讀者交流,提高其統計學應用能力。
注 釋
[1]孫振球.醫學統計學(第3版)[M].北京:人民衛生出版社,2010:1-8
[2]胡良平,郭秀花,劉惠剛.醫學統計學是評價醫學科技論文質量優劣的重要依據[J].中華口腔醫學雜志,2011,36(3):229-232
[3][8]胡良平,李子建.醫學統計學基礎與典型錯誤辨析[M].北京:軍事醫學科學出版社,2003:4
[4] Garc韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13
[5]王倩,張博恒.五種中華醫學會系列雜志論著中統計方法的應用現狀[J].中華醫學雜志,1998,78(3):230-233
[6]沈進,茍莉,湯潔,等.生物醫學期刊中統計學方法應用情況分析[J].中國修復重建外科雜志,2007,21(5):541-543
[7] [15]王曉瑜,王雅琢.《山東醫藥》論文中統計學錯誤分析[J].中國科技信息,2010(16):193-194
[8][9][10][20]邱春暉,郭明興,邱源.醫學論文中統計學方法的誤用及其防范措施[J].山東教育學院學報,2009(5):116-118
[11] 冉明會,羅萍,鄧丹.醫學期刊編輯應注意的幾個統計學處理問題[J].編輯學報,2009,21(6):503-505
[12][16][18]李霞,張印朋,閆蘇平.醫學期刊作者來稿統計學應用與表述常見問題分析[J].中國科技期刊研究,2011,22(1):88-89
[13] 王曉瑜,王雅琢,封艷輝,等.醫學期刊投稿常見統計學問題分析[J].科技與出版,2011(11):42-44
[14] 金永勤,王維.醫學期刊編輯應重視統計學中的幾個問題[J].編輯學報,2009,21(1):33-34
[17]張功員,田慶豐.醫學科研論文中統計結果表達和解釋錯誤分析[J].鄭州大學學報(醫學版),2002,37(3):338-340
[19]葉亮,李偉東,范欣生.醫學論文中常見的統計學應用問題辨析[J].南京中醫藥大學學報(社會科學版),2011,12(4):247-248
[21]吳紅艷,尹平.醫學期刊編輯應在數據的統計把關中有所作為[J].編輯學報,2008,20(5):400-401
EBN是近年來護理領域發展的新趨勢,改變了臨床護士憑經驗和感覺進行護理的習慣和行為,而是以科學的證據指導實踐,使患者獲得科學、有效、最佳的護理。高血壓患者的血壓水平受神經、體液的調節和體內外環境的影響,與社會心理關系密切。高血壓及其并發癥危害嚴重,醫學論文,護理學論文,臨床醫學論文,藥學論文,泌尿論文,婦產科論文但因其病因復雜和醫療水平有限,目前尚無根治方法。未病先防,已病防變,高血壓的預防顯得更加重要。已有諸多研究證實,積極干預高血壓可逆轉也可改善血糖、糾正血脂等。文章針對高齡難治性高血壓患者,采用循證護理模式進行管理,取得了較好的效果,現報告如下。
1 資料與方法
1.1 一般資料:選擇2011年11月~2012年11月來我院就診的100例高齡難治性高血壓患者,隨機將他們分為觀察組(A組),采用循證護理模式,另外一組為對照組(B組),采用常規性護理,每組各50例。男70例,女30例,年齡77~88歲,平均82.8歲。兩組患者在性別、年齡、身高、病期以及血壓上等方面差異無統計學意義(P>0.05),具有可比性[1]。
1.2 治療方法:①對醫護人員進行難治性高血壓、循證護理進行相關知識培訓,以求護理人員能夠掌握這些技能知識。醫學論文,護理學論文,臨床醫學論文,藥學論文,泌尿論文,婦產科論文在循環護理階段,醫生要準確確定高齡難治性高血壓患者所要求的循環護理問題,這就需要從血壓的測量、心理上、護理認知能力等方面著手[2];醫學論文,護理學論文,臨床醫學論文,藥學論文,泌尿論文,婦產科論文②指導患者學會一些基本上的護理。一是護理人員要對患者的認知能力、身體狀況等方面原因,可以教這些患者使用血壓測量器;在體重上,引導他們適當的控制體重;對于一些健康的生活方式,可以適當的結合他們圣體狀況采用,尤其要戒煙限酒。
1.3 觀察指標[3]:4周為1個療程,1個療程后仔細觀察兩組患者在體重上的控制、使用血壓測量方法、遵守醫囑等方面的變化。遵守醫囑所包含患者的心理改善狀況、自我控制能力、戒煙戒酒、戶外運動時間、飲食等方面。判斷的標準:平均分為50分,以上的為較好,以下的為較差。
1.4 統計學方法:使用SPSS 13.0對各項資料進行統計、分析,各項參數以均數±標準差( )表示,采用t和χ2檢驗,以P<0.05為差異有統計學意義。
醫學統計學(medical statistics)是醫學及其相關專業的必修基礎課程之一,掌握好本門課程對于培養學生的科學思維,增強其解決實際問題能力,提高醫學研究和醫學論文撰寫水平等方面具有重要的作用。
沈陽體育學院運動人體科學專業所開設的醫學統計學課程存在如下問題∶未設置實驗課或實習課,學生的數據分析處理能力差,撰寫畢業論文時不用或錯用統計分析方法;教學大綱不要求醫學統計學術語,學生不能應用統計分析軟件;多采用講授方法,重視推導公式,課程內容枯燥,學生的學習興趣低;學生畢業論文中,統計圖表制作不規范,不能應用統計學知識并結合統計圖表解釋結果。本研究針對上述問題,以加強學生理解基礎知識的理解,提高學生的數據分析和實際應用能力為目的,根據沈陽體育學院的現有教學條件,進行教學改革。
1 研究對象
以2008級運動人體科學專業43名本科學生為研究對象,其中男生18人,女生25人。
2 教學改革方法
2.1 加強醫學統計學的基礎理論教學,采用講授與多媒體教學相結合的方法進行理論教學,并在教學中采用參與式教學方法,鼓勵學生主動參與到課堂教學之中。
2.2 采用中英文雙語教學的方法,要求學生掌握基本醫學統計學術語,為熟練應用統計學分析軟件奠定基礎。
2.3 擴展教學內容,在教學中進行實例講解的同時,增加應用spss統計分析軟件分析內容,提高學生的數據分析能力。
2.4 加強統計表和統計圖制作的教學,并增加課堂練習時間,進行根據統計分析結果制作統計圖表內容,提高學生對科研結果的總結能力。
3 研究結果
3.1 針對全部章節的教學內容制作教學課件,在教學課件中強調了對學生難以理解內容的解釋,如正態分布、t分布、卡方分布等,使學生在本文由收集整理充分理解的前提下正確使用統計學用表(如見圖1)。
3.2 在教學中重視知識的連貫性,循序漸進逐漸引入新知識,強調課前預習,培養學習能力。在理論講授結合多媒體課件講解的基礎上,融入參與式教學方法,鼓勵學生參與課堂討論、練習題解答和實例統計學分析。結果表明,多種教學方法結合的形式,調動了學生學習的積極性,課堂氣氛活躍,絕大多數學生能夠集中精力,很好地掌握教學內容。
3.3 采用中英文雙語教學的方法,使學生很好地掌握了醫學統計學術語,有利于學生學習統計學分析軟件的使用方法。在教學中要求學生掌握描述統計中的常用英文專業術語如,central tendency,histogram,mean,median,percentile,variance等。
3.4 在掌握上述英文術語的基礎上,擴充應用spss統計分析軟件分析內容。如在描述統計學的集中趨勢和離散趨勢教學中,在課堂演示應用spss統計軟件對某地120名18―35歲健康男性居民血清鐵含量進行統計描述[1](如見圖2)。課堂演示后,要求學生參與,應用spss軟件重復操作過程,并解釋分析結果。
3.5 在統計學檢驗方法的教學中,融入spss軟件分析和統計圖表的制作內容,使學生掌握數據表示的方法,培養基本的科研素養。如在進行兩獨立樣本t檢驗的教學中[2],講解目的、強調檢驗條件、檢驗方法、公式、檢驗步驟、結果解釋,并應用spss軟件進行分析,在分析中強調明確檢驗假設,正確建立數據庫,如何讀取檢驗結果,如何進行統計結果解釋,專業解釋等。在上述內容的基礎上,演示如何表示分析結果,并演示應用excel制作統計圖表的過程,如見表1,圖3。
3.6 考試成績分析 試卷主要考核學生掌握統計學基本理論、統計學基礎知識、統計計算能力及統計圖表制作等方面的情況,在命題中更加強調學生應用所學的統計學理論知識解決實際問題的能力,特別是考核學生針對不同資料選擇恰當統計學檢驗方法的能力,同時大部分試題需要學生在全面掌握各部分理論內容后才能做出正確解答,因此本試題更加注重學生對基礎知識的掌握和綜合應用能力??荚嚦煽?le;59、60-69、70-79、80-89、≥90分的學生分別占2.3%、20.9%、32.3%、18.6%、25.6%。
4 討論
本次教學改革在提高學生的統計學英文專業術語能力,培養區分資料分布,正確選用統計學分析方法和提高實際數據分析處理能力等方面具有較好的效果。此外,在各部分教學中貫穿統計數據的科學表示方法,規范統計圖表的制作,對培養學生撰寫科研論文具有重要的作用。
雖然在教學中充分利用現有的教學資源,如使用多媒體課件進行教學,每次上課前在電腦中安裝spss軟件以實現在課堂上為學生展示數據庫的形式,演示實例的數據分析過程,并使學生參與實際操作并解釋分析結果,但是由于課程的教學時間短,僅為48學時,并且在教學大綱中沒有安排實習的課時,還不能更好地為學生提供實際統計學分析的練習條件。建議今后應增加學時數,并修改教學大綱,將統計學上機實習內容納入到教學當中,使學生從原始資料的錄入、整理,到統計描述、統計推斷,以及結果表示,統計結果解釋等過程得到系統的訓練,為今后完成畢業設計、撰寫畢業論文及今后進行科研工作奠定基礎。
統計學論文2000字(一):影響民族院校統計學專業回歸分析成績因素的研究論文
摘要:學習成績是評價學生素質的重要方面,也是教師檢驗教學能力、反思教學成果的重要標準。利用大連民族大學統計學專業本科生有關數據(專業基礎課成績、平時成績和回歸分析期末成績),建立多元線性回歸模型,對影響回歸分析期末成績的因素進行深入研究,其結果對今后的教學方法改進和教學質量提高具有十分重要的指導意義。
關鍵詞:多元線性回歸;專業基礎課成績;平時成績;期末成績
為了實現教學目標,提高教學質量,有效提高學生學習成績是很有必要的。我們知道專業基礎課成績必定影響專業課成績,而且平時成績也會影響專業課成績,這兩類成績與專業課成績基本上是呈正相關的,但它們之間的關系密切程度有多大?它們之間又存在怎樣的內在聯系呢?就這些問題,本文主要選取了2016級統計專業50名學生的四門專業基礎課成績以及回歸分析的平時成績和期末成績,運用SPSS統計軟件進行分析研究,尋求回歸分析期末成績影響因素的變化規律,擬合出關系式,從而為強化學生的后續學習和提高老師的教學質量提供了有利依據。
一、數據選取
回歸分析是統計專業必修課,也是統計學中的一個非常重要的分支,它在自然科學、管理科學和社會、經濟等領域應用十分廣泛。因此研究影響統計學專業回歸分析成績的相關性是十分重要的。
選取了統計專業50名學生的專業基礎課成績(包括數學分析、高等代數、解析幾何和概率論)、回歸分析的平時成績和期末成績,結合多元線性回歸的基礎理論知識[1-2],建立多元回歸方程,進行深入研究,可以直觀、高效、科學地分析各種因素對回歸分析期末成績造成的影響。
二、建立多元線性回歸模型1及數據分析
運用SPSS統計軟件對回歸分析期末成績的影響因素進行研究,可以得到準確、科學合理的數據結果,全面分析評價學生考試成績,對教師以后的教學工作和學生的學習會有較大幫助。自變量x1表示數學分析成績,x2表示高等代數成績,x3表示解析幾何成績,x4表示概率論成績,x5表示平時成績;因變量y1表示回歸分析期末成績,根據經驗可知因變量y1和自變量xi,i=1,2,3,4,5之間大致成線性關系,可建立線性回歸模型:
(1)
線性回歸模型通常滿足以下幾個基本假設,
1.隨機誤差項具有零均值和等方差,即
(2)
這個假定通常稱為高斯-馬爾柯夫條件。
2.正態分布假定條件
由多元正態分布的性質和上述假定可知,隨機變量y1服從n維正態分布。
從表1描述性統計表中可看到各變量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的標準差分別為10.847,11.531,8.929,9.018,9.221,y1的標準差為8.141;有效樣本量n=50。
回歸分析期末成績y1的多元回歸模型1為:
y1=-5.254+0.221x1-0.4x2+0.154x3
+0.334x4+0.347x5
從表2中可以看到各變量的|t|值,在給定顯著水平?琢=0.05的情況下,通過t分布表可以查出,自由度為44的臨界值t?琢/2(44)=2.015,由于高等代數x2的|t|值為0.651小于t?琢/2(44),因此x2對y1的影響不顯著,其他自變量對y1都是線性顯著的。下面利用后退法[3]剔除自變量x2。
三、后退法建立多元線性回歸模型2及數據分析
從模型1中剔除了x2變量,多元回歸模型2為:
y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)
在表4中,F統計量為90.326,在給定顯著水平?琢=0.05的情況下,查F分布表可得,自由度為p=4和n-p-1=45的臨界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自變量的|t|值都大于t?琢/2(45)=2.014,因此,多元回歸模型2的線性關系是顯著的。
四、結束語
通過對上述模型進行分析,即各個自變量對因變量的邊際影響,可以得到以下結論:在保持其他條件不變的情況下,當數學分析成績提高一分,則回歸分析成績可提高0.242分[4-5];同理,當解析幾何成績、概率論成績和平時成績每提高一分,則回歸分析成績分別提高0.149分、0.377分和0.293分。
通過對學生專業基礎課成績、平時成績與回歸分析期末成績之間相關關系的研究,一方面有利于教師把控回歸分析教學課堂,提高教師意識,注重專業基礎課教學的重要性,同時,當學生平時成績不好時,隨時調整教學進度提高學生平時學習能力;另一方面使學生認識到,為了更好地掌握回歸分析知識,應加強專業基礎課的學習,提高平時學習的積極性。因此,通過對回歸分析期末成績影響因素的研究能有效的解決教師教學和學生學習中的許多問題。
統計學畢業論文范文模板(二):大數據背景下統計學專業“數據挖掘”課程的教學探討論文
摘要:互聯網技術、物聯網技術、云計算技術的蓬勃發展,造就了一個嶄新的大數據時代,這些變化對統計學專業人才培養模式的變革起到了助推器的作用,而數據挖掘作為拓展和提升大數據分析方法與思路的應用型課程,被廣泛納入統計學本科專業人才培養方案。本文基于數據挖掘課程的特點,結合實際教學經驗,對統計學本科專業開設數據挖掘課程進行教學探討,以期達到更好的教學效果。
關鍵詞:統計學專業;數據挖掘;大數據;教學
一、引言
通常人們總結大數據有“4V”的特點:Volume(體量大),Variety(多樣性),Velocity(速度快)和Value(價值密度低)。從這樣大量、多樣化的數據中挖掘和發現內在的價值,是這個時代帶給我們的機遇與挑戰,同時對數據分析技術的要求也相應提高。傳統教學模式并不能適應和滿足學生了解數據處理和分析最新技術與方法的迫切需要。對于常常和數據打交道的統計學專業的學生來說,更是如此。
二、課程教學探討
針對統計學本科專業的學生而言,“數據挖掘”課程一般在他們三年級或者四年級所開設,他們在前期已經學習完統計學、應用回歸分析、多元統計分析、時間序列分析等課程,所以在“數據挖掘”課程的教學內容選擇上要有所取舍,同時把握好難度。不能把“數據挖掘”課程涵蓋了的所有內容不加選擇地要求學生全部掌握,對學生來說是不太現實的,需要為統計學專業本科生“個性化定制”教學內容。
(1)“數據挖掘”課程的教學應該偏重于應用,更注重培養學生解決問題的能力。因此,教學目標應該是:使學生樹立數據挖掘的思維體系,掌握數據挖掘的基本方法,提高學生的實際動手能力,為在大數據時代,進一步學習各種數據處理和定量分析工具打下必要的基礎。按照這個目標,教學內容應以數據挖掘技術的基本原理講解為主,讓學生了解和掌握各種技術和方法的來龍去脈、功能及優缺點;以算法講解為輔,由于有R語言、python等軟件,學生了解典型的算法,能用軟件把算法實現,對軟件的計算結果熟練解讀,對各種算法的改進和深入研究則不作要求,有興趣的同學可以自行課下探討。
(2)對于已經學過的內容不再詳細講解,而是側重介紹它們在數據挖掘中的功能及綜合應用。在新知識的講解過程中,注意和已學過知識的融匯貫通,既復習鞏固了原來學過的知識,同時也無形中降低了新知識的難度。比如,在數據挖掘模型評估中,把混淆矩陣、ROC曲線、誤差平方和等知識點就能和之前學過的內容有機聯系起來。
(3)結合現實數據,讓學生由“被動接收”式的學習變為“主動探究”型的學習。在講解每種方法和技術之后,增加一個或幾個案例,以加強學生對知識的理解。除了充分利用已有的國內外數據資源,還可以鼓勵學生去搜集自己感興趣的或者國家及社會大眾關注的問題進行研究,提升學生學習的成就感。
(4)充分考慮前述提到的三點,課程內容計劃安排見表1。
(5)課程的考核方式既要一定的理論性,又不能失掉實踐應用性,所以需要結合平時課堂表現、平時實驗項目完成情況和期末考試來綜合評定成績。采取期末閉卷理論考試占50%,平時實驗項目完成占40%,課堂表現占10%,這樣可以全方位的評價學生的表現。
三、教學效果評估
經過幾輪的教學實踐后,取得了如下的教學效果:
(1)學生對課程的興趣度在提升,課下也會不停地去思考數據挖掘有關的方法和技巧,發現問題后會一起交流與討論。
(2)在大學生創新創業項目或者數據分析的有關競賽中,選用數據挖掘方法的人數也越來越多,部分同學的成果還能在期刊上正式發表,有的同學還能在競賽中取得優秀的成績。
(3)統計學專業本科生畢業論文的選題中利用數據挖掘有關方法來完成的論文越來越多,論文的完成質量也在不斷提高。
(4)本科畢業生的就業崗位中從事數據挖掘工作的人數有所提高,說明滿足企業需求技能的人數在增加。繼續深造的畢業生選擇數據挖掘研究方向的人數也在逐漸增多,表明學生的學習興趣得以激發。
教學實踐結果表明,通過數據挖掘課程的學習,可以讓學生在掌握理論知識的基礎上,進一步提升分析問題和解決實際問題的能力。
《統計學》作為經濟管理各專業的一門專業基礎課程,是教育部規定的經管類專業十門核心課程之一,主要講授基本統計理論,為經濟研究提供資料調查與整理、統計定量分析方法,以揭示經濟現象的統計規律性。作為一門方法論學科,統計學具有應用性、實踐性特點。近年來,《統計學》實踐教學越來越受重視,實踐教學學時數不斷增加,越來越多的教師及管理人員意識到《統計學》實踐教學在培養學生分析解決本文由收集整理問題能力方面的重要性,紛紛進行實踐教學改革。
1 《統計學》實踐教學中存在的主要問題
1.1 實踐教學體系不完善
我國大學一般是以學科—專業—課程路徑來設置專業與設計大學課程,從學科邏輯出發制定相應的人才培養方案,將學科體系和專業知識以課程形式呈現并傳授給學生。當前,我國大學各專業人才培養方案仍以理論課為主,實踐教學所占比例一般不足20%,實踐教學體系不完善。受人才培養方案總學分限制,《統計學》課時安排多為48學時,課程教學內容較多課時又不夠情況下,教師只好壓縮實踐教學學時。其次,許多高校教師使用的多是偏重理論講解的教材,鮮有配備專門實踐教學教材;教學大綱的編寫多針對理論課,對實踐教學的描述較為簡略,客觀上導致《統計學》課程理論教學與實踐教學脫節,難以銜接,教學效果差強人意。
1.2 缺乏有效的實踐教學考核方式
目前大部分高?!督y計學》授課教師采用綜合成績來評定學生成績,期末考試成績占總成績的權重多為70%,平時成績(一般指出勤率、課后練習題完成情況、課堂問答等占20%左右)和上機課成績(一般占到10%左右)在總成績中所占比例過小。其次,期末考試多采用閉卷考試,導致學生在期末復習時死記硬背公式,漠視統計方法的應用。
1.3 學生實踐能力不足,缺乏可雇傭性
部分《統計學》任課教師思想觀念陳舊,將實踐教學理解為習題課,或者是單純的上機課,安排學生完成練習冊,或是照著書上操作步驟在計算機上簡單演示一遍,學生只知其然不知其所以然,不會運用統計學的思維和方法去分析和解決實際問題,實踐能力不足,難以將所學統計方法用于經濟現象的分析中去,缺乏可雇傭性。例如在進行統計調查時,不懂選用何種方法收集資料,如何進行概率抽樣。
2 《統計學》實踐教學設計思想
近年來,隨著高校擴招大學畢業生人數陡增,2013年將近700萬大學生畢業,相比而言就業崗位增加有限,這導致用人單位在選拔人才時特別看重學生能力,尤其是可雇傭性技能。約克(yorke,m.)認為可雇傭性即“使個人能更好地就業并使他們成功勝任所選擇職業的一組能力、理解力和個人特質”??晒蛡蛐允且粋€較為抽象的概念,為了對其進行更細致的分析,國外學者將其細化為可操作的指標—可雇傭性技能。比較有代表性的是約克(yorke,m.)等提出的usem模型,在該模型中,可雇傭性由理解力、技能、自我效能、元認知4個部分構成。
奈特(knight,p.t.)等認為可雇傭性教育應該融合進課程,而且只有整合進課程時才會得到最大程度的開發。就如何融入課程,代表性觀點有瓦倫(warren,d.)的三分法和奈特(knight,p.t.)等的五分法。瓦倫(warren,d.)認為將采用獨立式、半整合式或整合式將可雇傭性的培養融入課程。奈特(knight,p.t.)則提出將可雇傭性嵌入課程的五種方式:“將可雇傭性融入全部課程”,“將可雇傭性融入核心課程”,“在課程中融入基于工作的或者與工作相關的內容”,“在課程中設計專門的培養學生可雇傭性技能的模塊”,“與課程并行的、基于工作的或工作相關的學習”。
《統計學》作為一門實務性較強的專業基礎課程,在經濟管理類人才培養中具有十分重要的地位和意義。其實踐教學的基本出發點是立足理論、強化操作,突出應用,將對學生可雇傭技能的培養融入課程;在課程中融入基于工作的或者與工作相關的內容,充分利用現代統計分析方法解決經濟管理中的實際問題;在課程中設計專門的培養學生可雇傭性技能的模塊,強調實踐教學在學生可雇傭性技能培養方面的重要性。
3 可雇傭性視域下《統計學》實踐教學改革
3.1 完善實踐教學體系
從統計學學科邏輯出發,將學科體系和專業知識以課程實踐教學形式呈現并傳授給學生。一是適當增加《統計學》實踐教學學時,強調統計分析軟件在教學中的重要性,注重培養學生分析問題和解決問題的能力。二是針對各學校生源特點編寫專門的《統計學》實踐教材,從各學校實際出發培養學生可雇傭能力。三是完善《統計學》實踐教學大綱,強調教師對課程的理解和對有關課程專業知識的研究,并結合培養學生可雇傭性技能開發實踐教學大綱。
3.2 實踐教學環節模塊重組
依據培養學生可雇傭性原則,對實踐教學環節進行模塊重組。將《統計學》實踐環節模塊化為上機操作環節、課
題申報環節、學年論文和畢業論文環節。
《統計學》上機操作環節主要在各實驗室進行,著重于幫助學生增加理論教學環節的感性認識,利用excel、spss、sas等統計軟件對統計數據進行定量分析,提高學生動手操作能力。
課題申報環節一般在課程教學中后期進行,學生在授課教師的指導下,利用所學知識就經濟管理中感興趣的問題開展課題申報,設計調查方案、收集數據并進行統計分析,撰寫調查報告和項目報告等實踐活動,全部由學生自行完成,強調學生學習自主性,注重統計學知識的遷移性。通過課題申報環節,不僅提高了學生運用統計相關理論知識分析和解決問題的能力,而且加深了他們對統計學課程的理解,認識到統計學不是一堆復雜的公式加統計軟件,而是一種思想,是認識社會經濟現象的重要工具,從而真正建立起統計思維,并將其轉化為自身的可雇傭性技能。
學年論文和畢業論文環節。學生學習完《統計學》課程后,通過e-mail、qq、課程教學網站等多種方式和渠道與授課教師保持長期聯系,在學年論文和畢業論文寫作過程中遇到統計數據處理的問題,隨時進行咨詢,授課教師可進一步指導學生如何應用統計學知識和統計方法解決實際問題。
3.3 改革實踐教學方法
采用案例教學與參與式教學相結合方式進行教學。首先,授課教師對教學重點進行透徹解析,使學生能舉一反三。在此基礎上,結合任課教師的科研工作,編制課堂教學案例,通過案例教學使學生能夠較快地領會相關教學重點,使得本課程的應用導向、可雇傭性導向能夠真正落到實處。其次,在課題申報環節,要求學生以小組為單位進行課題申報,實踐整個數據收集、分析和解釋的過程,并通過課堂討論環節進行交流,充分調動學生學習積極性,提高分析問題和解決問題的能力,培養可雇傭性技能。
在認識實習期里,我所做的工作內容比較具體、感受和體會也比較多。下面,我僅把實習期里的主要情況做一下匯報。如有不妥之處,歡迎給予批評和指正。
一、福建省統計局科研所介紹
科研所是統計局內部的一個重要職能部門,而統計科研涉及的領域也十分廣闊,包括統計基礎理論研究、統計應用研究和統計信息技術研究。同時在政府統計工作中,對政府和社會關心的有關經濟、社會、科技、資源與環境等重大問題,都需要從統計的角度進行分析研究,得出結論,提出建議?!笆濉逼陂g,國家統計科技研究的重點是統計觀念的創新、統計方法的創新、統計手段的創新以及統計體制的創新。要積極組織、指導重大課題研究,統計科研所每年要完成一項以上具有重要影響的課題。統計雜志是展示優秀科技成果的重要窗口,是科技成果轉化為生產力的重要媒介。要加強對統計雜志的領導和支持,不斷提高雜志的質量,增加發行量,擴大影響力,努力創辦一流雜志。
科研所的主要職能有五點,具體包括:1.擬訂全省統計科研計劃和科研制度,并組織實施;2.組織協調本局及全省各地區、各部門的統計科研工作;3.承擔統計科研課題,負責向國家統計局和省直有關部門進行統計科研課題的申報立項及管理工作;4.承擔全省統計科研成果的評審、選優、獎勵工作,并推薦優秀成果參加國家和省級評獎;5.擬訂省統計學會章程,負責省統計學會日常工作,履行省統計學會秘書處的職責。
根據國務院有關文件精神,國家和各地統計科研所作為非營利性社會公益類科研機構,只能加強,不能削弱。統計科研所擔負著從事統計科學研究、進行科研管理(組織統計科技交流、課題指南、課題立項、成果評獎等)、編輯出版統計雜志等重要職能。統計局要為科研人員配備先進的計算機設備、統計分析軟件、通訊工具以及其他辦公設備;要建設內容豐富的統計科研網站等。
二、科研所認識實習的具體內容
第一天到科研所報到時,一進門,就看到書柜上排列著諸多獎章,象年度科研先進單位、統計學會先進單位等等,都是國家統計局給予福建省統計局科研所的表彰,也是對他們工作的肯定,我為自己能有幸到這里認識實習而感到驕傲。
俞明所長和所內同事對我們的到來也表示了歡迎。俞所長對我們今后幾天實習的具體工作做了安排,具體包括《福建統計》雜志的出版,統計科研網站的建設,如《國際經濟信息摘編》,統計論文出版的校對及統計學會的一些工作。在次,我也就這幾個工作做匯報。
首先,是關于論文集的校對工作,也是此次實習中的重點工作,由于這本論文集的重要性,更要求我們校對工作的嚴格,在次之前,科研所的同事已經對該論文集校對過三遍,但為了確保論文集的正確無誤,我們又進行了第四次校對工作。我也不得不為科研所里同事們認真負責的工作態度感到欽佩。首先我們學習了校對工作的基本常識,要求我們對哪怕是一個標點符號的錯誤也不能放過。校對了《區域R&D投入對經濟發展影響的研究》、《
統計報表就嚴格的編制規則,如規定表號采用一位英文字母或羅馬字母和三位數碼表示。英文字母或羅馬字母表示全局統計報表制度的排列順序,三位數碼分為兩段,第一位數碼為第一段表示統計報表的報告期別,或報表的性質,即是年報還是定報,是綜合表還是基層表;是經常性調查還是一次性調查或是普查、試行表。第二、三位數碼為第二段表示統計報表的順序。還學習了統計報表的性質代碼:1、基層年報;2、基層定報;3、綜合年報;4、綜合定報;5、一次性調查;6、普查。從中不僅學習了如何查找錯誤遺漏還懂得了如何制表。
其次,是關于科研所網站的建設,也是本次實習過程中工作時間較長的工作。我的主要工作是學會網站建設的一些基本知識,并單獨處理網站的文章錄入,信息搜集等任務。我負責的主要是“國際經濟信息摘編”的編制工作,這個項目主要包括觀點聚焦、經濟綜述]經濟比較、熱點追蹤、市場動態、行業發展動向、統計數據等七個主要項目。搜集了當今國際上經濟發展的最新動態的50余篇文章,并錄入入網,以供統計相關部門采編并出版成書。
再次,在實習期間,利用科研所書籍多的優點,閱讀了大量關于統計方面的書,如《中國統計》、《福建統計》以及諸多統計專業論文,充實了自己的理論知識,收益非淺,還了解統計學會工作的大致流程。
三、認識實習的收獲與感想
在此之先,我想向所有為我的實習提供幫助和指導的老師和科研所的領導和同事致謝,感謝你們為我的順利實習所作的努力和幫助。
通過實習,我在統計學方面獲得了一些實際的工作經驗,鞏固并檢驗了自己三年來本科學習的知識水平。實習期間,我了解并參與了統計論文集的校對工作,并且對統計科研的網站尋找了資料,提出了自己的一些想法。在此期間,我進一步學習了統計學的理論知識體系,對統計有了更深的理解,將理論與實踐有機結合起來。我的工作得到了實習單位充分的肯定和較好的評價。
本次認識實習是我大學生活中不可或缺的重要經歷,其收獲和意義可見一斑。首先,我可以將自己所學的知識應用于實際的工作中,理論和實際是不可分的,在實踐中我的知識得到了鞏固,解決問題的能力也受到了鍛煉;其次,本次實習開闊了我的視野,使我對統計在現實中的運作有所了解,也對統計也有了進一步的掌握;此外,我還學習了統計科研網站的制作及為網站建設搜集材,可以和同事在一起相互交流,相互促進。
在實習過程中還有些其它方面也讓我學到了很多東西。在兩個星期的實習時間里,我基本上掌握了統計科研工作的一些具體操作細節,知道統計科技工作是一項具有創造性的活動,要出一流成果,就必須要有專業的統計人才和認真嚴肅的工作態度。在實踐的校對工作中,知道一絲不茍的真正內涵。
一、選題
選題是論文寫作關鍵的第一步,直接關系論文的質量。
常言說:“題好文一半”。對于臨床護理人員來說,選擇論文題目要注意以下幾點:(1)要結合學習與工作實際,根據自己所熟悉的專業和研究興趣,適當選擇有理論和實踐意義的課題;(2)選題宜小不宜大,只要在學術的某一領域或某一點上,有自己的一得之見,或成功的經驗.或失敗的教訓,或新的觀點和認識,言之有物,讀之有益,就可以作為選題;(3)選題時要查看文獻資料,既可了解別人對這個問題的研究達到什么程度,也可以借鑒人家對這個問題的研究成果。
需要指出,選題與論文的標題既有關系又不是一回事。標題是在選題基礎上擬定的,是選題的高度概括,但選題及寫作不應受標題的限制,有時在寫作過程中,選題未變,標題卻幾經修改變動。
二、設計
設計是在選題確定之后,進一步提出問題并計劃出解決問題的初步方案,以便使科研和寫作順利進行。護理論文設計應包括以下幾方面:(1)專業設計:是根據選題的需要及現有的技術條件所提出的研究方案;(2)統計學設計:是運用衛生統計學的方法所提出的統計學處理方案,這種設計對含有實驗對比樣本的護理論文的寫作尤為重要;(
3)寫作設計:是為擬定提綱與執筆寫作所考慮的初步方案??傊O計是護理科研和論文寫作的藍圖,沒有“藍圖”就無法工作。
三、實驗與觀察
從事基礎或臨床護理科學研究與撰寫論文,進行必要的動物實驗或臨床觀察是極重要的一步,既是獲得客觀結果以引出正確結論的基本過程,也是積累論文資料準備寫作的重要途徑。實驗是根據研究目的,利用各種物質手段(實驗儀器、動物等),探索客觀規律的方法;觀察則是為了揭示現象背后的原因及其規律而有意識地對自然現象加以考察。二者的主要作用都在于搜集科學事實,獲得科研的感性材料,發展和檢驗科學理論。二者的區別在于“觀察是搜集自然現象所提供的東酉,而實驗則是從自然現象中提取它所愿望的東西?!?巴甫洛夫語)因此,不管進行動物實驗還是臨床觀察,都要詳細認真.以各種事實為依據,并在工作中做好各種記錄。
有些護理論文的撰寫并不一定要進行動物實驗或臨床觀察,如護理管理論文或護理綜述等,但必要的社會實踐活動仍是不可缺少的,只有將實踐中得來的素材上升到理論,才有可能獲得有價值的成果。
四、資料搜集與處理
資料是構成論文的基礎。在確定選題、進行設計以
及必要的觀察與實驗之后,做好資料的搜集與處理工作,是為論文寫作所做的進一步準備。
論文資料可分為第一手資料與第二手資料兩類。前者也稱為第一性資料或直接資料,是指作者親自參與調查、研究或體察到的東西,如在實驗或觀察中所做的記錄等,都屬于這類資料;后者也稱為第二性資料或間接資料,是指有關專業或專題文獻資料,主要靠平時的學習積累。在獲得足夠資料的基礎上,還要進行加工處理,使之系統化和條理化,便于應用。對于論文寫作來說,這兩類資料都是必不可少的,要恰當地將它們運用到論文寫作中去,注意區別主次,特別對于文獻資料要在充分消化吸收的基礎上適當引用,不要喧賓奪主。對于第一手資料的運用也要做到真實、準確、無誤。