- 相關推薦
2019新形勢下本科數據挖掘課程教學的反思與改革論文
隨著互聯網技術的迅速發展,尤其移動互聯網的爆發性發展,越來越多的公司憑借其備受歡迎的系統和APP如雨后春筍般發展起來,如滴滴打車、共享單車等。海量數據自此不再是Google等大公司的專利,越來越多的中小型企業也可以擁有海量數據。如何從浩如煙海的數據中挖掘出令人感興趣和有用的知識,成為越來越多的公司急需解決的問題。因此,他們對數據挖掘分析師求賢若渴。在這一社會需求下,培養出優秀的數據挖掘分析師,是各個高校目前急需完成的一項任務。
一、教學現狀反思
目前,各大高等院校本科階段爭相開設數據挖掘課程。然而,該課程是一門相對較新的交叉學科,涵蓋了概率統計、機器學習、數據庫等學科的知識內容,難度較大。因此,大部分高校一般將此課程開設在研究生階段,在本科生中開設此課程的學校相對較少。另外,不同的學校將其歸入不同的專業中,如計算機專業、信息管理專業、統計學、醫學等。可以說,這一課程基本上處于探索的過程中。我院災害信息系于2013年在信息管理與信息系統本科學生中首次開設了該課程。通過開設此課程,學生能夠掌握數據挖掘的基本原理和各種挖掘算法等,掌握數據分析和處理、高級數據庫編程等技能,達到數據聚類、分類、關聯分析的目的。然而,通過前期教學過程,我們發現教學效果不理想,存在很多問題。
1.數據內驅力差
以往數據挖掘課程重點講授數據挖掘算法,對數據源的獲取和處理極少獲取。目前各大教材都在使用一些公共數據資源,這些數據資源有些已經非常陳舊了,比如20世紀80年代的加州房價數據。這些數據脫離現實,分析這些數據,學生沒有任何興趣和學習動力,也就無法發現價值。
2.過于強調學習數據挖掘理論及算法的學習
大量具有難度的數據挖掘算法的學習,使學生喪失了學習興趣,學完即忘,不知所用。
3.忽視對數據預處理過程的學習
以往所使用的公共數據源或軟件自帶數據源,數據量小,需要的預處理工作比較少;這部分內容基本只安排一次理論課、一次實驗課。而實際通過爬蟲獲取的數據源數據量大;這部分工作量比較大,需要占到整個數據挖掘工作量的一半以上。因此,一次理論課和一次實驗課是無法讓學生掌握數據預處理技能的。
4.算法編程實現難度較大
要求學生學習一門新的編程語言,如R語言、Python語言,對本科非計算機專業的學生來說難度是非常大的,尤其是課時安排只有48課時。
5.數據挖掘分析及應用技能較差
學生能夠理解課堂案例,但在實際應用中,無法完成整個數據分析流程。
二、數據挖掘課程改革
該課程的教學對象是信息管理與信息系統專業本科大四學生。因此,培養實際應用人才,使其完成整個實際數據挖掘分析流程是教師的教學目的。筆者對智聯招聘、中華英才網、51job等幾個大型招聘網站的幾百個數據挖掘分析師相關職位進行分析,主要分析了相關職位的工作內容、職位要求以及需求企業。數據分析師主要利用數據挖掘工具對運營數據等多種數據源進行預處理、建模、挖掘、分析及優化。該職位是受業務驅動的,特點是將現有數據與業務相結合,最大程度地變現數據價值。該職位對計算機編程等相關技術不作要求,但是需要有深厚的數據挖掘理論基礎,熟練使用主流的數據挖掘(或統計分析)工具。基于此,教師可以采取以下策略進行教學改革。
1.加強對業務數據的理解
數據挖掘分析師是受業務驅動的,所以要理解實際業務,明確本次數據挖掘要解決什么問題。教師可以構建案例庫,包括教師案例庫、學生討論案例庫。教師案例庫由教師構建,可用于課堂講授。學生案例庫由學生分組構建,并安排討論課,由學生講述、討論并提交報告。
2.加強對數據的獲取
對學生感興趣的數據源進行挖掘,這樣才能更好地幫助學生理解吸收知識。因此,可以教授學生爬蟲技術,編寫爬蟲程序,使其自主獲取感興趣的數據。
3.加強對數據的預處理工作
在數據挖掘之前使用數據預處理技術,能夠顯著提高數據挖掘模式的質量,降低實際挖掘所需要的時間,應將其作為整門課程的重點進行學習。增加理論課程和實驗課時,使學生掌握數據清理、數據集成、數據變換、數據歸納等數據預處理技術,并能夠應對各種復雜數據源,最終利用爬蟲程序獲取的各種數據源進行預處理工作。
4.強化數據挖掘分析
教師可以選擇SPSS Modeler這款所見即所得的數據挖掘軟件作為配套實驗平臺。該軟件具有必需的數據預處理工具及預設的挖掘算法,學生可以把注意力放在要挖掘的數據及相關需求上,設定挖掘的主題,然后通過鼠標的點擊拖拉即可完成相關主題的數據挖掘過程。學生最終可對自己獲取并已處理過的數據進行挖掘分析。
5.加強教師外出培訓學習
數據挖掘技術以及大數據技術是近來比較新穎而且發展迅速的技術。教師長期身處三尺講臺之上,遠離了新技術,脫離了實際。因此,需派遣教師到知名高校學習數據挖掘教學技術,到培訓機構進行系統學習,到企業進行實戰學習。
基于以上分析,形成了新的數據挖掘理論課程內容和實踐課程內容,安排如表1和表2所示。共安排48學時,其中理論課24學時,實驗課24學時。理論課重點講授數據的獲取、數據的理解、數據的預處理以及常用挖掘算法。實驗課重點學習基于SPSS modeler的數據挖掘,對理論課的內容進行實踐。整個學習以工程項目為載體,該工程貫穿整個學習過程。學生通過爬蟲程序獲取自己感興趣的數據源,根據課程進度,逐步完成后續數據的理解,再進行預處理,建模分析,評估整個過程。在課程結束時,完成整個項目,并提交報告。
三、結論
在數字時代,越來越多的企業急需數據挖掘分析人才。教師應以培養實際應用人才為目的,充分培養學生對數據挖掘的學習興趣,以工程項目為載體,貫穿整個課程周期。在教學中,打牢數據獲取、理解預處理這一基石,加強建模挖掘分析,弱化對晦澀算法的編程學習,使學生真正掌握數據挖掘技術,滿足社會需求。
參考文獻:
[1]李海林.大數據環境下的數據挖掘課程教學探索[J].計算機時代,2014(2):54-55.
[2]宋威,李晉宏.項目驅動的數據挖掘教學模式探討[J].中國電力教育,2011(27):116-177.
[3]徐琴.應用型本科數據挖掘技術課程教學探討與實踐[J].電腦知識與技術,2016,12(8):148-149.
[4]李姍姍,李忠.就業需求驅動下的本科院校數據挖掘課程內容體系探討[J].計算機時代,2015(2):60-61.
【新形勢下本科數據挖掘課程教學的反思與改革論文】相關文章:
新形勢下高校計算機課程教學改革論文10-10
復雜網絡數據挖掘論文11-15
淺談應用型本科院校VF數據庫課程教學改革研究初探教育論文10-12
數據挖掘在電子商務的應用論文10-09
新課程改革下的小學數學教學論文10-10
應用型本科院校機器人課程改革論文10-12
Hadoop物聯網數據挖掘的算法分析論文10-10
電子商務課程改革的論文10-09