婷婷五月日韩av永久免费,国产精品日本一区,久久久久久国产精品mv,老色鬼欧美精品

職稱論文咨詢網(wǎng),專業(yè)提供留學(xué)生論文、職稱發(fā)表論文等各類論文學(xué)術(shù)咨詢服務(wù)的論文網(wǎng)站。

當(dāng)前位置:首頁(yè) > 論文百科

利用二元邏輯回歸模型分析MOOC學(xué)生退課情況預(yù)測(cè)-經(jīng)濟(jì)職稱論文發(fā)表范文

來(lái)源:職稱論文咨詢網(wǎng)發(fā)布時(shí)間:2022-06-05 21:22:55
MOOC作為一種新的教學(xué)模式正在快速發(fā)展中,但是學(xué)員退課率卻非常高,這對(duì)于 MOOC教師及這個(gè)平臺(tái)的發(fā)展非常不利。下面以學(xué)堂在線平臺(tái)學(xué)員的學(xué)習(xí)行為數(shù)據(jù)為基礎(chǔ),對(duì)影響退課的因素進(jìn)行分析,為了避免多重指標(biāo)帶來(lái)的共線問(wèn)題,根據(jù)較少的原則選擇五種學(xué)習(xí)行為。在文章結(jié)尾采用二元邏輯回歸模型進(jìn)行建模并預(yù)測(cè)學(xué)員的退課情況,選取的五種學(xué)習(xí)行為對(duì)退課影響明顯,預(yù)測(cè)準(zhǔn)確率較高。本研究為MOOC教師盡早采取教學(xué)干預(yù)提供了一定的理論依據(jù)。   關(guān)鍵詞: MOOC,學(xué)習(xí)行為,相關(guān)性分析,二元邏輯回歸, 退課預(yù)測(cè)   MOOC(Massive Open Online Courses),大型開(kāi)放式網(wǎng)絡(luò)課程,簡(jiǎn)稱“慕課”,是近幾年由美國(guó)一些著名大學(xué)發(fā)起的網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)。與傳統(tǒng)的課堂學(xué)習(xí)相比,MOOC具有如下特點(diǎn):①采用各種社交網(wǎng)絡(luò)工具,形式多樣化;②課程的學(xué)習(xí)不受空間和時(shí)間的限制;③課程對(duì)學(xué)員的學(xué)歷沒(méi)有任何限制;④更強(qiáng)調(diào)學(xué)員的學(xué)習(xí)自主性。   目前對(duì)MOOC的研究基本可以歸結(jié)為三類。  ?、?通過(guò)分析學(xué)習(xí)行為發(fā)現(xiàn)規(guī)律,改善MOOC教學(xué)活動(dòng)以及評(píng)價(jià)體系。   Yousef等通過(guò)對(duì)在線課程、遠(yuǎn)程課程和MOOC的相關(guān)文獻(xiàn)分析,提出了一套包含75個(gè)評(píng)價(jià)指標(biāo)的MOOC質(zhì)量保障標(biāo)準(zhǔn)[1]。童小素等在借鑒已有評(píng)價(jià)規(guī)范的基礎(chǔ)上,采用文獻(xiàn)調(diào)研法和專家訪談法,建立了一套質(zhì)量評(píng)價(jià)指標(biāo)體系,其中包括3個(gè)一級(jí)指標(biāo)和26個(gè)二級(jí)指標(biāo)[2]。秦瑾若等通過(guò)MOOC與傳統(tǒng)網(wǎng)絡(luò)課程教學(xué)活動(dòng)的對(duì)比,提出基于深度學(xué)習(xí)理論的MOOC學(xué)習(xí)活動(dòng)設(shè)計(jì),并將其應(yīng)用于“現(xiàn)代教育技術(shù)”課程中[3]。樊超等從人類動(dòng)力學(xué)的角度對(duì)MOOC在線學(xué)習(xí)行為進(jìn)行分析發(fā)現(xiàn),用戶的選課量和選課人數(shù)存在很大差異,在線學(xué)習(xí)具有陣發(fā)和重尾的特征,以及在線學(xué)習(xí)時(shí)間和次數(shù)服從冪律分布[4]。  ?、?通過(guò)對(duì)學(xué)習(xí)行為進(jìn)行統(tǒng)計(jì)分析,進(jìn)而提出整改意見(jiàn)。   李帥等以東北大學(xué)MOOC平臺(tái)上的《高級(jí)語(yǔ)言課程設(shè)計(jì)》課程為數(shù)據(jù)集,對(duì)學(xué)生的知識(shí)點(diǎn)學(xué)習(xí)情況、在網(wǎng)站上的逗留時(shí)間以及觀看視頻的行為動(dòng)作(快進(jìn)/退、全屏、跳轉(zhuǎn)課程、暫停、滾動(dòng)條滾動(dòng)、文本模塊間跳轉(zhuǎn))進(jìn)行了統(tǒng)計(jì)分析[5]。吳江等分別從選課、退課、課程參與和成績(jī)四個(gè)方面對(duì)愛(ài)課程網(wǎng)絡(luò)平臺(tái)上的一門課程的學(xué)習(xí)者行為進(jìn)行統(tǒng)計(jì)分析[6]。王萍等基于edX平臺(tái)的數(shù)據(jù)集,采用統(tǒng)計(jì)分析方法,對(duì)學(xué)習(xí)者類型、特征、行為進(jìn)行分析研究[7]。徐舜平等借鑒數(shù)據(jù)挖掘中的回歸分析方法,對(duì)“學(xué)堂在線”平臺(tái)的一門課程“電路原理”學(xué)習(xí)行為數(shù)據(jù)進(jìn)行研究[8]。  ?、?通過(guò)對(duì)學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系進(jìn)行分析,建立模型對(duì)學(xué)習(xí)效果進(jìn)行預(yù)測(cè)。   蔣卓軒等針對(duì)北京大學(xué)在Coursera上開(kāi)設(shè)的6門慕課,通過(guò)分析學(xué)習(xí)行為特點(diǎn)將學(xué)習(xí)者進(jìn)行分類,并通過(guò)學(xué)習(xí)者的若干典型行為特征對(duì)學(xué)習(xí)成果進(jìn)行預(yù)測(cè)[9]。伍杰華等以edX在線學(xué)習(xí)網(wǎng)站上2012-2013年學(xué)生學(xué)習(xí)的信息為基礎(chǔ),對(duì)學(xué)習(xí)者的性別、學(xué)歷、國(guó)籍、課程交互次數(shù)、課程訪問(wèn)天數(shù)、播放視頻次數(shù)、學(xué)習(xí)章節(jié)數(shù)做了統(tǒng)計(jì)分析,最后采用機(jī)器學(xué)習(xí)的SVM和KNN算法進(jìn)行建模并對(duì)完課率進(jìn)行了預(yù)測(cè)[10]。李曼麗等以“學(xué)堂在線”平臺(tái)的一門課程的學(xué)習(xí)數(shù)據(jù)為基礎(chǔ),采用Tobit和Logit兩個(gè)定量分析模型,分別對(duì)MOOC學(xué)習(xí)者的課程參與和完成情況進(jìn)行深入分析[11]。Jiang, S.等以學(xué)習(xí)者第一周的MOOC完成課后作業(yè)和在線討論為研究對(duì)象,采用邏輯回歸方法預(yù)測(cè)學(xué)習(xí)者獲得證書的概率[12]。   綜上所述,目前關(guān)于學(xué)習(xí)行為對(duì)退課影響的研究比較少, MOOC較高的退課率嚴(yán)重影響了MOOC的持續(xù)發(fā)展。本文試圖通過(guò)分析學(xué)員的七種學(xué)習(xí)行為與退課的關(guān)系,采用二元邏輯回歸模型對(duì)學(xué)員的退課進(jìn)行預(yù)測(cè),為MOOC的教學(xué)改革提供一定的理論依據(jù)。   1 邏輯回歸模型   邏輯回歸模型是機(jī)器學(xué)習(xí)中一種重要的分類模型,由于其算法簡(jiǎn)單、高效且容易被推廣而被廣泛應(yīng)用。例如預(yù)測(cè)用戶點(diǎn)擊某商品后是否會(huì)購(gòu)買,預(yù)測(cè)學(xué)生成績(jī)及格與否等。這些都屬于二分類問(wèn)題。除此之外,邏輯回歸也被推廣至多類的分類問(wèn)題。本文主要研究MOOC的學(xué)員是否會(huì)退課,故選擇邏輯回歸模型的二元邏輯回歸方法。   一般地,線性回歸函數(shù)為:y=f(x)=θTX,其中X=(x1,x2,…,xm)T為樣本點(diǎn),θ=(θ1,θ2,…,θm)T為參數(shù)向量。函數(shù)是樣本X的各個(gè)屬性的線性組合,參數(shù)θ表示了X中各個(gè)屬性對(duì)結(jié)果的影響程度。   二元邏輯回歸模型可以表示為:,其中y∈{0,1},。決策函數(shù)為:。   為了找到參數(shù)θ,可以采用最大似然估計(jì),即使得最大。   2 實(shí)例研究   本文選取“學(xué)堂在線”MOOC平臺(tái)的學(xué)員學(xué)習(xí)記錄(包括選課記錄和行為記錄)為數(shù)據(jù)集,采用二元邏輯回歸模型對(duì)學(xué)員的退課情況進(jìn)行分析,并對(duì)退課進(jìn)行預(yù)測(cè)。   2.1 MOOC數(shù)據(jù)描述   “學(xué)堂在線”MOOC平臺(tái)于2013年10月10日正式向全球發(fā)布,是教育部在線教育研究中心的研究交流和成果應(yīng)用平臺(tái)。本文采用的數(shù)據(jù)集為“學(xué)堂在線”為KDD-2015 CUP競(jìng)賽提供的公開(kāi)數(shù)據(jù)。   數(shù)據(jù)記錄了2013年10月27日至2014年8月1日“學(xué)堂在線”MOOC平臺(tái)的部分學(xué)員的選課記錄和行為記錄,其中包括112,448名學(xué)員、39門課程、200,905人次選課記錄和13,545,124條行為記錄,且每個(gè)學(xué)員至少選修過(guò)一門課程。   其中,行為記錄包括七種學(xué)習(xí)行為:完成課后作業(yè)(problem)、觀看課程視頻(video)、訪問(wèn)課程內(nèi)容(access)、訪問(wèn)課程wiki(wiki)、參與課程論壇討論(discussion)、訪問(wèn)課程其他部分(navigation)和關(guān)閉網(wǎng)頁(yè)(page_close)。為了研究七種不同學(xué)習(xí)行為對(duì)退課的影響,本文對(duì)每個(gè)學(xué)員在整個(gè)學(xué)習(xí)期間的七種學(xué)習(xí)行為分別進(jìn)行匯總,得到每個(gè)學(xué)員每種行為的總次數(shù),分別記為:X1、X2、X3、X4、X5、X6和X7。   2.2 變量選擇   首先研究不同學(xué)習(xí)行為與退課(1表示退課,0表示繼續(xù)學(xué)習(xí))的線性相關(guān)性。七種學(xué)習(xí)行為與退課的皮爾遜積矩相關(guān)系數(shù)如表1所示。   從表1可以看出,七種學(xué)習(xí)行為與退課的相關(guān)系數(shù)都是負(fù)數(shù),即學(xué)習(xí)行為發(fā)生的總次數(shù)越多,退課率越低,與實(shí)際情況相符。按相關(guān)系數(shù)的絕對(duì)值進(jìn)行排序,X4(wiki)和X5(discussion)與退課相關(guān)性最小,說(shuō)明訪問(wèn)課程wiki和參與論壇討論對(duì)退課影響較小。   其次,為了避免變量之間的多重共線性問(wèn)題,本文對(duì)七種學(xué)習(xí)行為兩兩計(jì)算皮爾遜積矩相關(guān)系數(shù),將相關(guān)系數(shù)≥0.8認(rèn)定為高度相關(guān)的變量,應(yīng)將高度相關(guān)的一對(duì)變量中的一個(gè)予以排除。七種學(xué)習(xí)行為之間的皮爾遜積矩相關(guān)系數(shù)如表2所示。   從表2可以看出,X2(video)和X3(access)之間的相關(guān)系數(shù)為0.81,因?yàn)橛^看課程視頻可能會(huì)涉及課程內(nèi)容,如觀看課程視頻與閱讀教材相結(jié)合,所以觀看視頻越多,訪問(wèn)課程內(nèi)容也會(huì)越多。X2(video)和X7(page_close)之間的相關(guān)系數(shù)為0.82,因?yàn)橛^看課程視頻與關(guān)閉網(wǎng)頁(yè)高度相關(guān),課程視頻位于一個(gè)網(wǎng)頁(yè)上,觀看完視頻會(huì)關(guān)閉網(wǎng)頁(yè),所以觀看視頻越多,關(guān)閉網(wǎng)頁(yè)自然越多。   這里我們排除X3(access)和X7(page_close)這兩個(gè)變量,下一節(jié)我們將選取X1(problem)、X2(video)、X4(wiki)、X5(discussion)和X6(navigation)這五個(gè)變量(學(xué)習(xí)行為)對(duì)退課進(jìn)行建模。   2.3 預(yù)測(cè)模型建立   本文采用二元邏輯回歸模型,預(yù)測(cè)MOOC學(xué)員的退課情況。假設(shè)P(P∈[0,1])為學(xué)員的退課率,則(1-P)為不退課率。P/(1-P)為學(xué)員退課的邏輯回歸比,對(duì)其取自然對(duì)數(shù)為ln[P/(1-P)]。   假設(shè)自變量為Z1(problem)、Z2(video)、Z3(wiki)、Z4(discussion)和Z5(navigation),因變量為P,則邏輯線性回歸方程為:,其中θi(i=0,1,2,3,4,5)為邏輯回歸系數(shù)。則根據(jù)上式可得,學(xué)員退課發(fā)生的概率為:。根據(jù)決策函數(shù)(見(jiàn)1.邏輯回歸模型)可知,當(dāng)P>0.5時(shí),預(yù)測(cè)為學(xué)員退課(結(jié)果為1);否則,預(yù)測(cè)為學(xué)員不退課(結(jié)果為0)。   2.4 預(yù)測(cè)結(jié)果   為了評(píng)價(jià)二元邏輯回歸模型對(duì)MOOC退課的預(yù)測(cè)性能,本文采用的評(píng)價(jià)指標(biāo)有準(zhǔn)確率(accuracy)、查準(zhǔn)率(precision)、查全率(recall)、F1和AUC。   為了計(jì)算指標(biāo)值,本文引入二分類混淆矩陣。即把退課(1)作為正類,不退課(0)作為負(fù)類。則分類結(jié)果的混淆矩陣如表3所示。   從表4可以看出,盡管MOOC數(shù)據(jù)集存在類別偏斜的情況,即正例與負(fù)例的數(shù)量之比為95581:24961,但accuray仍然達(dá)到了0.84。同時(shí),precision值與recall值比較接近,所以F1值較接近最大值,說(shuō)明二元邏輯回歸模型較好地對(duì)MOOC的退課情況進(jìn)行了預(yù)測(cè)。   為了評(píng)價(jià)預(yù)測(cè)模型的泛化能力,本文引入ROC曲線。ROC曲線的橫坐標(biāo)為假正例率、縱坐標(biāo)為真正例率。ROC曲線下面積(AUC)的大小決定了模型的泛化能力,AUC越大說(shuō)明模型的泛化能力越強(qiáng)。   從圖1可以看出,實(shí)線即為二元邏輯回歸模型的ROC曲線(AUC=0.78,即陰影區(qū)域面積),虛線為隨機(jī)模型對(duì)應(yīng)的ROC曲線(AUC=0.5,即虛線下方區(qū)域面積)。由于0.78>0.5,說(shuō)明二元邏輯回歸模型較好地預(yù)測(cè)了實(shí)例。同時(shí)也說(shuō)明了本文選取的五個(gè)變量(學(xué)習(xí)行為)是比較合適的,它們較好地反映了數(shù)據(jù)集的特征。   3 總結(jié)與討論   本文研究七種不同學(xué)習(xí)行為對(duì)退課的影響,通過(guò)相關(guān)分析,選擇其中對(duì)退課影響最顯著的五種,然后建立預(yù)測(cè)模型——二元邏輯回歸模型并對(duì)退課情況作出預(yù)測(cè)。在這五種學(xué)習(xí)行為中,①訪問(wèn)課程的其他部分(navigation)、觀看課程視頻(video)以及完成課后作業(yè)(problem)對(duì)退課影響最大??梢酝茢啵暾麑W(xué)完一門課程,除了觀看課程視頻,還要做課后作業(yè),以及參考課程的其他內(nèi)容。為了提高課程的完課率,MOOC平臺(tái)可以針對(duì)觀看視頻次數(shù)少,完成課后作業(yè)少的學(xué)員實(shí)施教學(xué)干預(yù)。②參與課程論壇討論(discussion)對(duì)退課影響較小,原因可能是MOOC平臺(tái)提供的是文字形式的討論方式,不利于有效交流與溝通。為此,MOOC平臺(tái)可以設(shè)置視頻或語(yǔ)音形式的討論模式。   本文的不足之處是,MOOC數(shù)據(jù)集對(duì)學(xué)員以及課程信息進(jìn)行隱藏,使得本文無(wú)法深入理解學(xué)員的不同學(xué)習(xí)行為對(duì)課程退課的影響以及影響程度。今后將選取不同MOOC學(xué)習(xí)平臺(tái)以及多學(xué)科課程數(shù)據(jù)作為研究對(duì)象,探索學(xué)習(xí)行為對(duì)不同學(xué)科課程退課情況的影響,為MOOC教學(xué)干預(yù)提供借鑒和參考。   參考文獻(xiàn)(References):   [1] Yousef A M F, Chatti M A, Schroeder U, et al. What Drives   a Successful MOOC? An Empirical Examination of Criteria to Assure Design Quality of MOOCs[C]// IEEE, International Conference on Advanced Learning Technologies. IEEE,2014:44-48   [2] 童小素,賈小軍.MOOC質(zhì)量評(píng)價(jià)體系的構(gòu)建探究[J].中國(guó)遠(yuǎn)   程教育:綜合版,2017.5:63-71   [3] 秦瑾若,傅鋼善.基于深度學(xué)習(xí)理論的MOOC學(xué)習(xí)活動(dòng)設(shè)計(jì)   ——以“現(xiàn)代教育技術(shù)”課程為例[J].現(xiàn)代教育技術(shù),2017.5:12-18   [4] 樊超,宗利永.MOOC在線學(xué)習(xí)行為的人類動(dòng)力學(xué)分析[J].開(kāi)   放教育研究,2016.22(2):53-58   [5] 李帥,張巖峰,于戈等.MOOC平臺(tái)學(xué)習(xí)行為數(shù)據(jù)的采集與分   析[J].中國(guó)科技論文,2015.20:2373-2376   [6] 吳江,馬磐昊.MOOC學(xué)習(xí)者行為分析研究——以愛(ài)課程平   臺(tái)的一門慕課為例[J].知識(shí)管理論壇,2015.3.   [7] 王萍.基于edX開(kāi)放數(shù)據(jù)的學(xué)習(xí)者學(xué)習(xí)分析[J].現(xiàn)代教育技   術(shù),2015.25(4):86-93   [8] 徐舜平,趙慶剛,許健等.基于數(shù)據(jù)挖掘的MOOC學(xué)習(xí)過(guò)程監(jiān)   測(cè)指標(biāo)分析——以“電路原理”課程為例[J]. 現(xiàn)代教育技術(shù),2017.27(3):119-126   [9] 蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)   測(cè)[J].計(jì)算機(jī)研究與發(fā)展,2015.52(3):614-628   [10] 伍杰華,付慧平.MOOC學(xué)習(xí)行為的統(tǒng)計(jì)、預(yù)測(cè)與展望[J].工業(yè)和信息化教育,2017.2:81-89   相關(guān)閱讀:高級(jí)統(tǒng)計(jì)師需要發(fā)表幾篇論文啊   統(tǒng)計(jì)專業(yè)職稱分類主要有三級(jí):初級(jí)(助理統(tǒng)計(jì)師、統(tǒng)計(jì)員);中級(jí)(統(tǒng)計(jì)師);高級(jí)(高級(jí)統(tǒng)計(jì)師),高級(jí)統(tǒng)計(jì)師是通過(guò)考評(píng)結(jié)合的方式才能入選高級(jí)職稱,獲得高級(jí)統(tǒng)計(jì)師的人會(huì)由省級(jí)人事部門頒發(fā)證書,那么高級(jí)統(tǒng)計(jì)師需要發(fā)表幾篇論文呢?
相關(guān)閱讀
學(xué)術(shù)咨詢服務(wù)
?
海阳市| 彩票| 安顺市| 曲阳县| 长垣县| 中方县| 祁阳县| 宁武县| 苍梧县| 广平县| 安乡县| 滦平县| 丹江口市| 文安县| 崇义县| 芦山县| 镇宁| 保亭| 景德镇市| 库车县| 铜陵市| 临泉县| 德州市| 衡南县| 小金县| 定日县| 宁波市| 通化县| 瓦房店市| 岳西县| 台北市| 安西县| 西吉县| 武功县| 略阳县| 光泽县| 皮山县| 邵武市| 肇源县| 巨鹿县| 盐边县|