1. <tt id="5hhch"><source id="5hhch"></source></tt>
    1. <xmp id="5hhch"></xmp>

  2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

    <rp id="5hhch"></rp>
        <dfn id="5hhch"></dfn>

      1. 數據挖掘技術在高校學生成績分析中的應用研究論文

        時間:2024-10-20 18:32:19 其他類論文 我要投稿

        數據挖掘技術在高校學生成績分析中的應用研究論文

          摘 要:本文主要討論的是決策樹挖掘技術在學生成績分析中的應用。通過確定數據挖掘的對象、數據選擇、數據分類挖掘,最后由決策樹產生分類規則,得出挖掘結果和運用這個結果的指導作用。希望本文的研究能夠為相關領域提供一些指導和幫助。

        數據挖掘技術在高校學生成績分析中的應用研究論文

          關鍵詞:數據挖掘;高校學生;成績分析

          1.確定數據挖掘的對象

          本文數據挖掘的對象主要是以本人所授的《大學計算機基礎》課程的數據為例,對象是本校學生,總人數250人,采用授課方法是在機房上課,周學時為三節課。根據學生的基本情況來分析挖掘出哪些因素對學生的學習成績是有影響的,如性別、基礎程度、每周上機時間、生源地、出勤情況等等,分析考試成績為在優、良、中、及格、不及格這五個等級之間分布的學生人數與上面哪些因素有關系,并希望用得到的分析結果來指導今后的教學工作,提高教學質量、改革教學方法。

          2.數據選擇

          2.1學生的基本情況信息

          數據結構包含以下屬性信息:學號、姓名、性別、專業、家庭住址、籍貫、聯系方式、班級、生源地。這些信息可以通過學院的“學生教務管理信息系統”來獲取,存入“學生基本情況數據庫”中,內部的數據結構包含以上九個屬性。

          2.2需要向學生調查的數據信息

          需要調查的信息包括:對計算機課程是否感興趣、基礎程度、每周上機時間等。這些信息是通過對學生的調查才能得到。把調查所得到的數據存放到“調查信息數據庫”中!罢{查信息數據庫”的數據結構包含以下屬性信息:學號、姓名、是否對計算機課程感興趣、基礎程度、每周上機時間五個屬性。其中是否對計算機課程感興趣屬性有感興趣、不感興趣兩個屬性值;基礎程度屬性有好、一般、差三個屬性值;上機時間量有0、≤1、1~2、≥2四個屬性值。

          2.3學生的考試成績數據

          學生的考試成績是教師在期末考試后統計的,通過學院已有的“教務管理系統”來完成錄入收集的,其數據結構包含以下內容:學號、姓名、專業名稱、班級、課程名稱、成績。錄入的學生成績保存在“學生成績數據庫”中,數據結構包含以下屬性:學號、姓名、專業、成績四個屬性。

          3.數據分類挖掘

          數據分類挖掘的主要目的就是要建立學生成績分析決策樹的模型。

          3.1算法的選擇

          本文運用決策樹技術的兩個經典算法 ID3算法和C4.5算法,因ID3算法是利用信息增益,作為分類評價函數來選取最優屬性,這種選擇容易傾向于選擇取值較大的屬性,但取值較大的屬性并不一定是最重要的屬性。且ID3算法只能處理離散值的屬性,沒有考慮數據中的缺值問題。C4.5算法能有效處理數值的離散化,考慮了缺值問題,因此選用了C4.5算法建立決策樹進行數據挖掘分析。

          3.2建立決策樹模型

          用于挖掘的學生成績表中的屬性很多,本文選取了與成績屬性相關性較大的性別、基礎程度、每周上機時間三個屬性作為建立成績分類決策樹模型的依據。建立決策樹模型的步驟如下:

          (1)對每個屬性分別計算該屬性的信息增益率。

         。2)選取信息增益比率最大的屬性作為根結點,并按其值劃分數據集合,如果該屬性只有一個值則停止劃分。

         。3)對劃分的每個子數據集遞歸執行(1)~(2)。

          4.生成分類規則

          決策樹的最大優點是能直接提取分類規則,可以以IF…THEN形式的分類規則表示。IF…THEN規則易于理解,特別是當給定的決策樹很大時很實用。提取IF…THEN規則的主要做法是:對從根到葉節點的每條路徑創建一個規則,沿著給定路徑上的每個屬性值對形成規則前面部分的一個合取項。葉節點包含類預測,形成規則的后面部分。

          5.決策樹挖掘結果分析

          通過應用決策樹算法對學生成績進行析,可得如下結論:

         。1)基礎程度好的學生且每周上機時間不少于1小時的學生,成績基本上都是優秀的。

         。2)基礎程度一般的學生且每周上機時間不少于1小時的學生,成績基本上是良好的。

         。3)基礎程度一般的學生且每周上機時間小于1小時的學生,成績基本是屬于中等水平。

         。4)基礎程度差的學生但每周上機時間不少于1小時的學生,成績大部分集中在及格左右。

          (5)基礎程度差的學生且每周上機時間少于1小時的學生,成績基本上都是不及格。

         。6)而從結果來看性別是不能決定成績的。

          6.決策樹方法分析結果的指導作用

          通過對學生成績的決策樹分析,教師可以了解到哪些因素對學生成績有影響,根據這些影響因素,教師可以在今后的教學過程當中進行課程改革、改善教學過程當中的不足之處,可以提高學生的學習成績,學到更多的知識。

          從生成的分類規則,可以了解到,學生基礎程度好且能保證每周有相當的時間來學習,那么這樣的學生成績基本上都是優秀,而基礎程度差且每周能用來學習的時間比較少的那些學生,成績基本上是屬于不及格的。而基礎程度一般且每周用來上機的時間相對比較多的學生,成績大部分是集中在中、良這兩個階段;A程度一般且每周用來上機時間比較少的那部分學生,成績集中在及格與不及格之間。所以可以知道學生的基礎程度好與差、每周能用來學習的上機時間的多與少,是影響學生成績的主要因素。但性別不是影響學生成績的主要因素,從決策樹來看,無論從哪個分支都看不出是男生成績好還是女生成績好,所以性別不是能影響學生成績的主要因素。

          針對這些主次要因素,教師在教學過程當中要進行適當的教學改革。而不能再用傳統的教學方法,不管基礎程度好與差,一概而論;也不管學生對知識掌握與否,一堂課都是老師在講,學生只能聽。這樣會使程度好的學生因為沒有新知識可學而失去對這門課的興趣,而程度差的學生因為聽不明白、學不到知識,也對這門課失去興趣,結果會使整體的教學效果不好,學生的成績沒有得到提高,因此教師要改變這樣的傳統教學模式,才能提高學生對知識的掌握。改革的重點是要把程度差和程度好的學生進行分開教學,對于程度好的學生可以做一些更深層次的授課,而程度差的學生在授課的時候就要有針對性的授課,必須做到提高學生學習的積極性,讓他們對這個課程感興趣。程度好的學生計算機能力也會有所提高,而程度差的學生也可以學到自己想學的知識。

          參考文獻:

          [1]陳文偉.決策樹支持系統與數據挖掘技術[M].北京:清華大學出版社,1998.

          [2]陳文偉.數據挖掘技術[M].北京:北京工業大學出版社,2002

        【數據挖掘技術在高校學生成績分析中的應用研究論文】相關文章:

        數據挖掘技術在Web信息檢索中的應用研究論文12-01

        數據挖掘技術在中等職業學校管理實踐中的應用研究11-19

        數據挖掘在電力企業中的應用論文12-13

        數據挖掘技術的教學輔助系統應用論文03-16

        數據挖掘技術在就業指導的應用論文02-27

        數據挖掘在現代遠程教育中的應用論文11-22

        GPSRTK技術在工程測量中的應用研究論文02-14

        數據挖掘論文的參考文獻01-07

        數據挖掘與客戶關系管理分析02-28

        • 相關推薦
        国产高潮无套免费视频_久久九九兔免费精品6_99精品热6080YY久久_国产91久久久久久无码

        1. <tt id="5hhch"><source id="5hhch"></source></tt>
          1. <xmp id="5hhch"></xmp>

        2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

          <rp id="5hhch"></rp>
              <dfn id="5hhch"></dfn>