粗集方法在KDD系統中的應用與研究
粗集方法在KDD系統中的應用與研究
周波
(西安電子科技大學多媒體研究所 西安 710086)
【摘 要】本文論述了粗集方法性質及特點,提出了粗集方法在KDD系統中的應用模型,同時給出了應用這一模型對一個數據庫實例進行數據挖掘的過程。另外,從精確性、魯棒性等方面對KDD系統中的粗集方法的適用范圍進行了分析。
【關鍵詞】粗集 KDD 數據挖掘
Application and Research of Rough Set in KDD System
Zhou bo
(Multimedia Technology Institute ,Xidian University Xi’an710086)
Abstract: In this paper, we discuss the character of rough set, and put forward the application model of rough set in KDD system. Also, by an example ,the advantage and disadvantage of rough set in KDD system is analysed in detail.
Key Word: Rough Set KDD Data Mining
1.前 言
數據庫中的知識發現技術(Knowledge Discovery in Database, KDD)是隨著數據庫和人工智能的發展而產生的,它是“從大量數據中提取出可信的、新穎的、有效的并能被人理解的模式的`非平凡過程”。通過KDD,人們可以將知識發現的研究成果應用于實際數據處理中,為科學決策提供支持。KDD系統中的知識學習階段被稱為“數據挖掘”(Data Mining,DM),它的算法是KDD系統的核心。近年來,粗集理論(Rough Set Theory)開始逐漸應用到DM的領域中,在對大型數據庫中不完整數據進行分析和學習方面取得了顯著的效果,因此,以粗集為代表的集合論方法是今后KDD技術的一個主要研究方向。
2. KDD系統中粗集方法的基本特征
粗集(Rough Set)理論和模糊集(Fuzzy Set)理論都是針對不確定性問題提出的,它們既相互獨立,又相互補充。粗集方法與傳統的統計及模糊集方法不同的是:后者需要依賴先驗知識對不確定性的定量描述,如統計分析中的先驗概率、模糊集理論中的模糊度等等;而前者只依賴數據內部的知識,用數據之間的近似來表示知識的不確定性。用粗集來處理不確定性問題的最大優點在于
【粗集方法在KDD系統中的應用與研究】相關文章: