- 相關推薦
Web數據挖掘在電子商務中的應用研究
[摘要]當今互聯網擁有海量的數據,如何對這些Web上的數據進行挖掘提取有用的模式,輔助企業獲得成功,是一個刻不容緩的題目。本文對Web數據挖掘的基本內容和相應的技術作了先容,并對Web數據挖掘在電子商務中可應用的范圍作了說明。。坳P鍵字]Web數據挖掘、電子商務
引言
在電子商務領域,通過Web數據挖掘,不僅可以從大量多種多樣信息的Web頁面中提取出我們需要的有用的知識,還可以得到關于群體用戶訪問行為和方式的普遍知識,用以改進Web服務設計。更重要的是,通過對用戶特征的理解和分析,如對用戶訪問行為、頻度、內容等的分折,提取出用戶的特征,從而為用戶定制個性化的界面,有助于開展有針對性的電子商務活動。[1][2]
1.Web數據挖掘簡介
當今Web上存在著大量的數據,獲取有用信息成為人們關注的焦點。但Web 是無結構的、動態的,Web 頁面極其復雜。這樣就使得人們從成千上萬的 Web 站點中找到有用的數據變得比較困難。于是,人們就越來越關注如何開發和利用 Web 上的數據資源。
Web 數據挖掘就是解決上述題目的一個途徑。當數據挖掘技術應用于網絡環境下的 Web 中就成為 Web數據挖掘。 Web數據挖掘就是從 Web 文檔和 Web活動中抽取感愛好的潛伏的有用模式和隱躲的信息。
Web挖掘可以分為三類:Web內容挖掘、Web結構挖掘和Web使用挖掘 [3]。Web內容挖掘是用來提取文字、圖片或其他組成網頁內容成分的信息;Web結構挖掘是用來提取網絡的拓撲信息,即網頁之間的銜接的信息;Web使用挖掘是用來提取關于客戶如何運用瀏覽器瀏覽和使用這些銜接的信息。
2.Web數據挖掘的技術先容
從電子商務的角度出發,進行Web上的數據挖掘,主要就是進行客戶訪問信息的挖掘,得到客戶端瀏覽行為和訪問模式,從而找到有用的市場信息。在Web數據挖掘的模式發現中,常有以下幾種數據挖掘技術的使用:
2.1路徑分析:使用路徑分析技術進行Web使用模式挖掘,最常用的就是網站結構圖。它可以被用于判定在一個 web 站點中最頻繁訪問的路徑,還有一些其他的有關路徑的信息通過路徑分析可以得出,比如:70%的用戶端在訪問/class/book2 時,是從/class 開始,經過/class/new, /class/book,/class/book1,最后才到的/class/book2。這條規則說明在/class/book2 頁面上有有用的信息,但由于客戶對站點進行的是迂回繞行的訪問,所以這個有用信息并不明顯。假如這個頁面對網站來說比較重要,可以通過此路徑分析改進頁面及網站結構的設計,從使客戶更輕易的訪問/class/book2。
2.2關聯規則:關聯規則主要關注事物內的關系。在Web使用挖掘中,關聯規則挖掘就是挖掘出用戶在一個訪問期間從服務器上訪問的頁面/文件之間的關系,找出在某一次服務器會話中最經常一起出現的相關畫面。例如,40%的客戶再購買了CD之后又購買了CD清潔劑。利用挖掘出來的這些相關性,我們可以更好的組織站點,實施有效的市場策略。
2.3序列模式:序列模式挖掘就是挖掘出交易集之間有時間序列關系的模式,在Web日志中發現所有滿足用戶規定的最小支持度的大序列模式。序列模式的發現就是在時間戳有序的事務集中,找到那些“一些項跟隨另一個項”的內部事務模式。例如:在/class/book1上進行過在線定購的顧客,有60%的人在過往15天內也在/class/bag1處下過訂單。發現序列模式能夠便于進行電子商務的組織猜測客戶的訪問模式,對客戶開展有針對性的廣告服務。通過系列模式的發現,能夠在服務器方選取有針對性的頁面,以滿足訪問者的特定要求。
2.4分類規則:分類技術主要是根據用戶群的特征挖掘用戶群的訪問特征。在Web數據挖掘中,分類規則的發現就是給出識別一個特殊群體的公共屬性的描述,這個描述可以用來分類新的項,例如:在/class/book2 進行過在線定購的顧客中有 55%是20-30歲生活在南方的年輕人。得到這一分類后,就可以進行適合這一類客戶的商務活動。
2.5聚類:聚類技術是對符合某一訪問規律特征的用戶進行用戶特征挖掘。聚類分析可以從 Web 訪問信息數據中聚集出具有相似特性的那些客戶。在 Web 事務日志中,聚類顧客信息或數據項能夠便于開發和執行未來的市場戰略。這種市場戰略包括:自動給一個特定的顧客聚類發送銷售郵件,為一個顧客聚類動態地改變一個特殊的站點等。 3.在電子商務中的應用先容
盡管Web挖掘的形式和研究方向層出不窮,但隨著電子商務的興起和迅猛發展,未來Web挖掘的一個重要應用方向將是電子商務系統。而與電子商務關系最為密切的是Web訪問信息挖掘。下面是Web訪問信息挖掘在電子商務中的幾點具體的應用。
3.1發現潛伏客戶:在對Web的客戶訪問信息的挖掘中,利用分類技術可以在Internet上找到未來的潛伏客戶。通常的策略是先對己經存在的訪問者進行分類,對于一個新的訪問者,通過在Web上的分類發現,識別出這個客戶與己經分類的老客戶的一些公共的描述,從而對這個新客戶進行正確的分類。然后從它的分類判定這個新客戶是屬于有利可圖的客戶群,還是屬于無利可圖的客戶群,決定是否要把這個新客戶作為潛伏的客戶來對待?蛻舻念愋痛_定后,就可以對客戶動態地展示Web頁面,頁面的內容取決于客戶與銷售商提供的產品和服務之間的關聯。
3.2提供優質個性化服務:對客戶來說,傳統客戶與銷售商之問的空間間隔在電子商務中己經不存在了。在網上,每一個銷售商對于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點上駐留更長的時間,對銷售商來說將是一個挑戰。為了達到這一目的,就應該了解客戶的瀏覽行為,知道客戶的愛好及需求所在,動態地調整Web頁面,以滿足客戶的需要。通過對客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而了解客戶的愛好及需求。
3.3 改進站點設計:對Web站點的鏈接結構的優化可從三方面來考慮:(1)通過對Web Log的挖掘,發現用戶訪問頁面的相關性,從而對密切聯系的網頁之間增加鏈接,方便用戶使用。(2)利用路徑分析技術判定在一個Web站點中最頻繁的訪問路徑,可以考慮把重要的商品信息放在這些頁面中,改進頁面和網站結構的設計,增強對客戶的吸引力,進步銷售量。(3)通過對Web Log的挖掘,發現用戶的期看位置。假如在期看位置的訪問頻率高于對實際位置的訪問頻率,可考慮在期看位置和實際位置之間建立導航鏈接,從而實現對Web站點結構的優化。
3.4聚類客戶:通過把具有相似瀏覽行為的客戶分為一組,并分析組中客戶的共同特征,可以幫助電子商務的組織者更好地了解自己的客戶,向客戶提供更適合、更面向客戶的服務。如有一些客戶都花了一段時間瀏覽“房屋裝修”,“家具”頁面,經過分析這些客戶被聚類成為一組。銷售商根據分析出來的聚類信息,就可以知道這是一組“新購房族”客戶,對他們所進行的業務活動當然也就不可能等同于其他被聚類了的客戶如“大學生”,“購車族”,應及時調整頁面及頁面內容使商務活動能夠在一定程度上滿足客戶的要求,使商務活動對客戶和銷售商來說更具意義。
3.5 搜索引擎的應用:通過對網頁內容的挖掘,可以實現對網頁的聚類和分類,實現網絡信息的分類瀏覽與檢索;通過用戶使用的提問式歷史記錄分析,可以有效地進行提問擴展,進步用戶的檢索效果(查全率、查準率);通過運用 Web 挖掘技術改進關鍵詞加權算法,可以進步網絡信息的標引正確度,改善檢索效果。
3.6 網絡安全:分析網上銀行、網上商店交易用戶日志,可以防范黑客攻擊、惡意詐騙。
參考文獻:
[1].韓家煒,孟小峰,王靜等.Web挖掘研究[J].計算機研究與友展.200 1,3H (4):405-414.
[2].郝先臣,張德干,尹國成等.基于電子商務中的數據挖掘技術研究[J],小型微型計算機系統,2001, 22 ( 7 ):785-788.
[3].Han J,Kamber M.Data Mining:Concepts and Techniques[J].San MateoCA:Morgan Kaufmann,2000
【Web數據挖掘在電子商務中的應用研究】相關文章:
網絡經濟數據挖掘在工商管理中的應用論文07-29
旅游管理下數據挖掘運用論文11-18
旅游管理下數據挖掘運用論文6篇11-18
語言藝術在英語文學中的應用研究論文09-23
價值管理在現代企業管理中的應用研究論文04-30
談智能決策支持系統及其在林業中的應用研究08-21
計算機應用技術在信息管理中的應用研究論文(精選6篇)09-20
談電子商務中的網絡安全治理08-25