- 相關推薦
數據挖掘技術在電子商務網站中的應用
當用戶和電子商務的商家充分享受電子商務的快捷和方便時,他們同時面臨著某些新的題目。一方面,用戶面對網站上提供的琳瑯滿目的眾多商品,他們只對其中的一部分商品感愛好。用戶要實現一次的購買,就必須瀏覽很多不相關的網頁,在眾多的商品分類中找到自己所需要的商品;另一方面,商家面對眾多的用戶,不知道他們對商品的愛好和要求是什么。因此,電子商務的商家無法及時調整網站的頁面結構,提供給所有的用戶是千篇一律的界面。缺乏個性化服務己經成為制約電子商務發展的關鍵題目。基于Web數據挖掘技術的電子商務推薦系統提供了一種有效的解決方法。推薦系統就是根據用戶個人的喜好、習慣來向其推薦信息、商品的程序。電子商務推薦系統能夠直接與用戶交互,模擬商店銷售職員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。從用戶角度來看,電子商務推薦系統通過對收集到的用戶的訪問行為、訪問頻度、訪問內容等瀏覽信息進行挖掘,提取用戶的特征,獲取用戶訪問Web的模式,動態地調整頁面結構,為用戶實現主動推薦,提供個性化服務;從企業角度來看,企業?茨軌颢@取用戶的訪問規律,以幫助企業確定顧客消費的生命周期,針對不同的產品制定相應的營銷策略,進一步優化網站的組織結構和服務方式,以進步網站的效率。推薦系統在幫助了客戶的同時也進步了顧客對商務活動的滿足度,換來對商務網站的進一步支持。
一、推薦系統在電子商務活動中的作用
一般說來,推薦系統在電子商務活動中的作用可以回納為以下幾點:
(一)把瀏覽者轉變成購買者
己有明確購物目標的客戶也許可以借助檢索系統找到自己需要的東西,但對于大多數只是四處走走看一看的沖浪者,或是對自己的需要比較模糊的購買者,很難有耐心在幾十頁長的商品目錄逐項查找是否有自己感愛好的東西。而推薦系統通過合適的推薦,可以將一個瀏覽者變為購買者。
(二)進步電子商務系統的交叉銷售能力
電子商務推薦系統在用戶購買過程中向用戶提供其它有價值的商品推薦,用戶能夠從提供的推薦列表中購買自己確實需要但在購買過程中沒有想到的商品,從而有效進步電子商務系統的交叉銷售。例如站點可以根據客戶當前購物車中的物品向他們推薦一些和這些己選購的物品相關的物品。假如有一個比較好的推薦系統,則企業的均勻定購量就可能增加。
(三)進步客戶對電子商務網站忠誠度。
與傳統的商務模式相比,電子商務系統使得用戶擁有越來越多的選擇,用戶更換商家及其方便,只需要一兩次鼠標的點擊就可以在不同電子商務系統之間跳轉。電子商務推薦系統分析用戶的購買習慣,根據用戶需求向用戶提供有價值的商品推薦。假如電子商務推薦系統的推薦質量很高,用戶可以很輕易找到自己想要的商品,那么用戶會再次訪問這個網站,并會推薦給其他人,這對于網站來說是一個很大的上風。
二、數據挖掘技術在電子商務推薦系統的具體應用
數據挖掘是在大型數據存儲庫中,自動地發現有用信息的過程。數據挖掘技術用來探查大型
數據庫,發現先前未知的有用模式。電子商務推薦系統將數據挖掘技術運用到電子商務領域,以數據挖掘為基礎衍生出很多算法。
(一)基于關聯規則的推薦算法
關聯規則是數據挖掘技術的一種,該技術挖掘發現大量數據中項集之間有趣的關聯或相關聯系。關聯規則挖掘的一個典型例子就是購物籃分析。該過程通過發現顧客放進其購物籃中不同商品之間的聯系,分析顧客的購買習慣。通過了解哪些商品頻繁地被顧客同時購買,這種關聯的發現可以幫助商家制定營銷策略。
關聯規則的挖掘是一個兩步過程:
首先,找出所有頻繁項集。這些項集出現的頻繁性至少和預定義的最小支持計數一樣。其次,由頻繁項集產生強關聯規則。這些規則必須滿足最小支持度和最小置信度。
關聯規則挖掘算法的瓶頸出現在第一步。由于第一步需要反復掃描交易數據庫,所以增加了系統的開銷,降低了系統性能。例如:Aprior算法是一種最有影響的挖掘關聯規則頻繁項集的算法。該算法使用一種稱為逐層搜索的迭代方法尋找頻繁項集,它開創性地使用基于支持度的剪枝技術,系統地控制候選項集指數增長。它缺點就是由于數據庫數據的增多,需要多次掃描數據庫,這樣便影響了系統的性能。
(二)基于內同的推薦算法
基于內容的推薦系統的產生根源于信息檢索與信息過濾。其具體是根據項之間的相似性來進行推薦的,先用機器學習等技術分析用戶已經評分的項的內容,建立用戶檔案,然后從項集中選擇與用戶檔案相似的項,再從中根據評分選擇一定的項推薦給用戶,最后根據用戶的反饋信息修正推薦。
基于內容得推薦技術具有一定的局限性。首先,資源內容必須以機器可以理解的格式表示,而很多信息例如圖像、視頻等多媒體信息是很難做到這一點的;其次,資源內容的分析范圍比較小,不能提供較多的建議;再次,基于內容的推薦不能從質量、樣式、審美等角度對項進行過濾。
(三)協同過濾推薦算法
協同過濾是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。與傳統的基于內容過濾直接分析內容進行推薦不同,協同過濾分析用戶愛好,在用戶群中找到指定用戶的相似(愛好)用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度猜測。
協同過濾推薦算法的缺點是:(1)用戶對商品的評價非常稀疏,這樣基于用戶的評價所得到的用戶間的相似性可能不正確(即稀疏性題目)。(2)隨著用戶和商品的增多,系統的性能會越來越低(即可擴展性題目)。(3)假如從來沒有用戶對某一商品加以評價,則這個商品就不可能被推薦(即最初評價題目)。
為了彌補各種推薦方法的缺點,在實際中常采用組合推薦。在組合推薦上,國外的有關學者提出了七種組合思路:
(1)加權:加權多種推薦技術結果。
(2)變換:根據題目背景和實際情況采用不同的推薦技術。
(3)混合:同時采用多種推薦技術給出多種推薦結果,為用戶提供參考。
(4)特征組合:組合來自不同推薦數據源的特征被另一種推薦算法所采用。
(5)層疊:先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步做出更精確的推薦。
(6)特征擴充:一種技術產生附加的特征信息嵌進到另一種推薦技術的特征輸進中。
(7)Metal-Level:一種推薦方法產生的模型作為另一種推薦方法的輸進。
盡治理論上有很多種推薦組合方法,但在某一具體題目中并不見得都有效,組合推薦一個最重要的原則,就是通過組合后要能避免或彌補各自推薦技術的弱點。
三、電子商務推薦算法面臨的挑戰
電子商務推薦技術在實際應用中取得了巨大成功,很多電子商務網站都提供了各種不同的推薦服務。但隨著站點結構內容的復雜度和用戶人數的增加,電子商務推薦算法也面臨很多挑戰,主要包括:
(一)實時性和擴展性題目:對于上百萬之巨的數據,推薦系統必須快速處理、實時搜索,在幾毫秒內處理成千上萬用戶并提供推薦。通常的推薦算法將遭到嚴重的實時性和擴展性題目。
(二)智能化推薦:目前大部分的協同過濾推薦系統采用顯示評分輸進的方式提供個推薦服務,用戶必須顯示輸進對商品的數值評分。這種方式一方面使得評分數據的獲取比較正確可信,但同時也使得用戶在使用上不是很方便。如何根據用戶的行為向用戶提供完全智能化得推薦需要做進一步的研究。
(三)實時性與推薦質量之間的平衡:推薦系統的推薦精度和實時性是一對矛盾。大部分推薦技術在保證實時性要求的同時,是以犧牲推薦系統的推薦質量為條件的。在提供實時推薦服務的同時,如何有效進步推薦系統的推薦質量,需要做進一步深進的研究。
(四)效率更好的數據挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠進步推薦的實時性和正確性。目前的推薦系統中,K-最近搜索算法存在實時性的不足等缺陷,難以快速處理大規模的數據;質量高的聚類算法能夠有效分割用戶群,適合推薦的聚類算法的性能也有待進步。
(五)新型電子商務推薦系統體系結構研究:當前大部分的電子商務推薦系統都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務系統本身的復雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務推薦系統體系結構,以有效集成多種推薦工具,收集多種類型的數據,提供多種推薦模型,使得不同的推薦工具組合使用,互補是非,滿族不同類型的推薦需要。
參考文獻:
[1] 曾子明,余小鵬(著):電子商務推薦系統與智能談判技術[M]武漢大學出版社2008.5
[2]Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數據挖掘
【數據挖掘技術在電子商務網站中的應用】相關文章:
談數據挖掘技術在電子商務中的應用03-21
數據挖掘技術在CRM中的應用03-22
Web數據挖掘在電子商務中的應用.03-21
數據挖掘在旅游電子商務中應用論文11-28
數據挖掘技術在企業知識管理中的應用03-19
Web數據挖掘在電子商務中的應用研究03-07
數據挖掘技術在客戶關系管理中的應用12-09
數據挖掘在CRM中的應用分析03-22
在電子商務中如何正確的使用數據挖掘技術03-20