- 相關推薦
談數據挖掘技術在第三方物流企業的應用
內容摘要:數據挖掘是商務智能技術的重要組成部分,是一個新的重要的研究領域。本文先容了商務智能技術應用現狀和組成,闡述了數據挖掘技術在第三方物流企業的應用。關鍵詞:商務智能 數據挖掘 第三方物流 研究
在當今競爭日益激烈的市場環境中,第三方物流企業都希看能夠從浩如煙海的商務數據以及其他相關的物流業務數據中發現帶來巨額利潤的商機。只有那些利用先進的信息技術成功地收集、分析、理解信息并依據信息進行決策的物流企業才能獲得競爭上風,才是物流市場的贏家。因此,越來越多的物流治理者開始借助商務智能技術來發現物流運營過程中存在的題目,找到有利的物流解決方案。
商務智能技術應用現狀
我國加進了WTO,在很多領域,如金融、保險、物流等領域將逐步對外開放,這就意味著很多第三方物流企業將面臨來自國際大型跨國物流公司的巨大競爭壓力。國外發達國家各種企業采用商務智能的水平已經遠遠超過了我國。美國Palo Alto 治理團體公司1999年對歐洲、北美和日本375家大中型企業的商務智能技術的采用情況進行了調查。結果顯示,在金融領域,商務智能技術的應用水平已經達到或接近70%,在營銷領域也達到50%,并且在其他應用領域對該技術的采納水平都進步約50%。現在,很多第三方物流企業都把數據看成寶貴的財富,紛紛利用商務智能發現其中隱躲的信息,借此獲得巨額的回報。
據IDC對歐洲和北美62家采用了商務智能技術的企業的調查分析發現,這些企業的3年均勻投資回報率為401%,其中25%的企業的投資回報率超過600%。調查結果還顯示,一個企業要想在復雜的環境中獲得成功,高層治理者必須能夠控制極其復雜的貿易結構,若沒有詳實的事實和數據支持,是很難辦到的。因此,隨著數據挖掘技術的精益求精和日益成熟,它必將被更多的第三方物流企業采用,使更多的物流治理者得到更多的商務智能。
商務智能技術的組成
具體地說,商務智能技術有數據倉庫(data warehousing)、聯機分析處理(on-line analytical processing,簡稱OLAP)、數據挖掘(data mining),包括這三者在內的用于綜合、探察和分析商務數據的先進的信息技術的統稱就是商務智能技術。
數據倉庫是一個面向主題的、集成的、隨時間變化的主要用于決策支持的數據的集合。一般來說,大的物流公司或企業內存在著各種各樣的信息系統,這些應用驅動的操縱型信息系統為企業不同的物流業務系統服務,具有不同接口和不同的數據表示方法,互相孤立。利用數據倉庫技術可以動態地將各個物流企業子系統中的數據抽取集成到一起,進行清洗、轉換等處理之后加載到數據倉庫中,通過周期性的刷新,為物流用戶提供一個同一的干凈的數據視圖,為數據分析提供一個高質量的數據源。
對于數據倉庫中的數據,可以使用一些增強的查詢和報表工具進行復雜的查詢和即時的報表制作,可以利用OLAP技術從多種角度對物流業務數據進行多方面的匯總、統計、計算,還可以利用數據挖掘技術自動發現其中隱含的有用的物流信息。
數據挖掘又稱知識發現(Knowledge Discovery in Database,簡稱KDD),是從大量數據中抽取有意義的、隱含的、以前未知的并有潛伏使用價值的知識的過程。數據挖掘是一個多學科交叉性學科,它涉及統計學、數據庫、模式識別、可視化以及高性能計算等多個學科。利用數據挖掘技術可以分析各種類型的數據,例如結構化數據、半結構化數據以及非結構化數據、靜態的歷史數據和動態數據流數據等。
數據挖掘技術在第三方物流企業的應用分析
數據挖掘是從大量的、不完全的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛伏有用的數據中發現其潛伏規律的技術,是當前計算機科學研究的熱門之一。隨著信息技術的高速發展,積累的有關物流行業的數據量劇增,如何從大量的物流數據中提取有用的知識成為第三方物流企業當務之急。數據挖掘就是為順應需要應運而生發展起來的數據處理技術。
數據挖掘的對象
關系數據庫(relational database)中通常存儲和治理的是結構化的數據,它將一個實體的各方面信息通過離散的屬性進行描述。而文本數據庫(text database)或文檔數據庫(document database)則通常存儲和治理的是半結構化的數據,例如新聞稿件、研究論文、電子郵件、書籍以及WEB頁面等都屬于半結構化數據?臻g數據庫、多媒體數據庫中存放的是非結構化數據,例如輿圖、圖片、音頻、視頻等都屬于非結構化數據。相對于半結構化和非結構化數據來說,針對結構化數據的數據挖掘技術比較成熟,市場上有很多的商品軟件可以使用,用的較多的包括IBM Intelligent Miner、SAS Enterprise Miner、SGI MineSet、Clementine SPSS以及Microsoft SQL Server 2000等。關于半結構化和非結構化的數據挖掘軟件尚未幾,相應的算法相對還較少。從另一個角度來說,數據挖掘的分析對象分為兩種類型:靜態數據和數據流(data stream)數據,F在的多數數據挖掘算法是用于分析靜態數據的。
數據挖掘的分析
無論要分析的數據對象的類型如何,常用的數據挖掘分析包括關聯分析、序列分析、分類、猜測、聚類分析以及時間序列分析等。
關聯分析 關聯分析是由Rakesh Apwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規律性,就稱為關聯。數據關聯是數據庫中存在的一類重要的、可被發現的知識。關聯分為簡單關聯、時序關聯和因果關聯。關聯分析的目的是找出數據庫中隱躲的關聯網。一般用支持度和可信度兩個閥值來度量關聯規則的相關性,還不斷引進愛好度、相關性等參數,使得所挖掘的規則更符合需求。關聯分析主要用于發現不同事件之間的關聯性,即一個事件發生的同時,另一個事件也經常發生。關聯分析的重點在于快速發現那些有實用價值的關聯發生的事件。其主要依據是事件發生的概率和條件概率應該符合一定的統計意義。 對于結構化的數據,以物流客戶的采購習慣數據為例,利用關聯分析,可以發現物流客戶的關聯采購需要。例如,對于第三方物流企業來說,一個托運貨物的貨主很可能同時有貨物的包裝、流通加工等物流業務的需求。利用這種知識可以采取積極的物流運營策略,擴展物流客戶采購物流服務的范圍,吸引更多的物流客戶。通過調整服務的內容便于物流顧客采購到各種物流服務,或者通過降低一種物流業務的價格來促進另一種物流業務的銷售等。
分類分析 分類分析是通過分析具有種別的樣本的特點,得到決定樣本屬于各種種別的規則或方法。利用這些規則和方法對未知種別的樣天職類時應該具有一定的正確度。分類分析可以根據顧客的消費水平和基本特征對物流顧客進行分類,找出對第三方物流企業有較大利益貢獻的重要的物流客戶的特征,通過對其進行個性化物流服務,進步他們的忠誠度。
聚類分析 聚類分析是根據物以類聚的原理,將本身沒有種別的樣本聚集成不同的組,并且對每一個這樣的組進行描述的過程。其主要依據是聚到同一個組中的樣本應該彼此相似,而屬于不同組的樣本應該足夠不相似。
以第三方物流企業的客戶關系治理為例,利用聚類分析,根據物流客戶的個人特征以及物流業務消費數據,可以將客戶群體進行細分。例如,可以得到這樣的一個物流業務消費群體:生產企業對物流業務中運輸需求占41%,對物流業務中倉儲業務的需求占23%;貿易企業對物流業務中運輸需求占59%,對物流業務中倉儲業務需求占77%。針對不同的客戶群,可以實施不同的物流服務方式,從而進步客戶的滿足度。
數據挖掘流程
定義題目:第三方物流企業首先清楚地定義出各種物流業務題目,確定數據挖掘的目的。
數據預備:首先第三方物流企業在大型數據庫和數據倉庫目標中提取數據挖掘的目標數據集進行數據選擇;其次進行數據的預處理,包括檢查數據的完整性及數據的一致性、填補丟失的域,刪除無效數據等。
數據挖掘:第三方物流企業根據數據功能的類型和數據的特點選擇相應的算法,在凈化和轉換過的數據集上進行數據挖掘。
結果分析:第三方物流企業對數據挖掘的結果進行解釋和評價,轉換成為能夠終極被理解的知識。
知識的運用:第三方物流企業將分析所得到的知識集成到物流業務信息系統的組織結構中往。
評價數據挖掘軟件需要考慮的題目
越來越多的軟件供給商加進了數據挖掘這一領域的競爭。第三方物流企業如何正確評價一個貿易軟件,選擇合適的軟件成為數據挖掘成功應用的關鍵。評價一個數據挖掘軟件主要應從以下四個主要方面:
計算性能:如該軟件能否在不同的物流業務平臺運行;軟件的架構;能否連接不同的數據源;操縱大數據集時,性能變化是線性的還是指數的;算的效率;是否基于組件結構易于擴展;運行的穩定性等;
功能性:如軟件是否提供足夠多樣的算法;能否避免挖掘過程黑箱化;軟件提供的算法能否應用于多種類型的數據;第三方物流企業能否調整算法和算法的參數;軟件能否從數據集隨機抽取數據建立預挖掘模型;能否以不同的形式表現挖掘結果等。
可用性:如用戶界面是否友好;軟件是否易學易用;軟件面對的用戶是初學者、高級用戶還是專家;錯誤報告對用戶調試是否有很大幫助。
輔助功能:如是否答應第三方物流企業更改數據集中的錯誤值或進行數據清洗;是否答應值的全局替換;能否將連續數據離散化;能否根據用戶制定的規則從數據集中提取子集;能否將數據中的空值用某一適當均值或用戶指定的值代替;能否將一次分析的結果反饋到另一次分析中等等。
數據挖掘技術是一個年輕且布滿?吹难芯款I域,利益的強大驅動力將會不停地促進它的發展。每年都有新的數據挖掘方法和模型問世,人們對它的研究正日益廣泛和深進。盡管如此,數據挖掘技術仍然面臨著很多題目和挑戰:如數據挖掘方法的效率亟待進步,尤其是超大規模數據集中數據挖掘的效率;開發適應多數據類型的挖掘方法,以解決異質數據集的數據挖掘題目;動態數據和知識的數據挖掘;網絡與分布式環境下的數據挖掘等。
【談數據挖掘技術在第三方物流企業的應用】相關文章:
談數據挖掘技術在電子商務中的應用03-21
數據挖掘技術在企業知識管理中的應用03-19
數據挖掘技術在CRM中的應用03-22
淺談現代企業物流管理中的數據挖掘技術03-07
基于數據挖掘技術的現代物流管理03-25
第三方物流企業中的商務智能技術應用03-23
數據挖掘技術在客戶關系管理中的應用12-09
談數據挖掘在中醫學術流派研究中的應用03-19
談數據加密技術在銀行系統中的應用03-18