21世紀是以網絡為代表的信息技術突飛猛進的時代,隨著網絡的飛速發(fā)展和經濟全球化所帶來的激烈挑戰(zhàn),信息技術已經成為現(xiàn)代企業(yè)進行經營管理不可或缺的支撐。企業(yè)可獲得的數(shù)據在急劇增長,對客戶數(shù)據進行全面收集、集成、分析與利用是知客CRM實施的基礎。如何管理和分析海量的客戶信息,并從中找出對CRM決策有價值的知識?這需要更先進的技術和工具的支持,即數(shù)據挖掘技術。
一、統(tǒng)計學與數(shù)據挖掘的關系
數(shù)據挖掘與統(tǒng)計學都試圖從數(shù)據中發(fā)現(xiàn)某種結構,從而得到有價值的信息,所以從數(shù)據挖掘誕生時起,就與統(tǒng)計學有了不可分割的聯(lián)系。統(tǒng)計學、數(shù)據庫和人工智能共同構成數(shù)據挖掘技術的三大支柱。統(tǒng)計學是搜集、展示、分析以及解釋數(shù)據的科學,統(tǒng)計學并不是方法的羅列,而是處理數(shù)據的科學。數(shù)據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據中提取隱含的、事先不為人們所知的、潛在有用的信息和知識的過程。數(shù)據挖掘大部分核心功能的實現(xiàn)都以計量和統(tǒng)計分析方法作為支撐。數(shù)據挖掘本身是多學科交叉科學,應用了統(tǒng)計學、計算機、數(shù)據倉庫、神經網絡等多種技術。
二、統(tǒng)計數(shù)據挖掘技術在知客CRM中的應用
要使數(shù)據挖掘在商業(yè)活動中起作用,就要把它與基本的商業(yè)過程關聯(lián)起來。數(shù)據挖掘是企業(yè)同客戶打交道的諸多步驟中的第一個。它要發(fā)現(xiàn)的是商業(yè)活動中各個因素與客戶行為之間的不直觀的關系。統(tǒng)計數(shù)據挖掘技術對于新客戶開發(fā)、交叉銷售及預測、顧客維系、顧客細分、關系贏利性識別等知客CRM功能都能提供良好的技術支撐。
(一)應用流程
1.顧客獲取。對大多數(shù)企業(yè)而言,發(fā)展新客戶、擴大客戶基礎的確是企業(yè)成長的一種主要方式。通過數(shù)據挖掘實現(xiàn)顧客獲取就是利用客戶檔案找出客戶的一些共同特征,通過聚類分析對客戶分群,再通過模式分析預測潛在客戶。通過預測潛在客戶對開發(fā)活動的反映,從中識別出反映積極的客戶,幫助市場人員對潛在客戶進行篩選,然后有針對性的進行營銷活動。
2.客戶細分?蛻艏毞质歉鶕髽I(yè)需求,將客戶劃分為多個小的同質群體的過程。同屬一個群體的客戶往往有相似的需求,這樣,營銷人員就容易對其進行營銷組合,有針對性的實施營銷策略?蛻艏毞种斜容^典型的數(shù)據挖掘技術是決策樹和聚類分析方法。
3.交叉銷售及預測,F(xiàn)代企業(yè)和客戶之間的關系是經常變動的,交叉銷售是使這種關系趨于穩(wěn)定的一種手段。利用市場購物藍圖分析挖掘客戶對產品的消費模式,找出客戶最容易一起購買哪些產品,從而有效的決定產品組合、產品擺放等。利用序慣分析預測客戶在買了某一樣產品之后,多久就會買另一樣產品。這樣做的結果是:企業(yè)獲得了更高的商業(yè)利潤,客戶得到了所需要的產品和服務,從而使雙方達到雙贏的狀態(tài)。
4.顧客維系。隨著獲取新客戶的成本不斷提高,對企業(yè)而言,維系老客戶,保持原有客戶的價值就顯得越發(fā)重要。在客戶保持中,通常涉及三個數(shù)據挖掘模型,首先建立模型用來預測和識別潛在流失者,然后挖掘和識別潛在流失者中的黃金客戶。最后對黃金客戶中的潛在流失者進行分析挖掘,識別其行為模式,從而實行有針對性的營銷策略以保持這些客戶。
5.客戶贏利性識別。對企業(yè)來說,客戶的數(shù)量并非越多越好,而是能夠給企業(yè)帶來贏利的客戶越多越好,因為不同客戶的贏利能力對企業(yè)的貢獻率是不同的。企業(yè)通過設置計算贏利能力的參數(shù),利用數(shù)據挖掘對客戶信息、客戶歷史交易記錄和售后服務等信息進行分析,對客戶進行分類,預測其未來的購買模式和購買行為。這樣就可以在市場營銷的過程中對有價值或潛在的客戶投入更多精力和財力,向他們提供及時的個性化服務,既可以留住這些客戶,又可以有針對性地開展交叉銷售,提高其對企業(yè)的贏利能力。
(二)主要統(tǒng)計方法
1.運用描述性統(tǒng)計分析方法對數(shù)據進行初步分析。描述性分析是對初步整理后的數(shù)據資料進行分析,并用統(tǒng)計量描述這些資料的一種方法。它主要包括了相對指標分析、圖表法、集中趨勢和離散趨勢分析、相關分析等。
相對指標是運用對比的方法,反映某些相父事物之間數(shù)量聯(lián)系程度的綜合指標。利用相對指標可以表明現(xiàn)象的相對水平、普遍程度及比例關系,可以使某些不能直接對比的總量找到對比的基礎,可以比較事物的發(fā)展程度、內部結構及比例,可以使不能用總量指標直接對比的非同類現(xiàn)象之間進行比較。
圖表法屬于描述統(tǒng)計學,它就是以圖形或表格的形式來表示總體變量值的分布狀況,它的表達形式比較簡明、直觀。統(tǒng)計表格根據它的內容可以分為頻次表、百分比表、累計表。常用的頻次表包括直方圖、折線圖和曲線圖。由于計算機的運用,制作圖表都看可以通過軟件來實現(xiàn),例如Excel,SPSS等軟件。
統(tǒng)計圖是以圖形表示變量的分布情況,與統(tǒng)計表相比,雖然不如它精確,但卻更直觀、生動、醒目。常用的統(tǒng)計表有餅圖、條形圖、直方圖和折線圖。
2.進行復雜數(shù)據挖掘前的統(tǒng)計降維方法一因子分析方法。由于數(shù)據的結構有時候會非常復雜,不便于直接用來做數(shù)據挖掘。這時候需要對復雜數(shù)據進行統(tǒng)汁降維分析,從二簡化數(shù)據結構。因子分析是一類降維的相關分析技術,用來考察一組變量之間的協(xié)方差或者相關系數(shù)結構,并用以解釋這些變量與因子之間的關聯(lián)。目前的因子分析包括探索性因子分析與驗證性因子分析。探索性因子分析是往事先不知道影響因素的基礎上,完全依據資料數(shù)據,利用統(tǒng)計軟件,根據一定的原則進行因子分析,最后得到因子的過程。而確定性因子分析是充分利用先驗信息,在已知因子的情況下檢驗所搜集的數(shù)據資料是否按照事先預定的結構方式產生作用。本文所討論的是探索性因子分析,通過對數(shù)據資料的因子分析實現(xiàn)降維,從而為進一步的數(shù)據挖掘做準備。
(三)需要注意的問題
1.對數(shù)據的要求。由于大多運營商現(xiàn)有的面向事物的數(shù)據在質量、完整性和一致性方面存在很多問題,因此在利用這些數(shù)據進行數(shù)據挖掘之前,必須先對其進行抽取、凈化和處理。
2.對人員素質的要求。統(tǒng)計數(shù)據挖掘分析系統(tǒng)必須與實際緊密相聯(lián),在數(shù)據挖掘的多個環(huán)節(jié)中,都要求使用和分析人員不光具備數(shù)據挖掘的相關知識,還必須有對企業(yè)經營管理流程和行業(yè)背景的深刻理解。
3.統(tǒng)計數(shù)據挖掘存在較長的應用周期,數(shù)據挖掘所發(fā)現(xiàn)的知識和規(guī)則必須讓決策者理解并采納,才能將知識轉化為生產力,并通過實踐不斷檢驗和完善數(shù)據挖掘所產生的模型和規(guī)則,以使模型更具實用價值。