期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:應(yīng)用電子技術(shù)時間:瀏覽:次
摘 要:隨著時代進(jìn)步,當(dāng)前企業(yè)信息系統(tǒng)普遍面臨的“數(shù)據(jù)爆炸”問題,要及時解決這類問題,同時還要解決“信息缺乏”問題,數(shù)據(jù)挖掘技術(shù)成為當(dāng)前學(xué)術(shù)界和企業(yè)界研究的熱點(diǎn)。本篇文章詳細(xì)討論了數(shù)據(jù)挖掘在電子商務(wù)中的數(shù)據(jù)資源、基本方法、體系結(jié)構(gòu)以及典型應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)采集;電子商務(wù)
一、電子商務(wù)中數(shù)據(jù)資源的數(shù)據(jù)挖掘
1.服務(wù)器數(shù)據(jù)
通過對此文件中存儲的某些項目進(jìn)行語法分析,例如DNS,就可以知道客戶來源所在的地區(qū),通過對域名www.msta.acjp進(jìn)行分析,就可以知道客戶來自哪里。在cookielogs中,HTTP協(xié)議本身就是非事務(wù)類型的,這一點(diǎn)在事務(wù)類型的電子商務(wù)中并不適用,這給電子商務(wù)帶來了很多問題。使用cookie可以解決這個問題。Cookie是一個軟體工件,它可以儲存客戶存取伺服器的資訊,存儲有關(guān)cookie的服務(wù)器軟件的這部分稱為cookielogs。
2.客戶注冊信息
用戶在網(wǎng)站上的相關(guān)信息,通過屏幕傳送并進(jìn)入服務(wù)器。在電子商務(wù)活動中,電子商務(wù)扮演著非常重要的角色,尤其是關(guān)于安全和限制客戶訪問的時間信息。為了提高數(shù)據(jù)挖掘的精確性和更好地理解客戶,數(shù)據(jù)挖掘需要將客戶注冊信息集成到訪問協(xié)議中[1]。
二、電子商務(wù)環(huán)境下數(shù)據(jù)挖掘的基本方法
1.路徑分析
路徑分析可用于確定訪問頻率最高的網(wǎng)站路徑。另外,通過路徑分析可以得到關(guān)于該路徑的其它信息。舉例來說,70%的客戶訪問/company/product2,但是用戶會忽略它們。此外,通常情況下,客戶并未從主頁訪問站點(diǎn),而是從/company/products訪問,所以最好的方法是在此頁中包含有關(guān)產(chǎn)品目錄類型的信息。另外還應(yīng)規(guī)定客戶在網(wǎng)站上的停留時間,因為顧客一般只在網(wǎng)站上瀏覽4個網(wǎng)頁,所以他們可以把重要的產(chǎn)品信息放在這些網(wǎng)頁上,利用路徑分析,改善網(wǎng)頁設(shè)計和網(wǎng)頁結(jié)構(gòu)。
2.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)是在電子商務(wù)中發(fā)現(xiàn)用戶訪問網(wǎng)站上各種文檔之間的關(guān)系。國際人工智能公司這兩個數(shù)據(jù)中,A【即(1,1,m)】和t【(14,n)】是數(shù)據(jù)庫中相關(guān)數(shù)據(jù)的一組特征屬性。假如我們使用關(guān)聯(lián)規(guī)則技術(shù),我們可以發(fā)現(xiàn),如果一個客戶訪問某個頁面/公司/產(chǎn)品時,他也訪問該頁面/公司/產(chǎn)品2。
3.連續(xù)模式的發(fā)現(xiàn)
連續(xù)模式分析側(cè)重于數(shù)據(jù)之間的前因或因果關(guān)系分析,在順序事務(wù)集中尋找“某些項目跟隨其他項目”的內(nèi)部事務(wù)模式。以/company/producti為例,假如在過去10天里,有60%的在線訂購客戶已經(jīng)購買了/company/product2,同時,60%的在線訂購計算機(jī)的客戶將在兩個月內(nèi)訂購打印機(jī)和紙張。通過這些數(shù)據(jù),商家可以為客戶群體提供更好地針對性服務(wù)。
4.分類規(guī)則的發(fā)現(xiàn)
分類規(guī)則簡而言之就是先標(biāo)記每個記錄,也就是根據(jù)標(biāo)記對記錄進(jìn)行分類。通過數(shù)據(jù)挖掘(例如Fazhan/company/productl),假如在網(wǎng)上訂購電子商務(wù)產(chǎn)品的客戶中,60%是生活在大中城市的2歲左右的年輕人,經(jīng)過分類,我們可以根據(jù)這類客戶的特點(diǎn)進(jìn)行經(jīng)營活動,提供針對性的個性化信息服務(wù)[2]。
5.聚類分析結(jié)果表明
聚類分析方法的輸入集不同于分類規(guī)則方法的輸入集,聚類分析方法的輸入集是一組未標(biāo)定的記錄集。通過將有相似瀏覽行為的顧客聚類,使管理者能夠更好地了解顧客,為顧客提供更合適、更滿意的服務(wù)。一些客戶是否經(jīng)常瀏覽相關(guān)信息。在這段時間里,真實和電子產(chǎn)品經(jīng)常出現(xiàn),通過分析,這些顧客都聚集在一個群體中,我們可以知道這群顧客的需求是什么。服務(wù)對象要與其他群組客戶區(qū)分開來,如“大學(xué)生群體”和“白領(lǐng)群體”。這樣,web就能自動將新產(chǎn)品信息電子郵件發(fā)送到這一特定客戶群體,并為這一客戶群體動態(tài)地更改專門網(wǎng)站。從某種程度上說,滿足客戶需求,對客戶和銷售者來說更有意義。
三、電子商務(wù)數(shù)據(jù)挖掘的架構(gòu)
因為電子商務(wù)數(shù)據(jù)挖掘可以把那些復(fù)雜的數(shù)據(jù)以及結(jié)果直接轉(zhuǎn)變成方便理解的信息,因此,要真正發(fā)揮電子商務(wù)的效率,除了要充分利用和合理選擇前面提到的基本方法以及常用的工具外,還必須將辦公處理階段的數(shù)據(jù)存儲在數(shù)據(jù)庫中,并與電子商務(wù)行為有機(jī)地結(jié)合起來,通過圖片可以看出,在電子商務(wù)中,數(shù)據(jù)挖掘的體系結(jié)構(gòu)是由商務(wù)數(shù)據(jù)的定義、客戶交互以及分析處理三個主要部分組成的。
1.企業(yè)數(shù)據(jù)定義
本節(jié)中,客戶會通過自身需求來給出數(shù)據(jù)。這些數(shù)據(jù)包括了很多內(nèi)容,如商品信息(產(chǎn)品、產(chǎn)品分類、價格)、內(nèi)容信息(網(wǎng)頁圖片和多媒體)以及活動,這些都是收集和處理數(shù)據(jù)的關(guān)鍵因素。
2.顧客互動
本節(jié)介紹顧客與電子商務(wù)的互動行為,這種互動可能發(fā)生在網(wǎng)站的許多領(lǐng)域,例如客戶服務(wù)和交流應(yīng)用程序。為有效地挖掘這些數(shù)據(jù)源,數(shù)據(jù)收集不只是銷售記錄數(shù)據(jù),還包括其他客戶行為、網(wǎng)站瀏覽網(wǎng)頁等。
3.分析與處理
此環(huán)節(jié)運(yùn)用了大數(shù)據(jù)的統(tǒng)計、數(shù)據(jù)挖掘算法、可視化工具和OLAP工具,建立了交互決策支持環(huán)境,該部分是系統(tǒng)的最后一部分。
四、數(shù)據(jù)挖掘技術(shù)的應(yīng)用
1.尋找潛在客戶
潛在客戶的挖掘第一步則是對客戶群體進(jìn)行分類,有“visitorOlace”和“visitoregular”,對商家來說,從網(wǎng)絡(luò)上的分類中可以看出,通過對已被分類的客戶和老客戶的部分公共描述,新客戶被準(zhǔn)確地分類,新客戶分類之后要對他們進(jìn)行判斷,即判斷他們是有興趣還是無興趣的客戶群,決定新客戶是否是潛在客戶,一旦確定了客戶的類型,就可以向客戶展示網(wǎng)頁的內(nèi)容,而網(wǎng)頁的內(nèi)容則是客戶與銷售商之間的關(guān)系,取決于所提供產(chǎn)品和服務(wù)的相關(guān)規(guī)則。
使用這些規(guī)則,對于新客戶來說,需要花一些時間瀏覽市場網(wǎng)站,如果來自于上面的域名jp或m,那么該客戶可以被看作是潛在客戶,接下來只需要向其顯示關(guān)于jp或Ils的頁面內(nèi)容即可[3]。
2.改善網(wǎng)站設(shè)計
網(wǎng)頁內(nèi)容的排列和連接方式就像超市貨架上的商品。將相關(guān)文章組合起來,給予一定的支持和信任,有助于銷售人員發(fā)現(xiàn)因特網(wǎng)上的關(guān)聯(lián)規(guī)則,從而動態(tài)地適應(yīng)客戶網(wǎng)站的結(jié)構(gòu),使客戶能夠訪問的連接文件之間的連接更加直接,客戶可以輕松地訪問他們可能訪問的頁面,如果網(wǎng)站非常方便瀏覽,就可以給客戶留下好的印象,增加下次訪問的可能性。
3.客戶群
客戶群為e-商業(yè)型。分析這類顧客的共同特點(diǎn),電子商務(wù)組織方就能更好地了解他們的顧客,為顧客提供更加適合他們的服務(wù)。假如有些客戶花些時間在“嬰兒玩具”和“嬰兒退貨”頁面上進(jìn)行分析,把這些客戶組合起來,根據(jù)收集到的信息,銷售者可能知道這是一個“準(zhǔn)父母”客戶。因此要及時調(diào)整頁面和頁面內(nèi)容,使商業(yè)活動與客戶需求保持一致,讓商業(yè)活動對客戶和銷售商更有意義。
五、結(jié)束語
在機(jī)器學(xué)習(xí)的基礎(chǔ)上發(fā)展起來的數(shù)據(jù)挖掘技術(shù),雖然已經(jīng)有十幾年的歷史,但是在實際應(yīng)用中還存在著許多問題,主要是系統(tǒng)結(jié)構(gòu)和典型應(yīng)用方面的問題,但是在電子商務(wù)環(huán)境下,數(shù)據(jù)挖掘技術(shù)仍存在著許多亟待解決的問題。比如,在不同國家或地區(qū)存儲網(wǎng)絡(luò)數(shù)據(jù)的不一致性,以及利用數(shù)據(jù)挖掘技術(shù),利用動態(tài)數(shù)據(jù)庫、對象數(shù)據(jù)庫、多媒體等,另外還要進(jìn)行抽取規(guī)則的準(zhǔn)確性和時效性,數(shù)據(jù)的安全性,隱私性等方面的研究。
參考文獻(xiàn)
[1] 劉紹君,劉宇為.數(shù)據(jù)挖掘技術(shù)在校園電子商務(wù)中的應(yīng)用探索[J].南方農(nóng)機(jī),2020,v.51;No.348(08):217+226.
[2] 高艷敏.分析數(shù)據(jù)挖掘技術(shù)運(yùn)用于電子商務(wù)中的對策[J].電子世界,2020(15).
[3] 趙書慧.電商市場中大數(shù)據(jù)挖掘的分析以及決策探究[J].中國新通信,2020(12