掌握數(shù)據(jù)分析的方法,掌握數(shù)據(jù)挖掘中常用的分類分析、關(guān)聯(lián)分析、聚類分析,掌握數(shù)據(jù)挖掘應(yīng)用的開展流程和要點(diǎn),了解電子渠道領(lǐng)域?qū)嶋H數(shù)據(jù)挖掘案例
時間安排 | 大綱 | 課程內(nèi)容 | 課程收獲 |
**天上午 | 破冰開場 | 1. 開篇故事:阿里巴巴的秘密武器 2. 課程收益 3. 組建學(xué)習(xí)團(tuán)隊(duì) 4. 達(dá)成共識 | l 破冰 l 激發(fā)學(xué)習(xí)興趣 l 培訓(xùn)紀(jì)律 |
**天上午 | 數(shù)據(jù)挖掘引論 | 1. 數(shù)據(jù)化運(yùn)營 1.1. 現(xiàn)代營銷理論的發(fā)展 1.1.1. 從4P到4C 1.1.2. 從4C到3P3C 1.2. 數(shù)據(jù)化運(yùn)營的主要內(nèi)容 1.3. 為什么要數(shù)據(jù)化運(yùn)營 1.4. 數(shù)據(jù)化運(yùn)營的必要條件 2. 數(shù)據(jù)分析與數(shù)據(jù)挖掘 2.1. 什么是數(shù)據(jù)分析? 2.2. 什么是數(shù)據(jù)挖掘? 2.3. 數(shù)據(jù)挖掘的起源 2.4. 數(shù)據(jù)挖掘的任務(wù) 2.5. 數(shù)據(jù)挖掘主要成熟技術(shù) 2.5.1. 決策樹 2.5.2. 神經(jīng)網(wǎng)絡(luò) 2.5.3. 回歸分析 2.5.4. 關(guān)聯(lián)規(guī)則 2.5.5. 聚類分析 2.5.6. 貝葉斯分類方法 2.5.7. 支持向量機(jī) 2.5.8. 主成分分析 2.5.9. 假設(shè)檢驗(yàn) 2.6. 電信及互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)挖掘應(yīng)用的特點(diǎn)
| l 了解數(shù)據(jù)挖掘的主要用途 l 了解數(shù)據(jù)挖掘的概念、流程、主要技術(shù) |
**天上午 | 電子渠道數(shù)據(jù)分析工具 | 1. 數(shù)據(jù)類型 1.1. 屬性與度量 1.2. 數(shù)據(jù)集的類型 2. 數(shù)據(jù)質(zhì)量 3. 數(shù)據(jù)預(yù)處理 3.1. 聚集 3.2. 抽樣 3.3. 特征創(chuàng)建 3.4. 離散化和二元化 3.5. 變量變換 4. 匯總數(shù)據(jù) 4.1. 頻數(shù)和眾數(shù) 4.2. 百分位數(shù) 4.3. 位置度量:均值和中位數(shù) 4.4. 散布度量:極差和方差 4.5. 多元匯總方法 4.6. 其他匯總數(shù)據(jù)的方法 5. 數(shù)據(jù)可視化 5.1. 可視化一般概念 5.2. 可視化技術(shù) 5.3. 可視化高維數(shù)據(jù) 6. OLAP和多維數(shù)據(jù)分析 6.1. 多維數(shù)據(jù)一般情況 6.2. 分析多維數(shù)據(jù)
| l 掌握數(shù)據(jù)分析的基本概念、方法 l 掌握數(shù)據(jù)探索的基本方法 l 掌握可視化和OLAP的基本方法 |
**天下午 | 分類分析的方法與技術(shù) | 1. 解決分類問題的一般方法 2. 決策樹歸納法 2.1. 決策樹的工作原理 2.2. 如何建立決策樹 2.3. 選擇佳劃分的度量 2.4. 決策樹歸納算法 3. 模型的過分?jǐn)M合 4. 評估分類器的性能 5. 基于規(guī)則的分類器 6. 近鄰分類器 7. 貝葉斯分類器 8. 人工神經(jīng)網(wǎng)絡(luò) 9. 支持向量機(jī) 10. 組合方法 11. 不平衡類問題 12. 多類問題 13. 案例:分類分析案例
| l 掌握分類分析的方法和技術(shù) |
第二天 | 關(guān)聯(lián)分析的方法與技術(shù) | 1. 問題定義 2. 頻繁項(xiàng)集的產(chǎn)生 3. 規(guī)則產(chǎn)生 4. 頻繁項(xiàng)集的緊湊表示 5. FP增長算法 6. 關(guān)聯(lián)模式的評估 7. 處理分類屬性 8. 處理連續(xù)屬性 9. 處理概念分層 10. 序列模式 11. 子圖模式 12. 案例:關(guān)聯(lián)分析案例
| l 掌握關(guān)聯(lián)分析的方法與技術(shù) |
第三天 | 聚類分析的方法與技術(shù) | 1. 聚類分析的概念 2. K均值 3. 凝集層次聚類 4. DBSCAN聚類算法 5. 簇評估 6. 數(shù)據(jù)和簇特征 7. 基于原型的聚類 8. 基于密度的聚類 9. 基于圖的聚類 10. 可伸縮的聚類算法 11. 案例:聚類分析案例
| l 掌握聚類分析的方法和技術(shù) |
第四天上午 | 數(shù)據(jù)挖掘應(yīng)用要點(diǎn) | 1. 數(shù)據(jù)挖掘是跨專業(yè)款團(tuán)隊(duì)的合作 1.1. 數(shù)據(jù)分析團(tuán)隊(duì)與業(yè)務(wù)團(tuán)隊(duì)的分工和定位 1.2. 數(shù)據(jù)分析團(tuán)隊(duì)與業(yè)務(wù)團(tuán)隊(duì)的協(xié)同作業(yè) 1.3. 案例:阿里巴巴數(shù)據(jù)挖掘團(tuán)體架構(gòu) 2. 數(shù)據(jù)分析師是分析團(tuán)隊(duì)的靈魂 2.1. 數(shù)據(jù)分析師常見錯誤觀念 2.1.1. 輕視業(yè)務(wù)論 2.1.2. 技術(shù)萬能論 2.1.3. 技術(shù)尖端論 2.1.4. 建模與應(yīng)用兩段論 2.1.5. 機(jī)器萬能論 2.2. 數(shù)據(jù)分析師品質(zhì)和思維模式培養(yǎng) 2.2.1. 態(tài)度決定一切 2.2.2. 商業(yè)意識是核心 2.2.3. 一個基本的方法論 2.2.4. 大膽假設(shè),小心求證 2.2.5. 結(jié)構(gòu)化思維 2.2.6. 主觀與客觀的結(jié)合 2.3. 數(shù)據(jù)挖掘的質(zhì)量保障制度與流程 2.3.1. 業(yè)務(wù)需求的收集 2.3.2. 評估需求的優(yōu)先級 2.3.3. 課題組的成立及前期摸底 2.3.4. 提交正式課題計劃書 2.3.5. 數(shù)據(jù)挖掘課題展開 2.3.6. 提交結(jié)論報告及業(yè)務(wù)落地應(yīng)用建議書 2.3.7. 效果監(jiān)控反饋
| l 理解數(shù)據(jù)分析團(tuán)隊(duì)的特點(diǎn) l 理解數(shù)據(jù)分析的要求 l 掌握數(shù)據(jù)分析應(yīng)用的開展流程 |
第四天上午 | 電子商務(wù)數(shù)據(jù)分析與挖掘工具 | 1. SPSS數(shù)據(jù)文件的建立和管理 2. SPSS數(shù)據(jù)的預(yù)處理 2.1. 數(shù)據(jù)的排序 2.2. 變量計算 2.3. 數(shù)據(jù)選取 2.4. 計數(shù) 2.5. 分類匯總 2.6. 數(shù)據(jù)分組 3. SPSS基本統(tǒng)計 3.0.1. 頻數(shù)統(tǒng)計 3.0.2. 計算基本統(tǒng)計量 3.0.3. 交叉分組統(tǒng)計 3.0.4. 多選項(xiàng)分析 3.0.5. 比率分析 4. SPSS的參數(shù)檢驗(yàn) 5. SPSS的方差分析 6. SPSS的相關(guān)分析與線性回歸分析 7. SPSS的聚類分析 7.1. 一般聚類 7.2. 層次聚類 7.3. K-Means聚類
| l 掌握SPSS的基本用法 |
第四天下午 | 電子商務(wù)常見數(shù)據(jù)挖掘項(xiàng)目 | 1. 目標(biāo)客戶的預(yù)測/響應(yīng)/分類模型 2. 用戶路徑分析模型 3. 交叉銷售模型 4. 信息/用戶質(zhì)量模型 5. 服務(wù)保障模型 6. 用戶/買家/賣家分層模型 7. 交易模型 8. 信用風(fēng)險模型 9. 用戶流失模型 10. 商品推薦模型
| l 掌握常見數(shù)挖掘項(xiàng)目的要點(diǎn) |
第四天下午 | 電子商務(wù)數(shù)據(jù)挖掘案例 | 1. 基于數(shù)據(jù)挖掘的電子渠道分類模型 2. 基于數(shù)據(jù)挖掘技術(shù)的通信行業(yè)電子渠道營銷平臺設(shè)計與實(shí)施 3. 阿里巴巴數(shù)據(jù)挖掘經(jīng)典案例全程演示——免費(fèi)會員成熟度分析及付費(fèi)用戶轉(zhuǎn)化 | l 了解電子渠道數(shù)據(jù)挖掘案例 |
講師課酬: 面議
常駐城市:北京市
學(xué)員評價:
講師課酬: 面議
常駐城市:深圳市
學(xué)員評價:
講師課酬: 面議
常駐城市:上海市
學(xué)員評價:
講師課酬: 面議
常駐城市:深圳市
學(xué)員評價:
講師課酬: 面議
常駐城市:深圳市
學(xué)員評價: