課時(shí)一:概念綜述
1、 大數(shù)據(jù)的定義由來和原因
2、 大數(shù)據(jù)的6V特征
3、 從數(shù)據(jù)庫,數(shù)據(jù)倉(cāng)庫到大數(shù)據(jù)
4、 大數(shù)據(jù)相關(guān)技術(shù)和處理
課時(shí)二:Hadoop生態(tài)圈、spark生態(tài)圈、搜索引擎概述
1、 hadoop:HDFS、Map-Reduce、Hbase、Hive等
2、 spark:scala、spark-SQL、spark-Streaming等
3、 搜索引擎:lucene(solr)、ES
4、 并發(fā)的機(jī)器學(xué)習(xí)工具:R-hadoop、spark-MLLIB、 spark-R、pyspark
課時(shí)三:存儲(chǔ)在hbase中的數(shù)據(jù)
1、 NoSQL(key-value)
2、 Hbase:安裝
3、 行鍵與列簇
4、 如何利用Hbase的特點(diǎn)存儲(chǔ)數(shù)據(jù)
5、 應(yīng)用程序如何訪問Hbase中的數(shù)據(jù)
6、 數(shù)據(jù)遷移:sqoop
7、 Hbase的應(yīng)用場(chǎng)景
課時(shí)四:Hive:為用SQL的開發(fā)者留的活路
1、 Hive:安裝(單用戶與多用戶)
2、 Hive:基本操作
3、 Hive:與典型的關(guān)系型數(shù)據(jù)庫的區(qū)別
4、 如果“想慢”,你可以這樣…(不恰當(dāng)使用hive的案例介紹)
5、 Hive的應(yīng)用場(chǎng)景
課時(shí)五:Spark各組件在衛(wèi)生領(lǐng)域的應(yīng)用
1、 Hadoop最大的特點(diǎn)是什么?
2、 Spark概述與安裝
3、 Scala:你可以一直“點(diǎn)”下去
4、 RDD:“映射”、“轉(zhuǎn)換”解決一切
5、 spark-SQL
6、 spark-streaming
7、 spark的其他組件
8、 應(yīng)用場(chǎng)景
課時(shí)六:機(jī)器學(xué)習(xí)算法介紹—I
1、 綜述(人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、機(jī)器智能、大數(shù)據(jù):這些詞的確切含義)
2、 監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)
3、 工具:R、Python等
4、 決策樹詳解(熵、貪心法、連續(xù)的和離散的)
5、 神經(jīng)網(wǎng)絡(luò)詳解(神經(jīng)元、激勵(lì)函數(shù)、前饋神經(jīng)網(wǎng)絡(luò)的BP算法,其他神經(jīng)網(wǎng)絡(luò))
課時(shí)七:機(jī)器學(xué)習(xí)算法介紹—II
1、 關(guān)聯(lián)規(guī)則詳解(頻繁項(xiàng)集、Apriori、支持度、置信度)
2、 聚類詳解(k-means、k-medoid)
3、 常見算法的簡(jiǎn)述(Na?ve-Bayes、k-NN、HMM、SVM等)
講師課酬: 面議
常駐城市:北京市
學(xué)員評(píng)價(jià):
講師課酬: 面議
常駐城市:深圳市
學(xué)員評(píng)價(jià):
講師課酬: 面議
常駐城市:上海市
學(xué)員評(píng)價(jià):
講師課酬: 面議
常駐城市:深圳市
學(xué)員評(píng)價(jià):
講師課酬: 面議
常駐城市:深圳市
學(xué)員評(píng)價(jià):