訓練職類 電腦程式設計

課程內容
 
展望 目前大數據分析已經逐漸深化於零售、金融、高科技、醫療、製造等產業,其應用可以讓各產業決策者發現行銷契機、使用者習慣和未來趨勢等多方面用途。學員結訓後,可從事的工作內容包括:大數據分析、巨量資料分析、企業資料分析架構規劃與設計、機器學習、資料庫規劃與設計、Java程式設計、Python程式設計、企業電子商務系統設計、營運模式規劃與建置等項目。亦可擔任資料分析師、大數據分析師、資料科學家、人工智慧工程師、機器學習工程師、營運分析工程師、資訊系統顧問、大數據專案經理、行銷企劃人員等職缺。
 

大綱

7. Python程式與資料處理(學)(16小時):1. Python基礎知識與技術 2. REPL 3.型態與運算子 4.函式 5. Python程式效能提升 6. Python資料結構簡介
8. MySQL資料操作與存取(學)(8小時):1. 資料庫概論與 MySQL 2. 基礎查詢 3. 運算式與函式 4.結合與合併查詢 5.資料維護
9. 網路資料爬取與分析(學)(4小時):1.爬蟲概念介紹 2.網頁結構說明 3.資料爬取技巧
10. linux基本指令操作(學)(6小時):1.計算機概論 2.Linux是什麼 3.主機規劃與磁碟分割 4.安裝Linux 5.Linux的檔案權限與目錄配置 6.Linux基本指令
11. Hadoop(學)(4小時):1.資料科學VS資料科技 2.Hadoop核心架構 3. HDFS 分散檔案系統 4. YARN 分散運算系統 5.Hadoop 核心系統特性 6.Hadoop生態系架構
12. Spark(學)(4小時):1.Apache Spark 系統架構 2.分散式資料分析框架 3.Spark 實務應用
13. 數據儲存與管理(學)(4小時):1.HBase 系統運作架構 2.HBase 大數據資料庫 3.檢視 HBase 資料表 4.HBase REST API 5.管理 HBase 資料表
14. 系統分析與設計導論(學)(8小時):1.系統開發程序 2.系統規劃 3.專案定義 4.需求分析方法 5.資料規格書 6.邏輯設計的評估與確認 7.邏輯設計 8.軟體包裝 9.系統輸出設計 10.系統輸入設計
15. 統計應用實務(學)(8小時):1.基本概念:機率、母體 2.樣本與抽樣 3.敘述統計:次數分配(交叉分析)、平均數、變異數、中位數、眾數
16. AI機器學習與深度學習(學)(8小時):1.預測(含分類):迴歸(線性、邏輯等)、類神經網路(BPN、DNN)、支援向量機 2.分類:決策樹、C5.0、隨機森林、決策森林
17. 影像辨識(學)(4小時):1. 影像處理觀念介紹 2. OpenCV建置與函式庫實務應用 3. 影像格式與資料結構型態 4. 影像讀取與通道轉換
18. 自然語言處理(文字分析)(學)(4小時):1. 文字的向量表示法 (Word Vector Representations):自然語言斷詞方法介紹、文字向量化的應用說明、文字向量化程式追蹤。 2. 自然語言文句處理:自然語言斷詞方法介紹、建立自然語言單字表 3. 自然語言文章分類:自然語言文章的分類應用、自然語言文章分類架構說明 4. 自然語言語意解析:自然語言語意解析方法介紹、自然語言語意解析訓練方法說明。
19. 大數據圖表視覺化技術(學)(16小時):1.常用屬性或方法 2.資料結構 3.載入資料 4.資料清理 5.整併資料庫資料 6.UI/UX概念
20. 企業案例專題實作(學)(4小時):1.數據整理與創意發想 2.相關文獻探討
21. Python程式與資料處理(術)(24小時):1.集合 2.流程語法 3.函式應用 4.邏輯判斷 5.類別 6.繼承 7.例外處理 8.io 9.資料分析 10.Python與資料庫互動 11.除錯 12.Python綜合練習 13.設計整合測試情境
22. MySQL資料操作與存取(術)(24小時):1.字元集與資料庫 2.儲存引擎與資料型態 3.表格 4.索引 5.子查詢 6.Views 7.資料庫資訊 8.錯誤處理與查詢 9.匯入與匯出資料
23. 網路資料爬取與分析(術)(10小時):1.Python爬蟲程式設計 2.Python爬蟲效能調整 3.網頁結構剖析 4.bs4資料爬取
24. linux基本指令操作(術)(15小時):1.安裝CentOS 2.安裝Ubuntu Server版本 3.Nginx + PHP-FPM(PHP7)建置步驟(Ubuntu18.04) 4.Django Nginx+uwsgi 安裝配置 5.Apache + MariaDB + PHP(CentOS 7)
25. Hadoop(術)(20小時):1.Hadoop叢集設定 2.建立及啟動Hadoop叢集貨櫃主機 3.Cluster設定目錄結構 4.格式化HDFS分散檔案系統 5.啟動並檢視 HDFS 系統架構並檢視根目錄權限 6.HDFS操作命令 7.單體平行應用系統架構 (Monolithic) 8.MapReduce Shuffle 設定 9.YARN 分散運算系統運作圖 10.啟動及檢視YARN 分散運算系統
26. Spark(術)(20小時):1.Spark實務應用 2.設定Spark Standalone 叢集運作架構 3.建立啟動 Spark Standalone貨櫃主機 4.啟動 spark-shell (scala interpreter) 5.啟動 pyspark 交談模式 6.以交付模式執行 Python 應用程式 7.叢集佈署模式執行 pi.py 8.安裝Anaconda 9.設定 Spark 叢集使用 Anaconda 10.啟動 Spark Standalone 叢集系統 11.啟動及設計 Jupyter Server 啟動命令 12.建立 Python NoteBook
27. 數據儲存與管理(術)(20小時):1.資料科學家登入 Hadoop Client 2.建立 Hbase資料集資料表 3.撰寫與直行Pig程式 4.設定Hive並建立Hive資料表 5.啟動HBaseREST服務 6.管理 HBase資料表 7.建立分割資料表 8.實作練習
28. 統計應用實務(術)(8小時):1.估計:點估計、區間估計 2.假設檢定:T檢定、F檢定、Z檢定 3.單因子變異數分析 4.相關與迴歸
29. AI機器學習與深度學習(術)(32小時):1.維度減少法:主成份分析法、線性判別分析法、遺傳演算法 2.分群:兩階段分群、K-mean、自我映射網路 3.關聯:單一維度關聯、週期性關聯、多維度關聯 4.深度學習:CNN、RNN、LSTM、AutoEncoder
30. 大數據圖表視覺化技術(術)(24小時):1.資料彙整 2.數據視覺化Matplotlib 3.數據視覺化Seaborn 4.數據視覺化Bokeh 5.線性迴歸 6.Logistic迴歸 7.資料探勘與文字斷詞分析 8.版本控制軟體
31. 企業案例專題實作(術)(60小時):1.實作分工 2.開發設計 3.測試 4.驗證與修改 5.簡報製作 6.報告演練 7.專題系統開發 (1)系統架構設計 (2)系統實作開發 (3)實驗設計 (4)數據分析 (5)結論與展望