一、 課程名稱: R語言與統計(□實體授課(為宜) ■線上教學)
二、開課類別:■資訊及程式相關課程 ■考核之相關課程 □EMI課程
(此3項無則免勾選)
□講座 □展演 □實作 ■工作坊
(此4項務請至少擇1勾選)
三、開課學年度:114學年度第2學期 (■常年開設)
四、基本資料:
(一) 總授課時數:18小時( 9或18小時)
(二) 授予學分數:1學分(0.5或1學分)
(三) 學分認抵領域:通識-共同選修
(四) 招生人數:無限制
(五) 開課單位(學分認抵單位):通識教育中心
(六) 協同開課單位: ■教發發展中心
(七) 備註:(可填寫課程時間、報名方式、報名時間、錄取公告方式等事項)
五、 課程介紹(課程宗旨、先備知識等):隨著資料驅動決策(Data-driven decision making)成為現代社會的核心趨勢,R 語言已成為資料科學、統計分析與研究界的主力工具之一。本課程從零開始,帶領學員認識統計思維與 R 語言的操作邏輯,從資料讀取、清理、轉換、分析,到視覺化與機器學習實作。
課程強調「理論結合實務」,以 開放資料(Open Data) 為分析素材,透過循序漸進的練習,引導學生完成一個完整的資料分析專案,具備以資料說故事(Data Storytelling)的能力。
六、 課程目標:
(一) 熟悉 R 語言與統計概念:理解抽樣、分佈與假設檢定等基礎統計學原理。
(二) 掌握 R 的資料處理技巧:熟悉資料結構、條件判斷、迴圈與函數操作。
(三) 具備 tidyverse 資料清理能力:能使用 dplyr、tidyr 進行資料篩選、合併與轉換。
(四) 進行資料探索與視覺化:以 ggplot2 與 plotly 呈現資料洞見,培養資料故事力。
(五) 了解機器學習應用:實作迴歸、分類與分群分析模型。
(六) 整合專案實作能力:能結合 Open Data,完成從資料取得到報告展示的完整分析專案。
七、 授課教師:洪振倫、黃海潮老師
八、 與通識基本素養之關聯性:□公民涵養 □自然生態 □藝術美學
■資訊科技 □健康樂群 □人文反思
九、 課程進度:
|
課程次別 |
課程日期/ 時間 |
授課教師 |
上課內容/主題 |
時數 |
|
1 |
預計114學年度第2學期起,開放於線上平台給學生學習。 |
洪振倫老師 |
Part I:R 語言與統計基礎 認識 R 與統計學基礎 R 語言基本指令 R 的資料結構 條件判斷與迴圈 抽樣與機率分配 中央極限定理實驗 |
6 |
|
2 |
||||
|
3 |
||||
|
4 |
||||
|
5 |
||||
|
6 |
||||
|
7 |
Part II:資料匯入與前處理 匯入資料與讀取 Excel tidyverse 工具箱介紹 資料清理技巧 I(遺漏值、重複值處理) 資料清理技巧 II(篩選與轉換) 資料合併與轉置操作 假設檢定與統計推論 |
6 |
||
|
8 |
||||
|
9 |
||||
|
10 |
||||
|
11 |
||||
|
12 |
||||
|
13 |
Part III:資料探索與機器學習 資料探索與 EDA(描述統計、相關分析) R 視覺化基礎(plot、hist、boxplot) ggplot2 與 plotly 互動式圖表 監督式學習:迴歸與分類分析 非監督式學習:分群實戰 Open Data 專案整合與成果展示 |
6 |
||
|
14 |
||||
|
15 |
||||
|
16 |
||||
|
17 |
||||
|
18 |
||||
|
總時數 |
18 |
|||
十、 評量方式:完成觀看影片、課後測驗達60分及格通過。
(一) 每45分鐘會有3-5題選擇題,總共會有30題選擇題
每題3分,總分100分,達到60分即可通過,及問答題形式。
(二) 實作作品報告繳交:繪出圖表後截圖上傳報告等形式。
十一、 參考書籍與內容 :
(一) Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. (2017). An Introduction to Statistical Learning: With Applications in R. New York: Springer.
(二) 陳基國. (2024). 基礎統計與R語言. 台北:五南圖書出版股份有限公司。
(三) Jared P. Lander. (2018). 精通大數據!R語言資料分析與應用(第2版)(鍾振蔚譯). 台北:旗標科技股份有限公司。