學習分析方法 :

機器學習

機器學習是最近蓬勃發展的領域,其乃是包含於人工智慧範疇的資個部分。機器學習的主要精神為「學習」,有別於一般早期的演算法大多是較為固定的規則,機器學習機制擁有以透過訓練資料集所改變判斷過程的宗旨。顯然,機器學習是實現人工智慧的一個方法,也就是以機器學習為手段來解決人工智慧中的所面臨的問題。

 

機器學習在多年來的發展之下已然形成一個盤根錯節的多領域交叉學科,其內容涉及機率、統計、逼近論、凸分析、計算複雜性理論等眾多科學領域。機器學習得理論主要設計、分析一些使電腦可以自動「學習」的演算法,並如同其他相關領域一樣,可以區分成監督式、半監督式、非監督式三種類別。機器學習是從數據中自動地分析並得到規律,再利用規律針對未知資料進行預測的演算法。

 

現今機器學習廣泛應用於資料探勘、自然語言處理、生物特徵識別、醫學診斷、DNA序列測序、電腦視覺、搜尋引擎、語音和手寫識別、檢測信用卡欺詐、金融市場分析、戰略遊戲和機器人等領域。

 

近來的自動駕駛系統,備受爭議的UBER服務系統,乃至於轟動一時,在圍棋中擊敗無數人類頭腦的AlphaGo也相當程度的用運了機器學習的精神,機器學習儼然成為人類生活中,不可或缺的一部分。

學習分析議題 --- 知識地圖 & 學習路徑:

資料視覺化與適性化學習路徑推薦機制

透過資料視覺化工具來應用到各種校務研究與教學應用中,像是從教學者的角度來看,透過這些資料視覺化成果能夠即時提供學習者的學習回饋或是預測學習教材的安排進度或是提供具體的學習建議,達到因材施教的目的。

 

更進一步從學習者的角度來看,也可透過這些視覺化成果來預測學生的學習行為或是學習困難或是預測學習者的學習路徑和人格特質與學習取向。

應用大數據分析來推薦適合學習者的學習教材,此適性化學習教材推薦機制共分為兩個主要部分:

 

1. 自動建立學習物件之間的關聯程度

2. 產生適合學習者的學習教材

 

自動建立學習物件的關聯程度的部分是結合Parallel FP-Growth演算法和貝式分類器(Bayesian classifier)來建構關聯規則,並透過此規則自動找出學習物件之間的關聯程度。

產生適合學習者的學習教材的部分則是使用Rough leader 演算法針對學習者歷程資料進行分析並產生相似分群模型,最後就可以推薦適合學習者的適性化學習教材。

大數據平台環境:

Hadoop

Hadoop 是一個叢集系統(cluster system),也就是由單一伺服器擴充到數以千計的機器,整合應用起來像是一台超級電腦。

 

使用 HDFS 分散式檔案系統(Hadoop Distributed File System)提供可靠的資料儲存,以及提供簡單的 MapReduce 程式設計模型以平行處理和分析資料。

Spark

一種平行處理架構,可支援記憶體內的處理,大幅提升巨量資料分析應用程式、SQL 之 Spark 工作、串流資料與機器學習的效能

 

使用了記憶體內運算技術,能在資料尚未寫入硬碟時即在記憶體內分析運算。Spark在記憶體內執行程式的運算速度能做到比Hadoop MapReduce的運算速度快上100倍,即便是執行程式於硬碟時,Spark也能快上10倍速度。[1]Spark允許用戶將資料加載至叢集記憶體,並多次對其進行查詢,非常適合用於機器學習演算法。

聯絡方式

地址:
(32001) 桃園縣中壢市五權里 2 鄰中大路 300 號
國立中央大學工程五館 E6-B320

Tel: 03 - 4227151 分機: 35353