
- 21 2 月, 2020
- AI.com.tw行銷部
- AI 新聞
剛開始接觸 AI 機器學習嗎?也許你已經稍微玩過一些模型、聽過像是 NLP 或強化學習這些名詞,但一直沒有系統性地了解它們到底是什麼、怎麼運作。這篇文章整理出 AI 入門最常見的三個核心觀念:自然語言處理(NLP)、強化學習(Reinforcement Learning)、資料集(Dataset),用簡單易懂的方式帶你快速打好基礎,幫助你不再只懂皮毛,真正進入 AI 世界的大門。
NLP – 自然語言處理(Natural Language Processing)
自然語言處理(NLP)是機器學習中一系列方法的總稱,目的是讓電腦能夠理解、分析並執行人類語言(不論是書寫或口說)的操作。
自然語言處理的主要應用情境包括:
這項任務的目標通常是預測文件的分類(標籤),或根據文件的相關性進行排名。常見例子如垃圾郵件過濾(判斷 Email 是否為垃圾信)或內容分類(從網路上選出與競爭對手有關的新聞文章)。
強化學習(Reinforcement Learning)
強化學習的做法和其他機器學習方法有所不同。在強化學習中,演算法就像是在「玩一場遊戲」,目的是最大化獎勵,電腦透過不斷試驗不同的動作(Move),以「試錯法」方式學習,觀察哪些策略能獲得最多利益。
資料集(Dataset)
所有用來建立或測試機器學習模型的資料,統稱為「資料集」。資料科學家通常會將資料集分為三種:
-
訓練資料(Training Data):用來訓練模型,讓模型透過這些資料學習如何辨識模式或判斷哪些特徵對預測最重要。
-
驗證資料(Validation Data):用來調整模型參數或比較不同模型的效果。驗證資料與訓練資料不同,不應出現在訓練過程中,否則模型可能會過擬合,導致無法準確預測新的資料。
-
測試資料(Test Data):這是最終用來評估模型表現的資料,模擬模型在完全未曾接觸過的資料上的行為,也常被稱為「保留集(hold-out)」。
當你開始接觸 AI 機器學習時,可能會遇到許多專有名詞與技術概念,這篇內容簡要介紹了三個基礎主題:自然語言處理(NLP)、強化學習(Reinforcement Learning) 和 資料集(Dataset)。NLP 是讓電腦理解人類語言的技術,應用在垃圾郵件過濾與內容分類;強化學習則讓 AI 透過試錯學習決策、持續優化行為;而資料集則是模型訓練的基礎,需妥善分為訓練、驗證與測試三類。
掌握這些基礎觀念,是邁入 AI 世界的重要第一步。
Lina
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Cras porta lacus lorem desio interdum lacus ac purus rhon cus, consequat viverra diam vehicula.
Jayz Marcop
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Cras porta lacus lorem desio interdum, consequat viverra diam vehicula.
Natasa Lina
Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.