
- 7 1 月, 2020
- AI.com.tw行銷部
- AI 新聞
準備開始接觸 AI 了嗎?也許你已經稍微涉獵過機器學習的世界,但還想補齊那些聽過卻一直沒空深入的主題?這篇文章會是個不錯的起點。
NLP – 自然語言處理(Natural Language Processing)
自然語言處理是一種讓電腦能理解人類語言的技術。所謂「自然語言」,指的就是我們平常說話或寫文章時用的語言。透過這項技術,電腦不只可以讀懂文字,還能分析、理解,甚至做出對應的回應。
常見的應用像是:
- 幫你從長篇文章中整理出重點(文件摘要)
- 客服機器人能看懂提問並自動回應
- 語音助理可以理解指令並執行(例如叫 Siri 播放音樂)
強化學習(Reinforcement Learning)
強化學習是一種透過「試錯」來學習的方法。就像電腦在玩一個遊戲,它不斷嘗試不同的策略,從中找出能讓自己得分最多的方法。每做對一次,它就會得到獎勵;做錯就沒有分數,甚至被扣分。長時間下來,它會學會怎麼做最有效率。
這種方法常應用在下棋、打遊戲、機器人動作控制,或像自動駕駛系統中,車輛學習如何安全地轉彎、煞車、避障。
資料集(Dataset)
在機器學習中,我們訓練和測試模型時所用的資料,通通叫做「資料集(Dataset)」。資料科學家通常會把資料分成三種用途:
-
訓練資料(Training Data):這是模型「學習」的資料。模型會透過這些資料來找出規律,學會判斷哪些特徵在預測中最重要。
-
驗證資料(Validation Data):這是用來「調整模型設定」或比較不同模型效果的資料。它不能跟訓練資料重複,否則模型可能學太多細節(稱為過度擬合),對新資料的預測反而不準。
-
測試資料(Test Set / Hold-out Set):這是最後驗證模型好不好的資料,用來模擬模型遇到真正新資料時的表現。它在模型訓練與比較過程中都沒被用過。
雖然聽起來有點繁瑣,但這三步驟就像是「學習 → 微調 → 考試」的過程,缺一不可。
當你在帶領團隊或評估 AI 專案時,理解這些基本術語能幫助你更快掌握溝通重點,也更容易與技術團隊對話。即使你不是工程師,熟悉 NLP、強化學習與資料集的概念,仍能在決策中扮演關鍵角色。AI 並非遙不可及的技術,只要懂得切入點,你也能成為推動轉型的引路人。