
- 7 1 月, 2020
- admin
- AI 新聞
準備開始接觸 AI 了嗎?也許你已經稍微涉獵過機器學習的世界,但還想補齊那些聽過卻一直沒空深入的主題?這篇文章會是個不錯的起點。
NLP – 自然語言處理(Natural Language Processing)
自然語言處理是一種讓電腦能理解人類語言的技術。所謂「自然語言」,指的就是我們平常說話或寫文章時用的語言。透過這項技術,電腦不只可以讀懂文字,還能分析、理解,甚至做出對應的回應。
常見的應用像是:
- 幫你從長篇文章中整理出重點(文件摘要)
- 客服機器人能看懂提問並自動回應
- 語音助理可以理解指令並執行(例如叫 Siri 播放音樂)
強化學習(Reinforcement Learning)
強化學習是一種透過「試錯」來學習的方法。就像電腦在玩一個遊戲,它不斷嘗試不同的策略,從中找出能讓自己得分最多的方法。每做對一次,它就會得到獎勵;做錯就沒有分數,甚至被扣分。長時間下來,它會學會怎麼做最有效率。
這種方法常應用在下棋、打遊戲、機器人動作控制,或像自動駕駛系統中,車輛學習如何安全地轉彎、煞車、避障。
資料集(Dataset)
在機器學習中,我們訓練和測試模型時所用的資料,通通叫做「資料集(Dataset)」。資料科學家通常會把資料分成三種用途:
-
訓練資料(Training Data):這是模型「學習」的資料。模型會透過這些資料來找出規律,學會判斷哪些特徵在預測中最重要。
-
驗證資料(Validation Data):這是用來「調整模型設定」或比較不同模型效果的資料。它不能跟訓練資料重複,否則模型可能學太多細節(稱為過度擬合),對新資料的預測反而不準。
-
測試資料(Test Set / Hold-out Set):這是最後驗證模型好不好的資料,用來模擬模型遇到真正新資料時的表現。它在模型訓練與比較過程中都沒被用過。
雖然聽起來有點繁瑣,但這三步驟就像是「學習 → 微調 → 考試」的過程,缺一不可。
當你在帶領團隊或評估 AI 專案時,理解這些基本術語能幫助你更快掌握溝通重點,也更容易與技術團隊對話。即使你不是工程師,熟悉 NLP、強化學習與資料集的概念,仍能在決策中扮演關鍵角色。AI 並非遙不可及的技術,只要懂得切入點,你也能成為推動轉型的引路人。
Lina
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Cras porta lacus lorem desio interdum lacus ac purus rhon cus, consequat viverra diam vehicula.
Jayz Marcop
Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.