訊息公告

AI知識幻覺

Published on
Author
魏彣芯

布爾斯汀(Daniel J. Boorstin; 1914-2004)。林一平/繪

文/林一平 講座教授

哈佛前校長Bok有一句名言常被學校用來說服學生繳納學費:「如果你覺得教育昂貴,那就試試無知吧(If you think education is expensive, try ignorance)。」這樣的說法真能反映現實嗎?這是個值得深入探討的問題。美國國會圖書館前館長布爾斯汀(Daniel J. Boorstin)則認為,「無知」並非進步的最大阻礙,「知識的幻覺」才是人類探索和創新活動的主要障礙。他說:「過去一些偉大的發現者都與現有已知的事實和學過的知識作鬥爭。要突破這種知識的幻覺,不僅需要深厚的學識,更需要極大的想像力來超越現有框架。」

隨著AI技術在各行各業中的廣泛應用,最令人擔憂的是陷入「AI知識幻覺」的陷阱。今日我們常用的AI技術,不論是分析型(Analytic)AI或生成式(Generative)AI,都依賴正確標註的數據進行訓練。然而,許多學校在教授AI時往往忽略了數據本身的重要性。結果,學生們常常不清楚輸入數據的特性,甚至標註錯誤,未經驗證就急於將數據投入AI模型,導致「垃圾進,垃圾出」(Garbage in, Garbage out)的現象。這種不適當的AI發展不僅浪費了大量的算力和電力,還助長了「AI知識幻覺」。結果是,教育成本隨之增加。因此,學生學習如何理解和使用正確的數據(包括質與量)才是台灣是否能AI大躍進的關鍵。

台灣可用於AI訓練的數據量遠少於美國和中國。而數據格式的混亂及不互通更成為阻礙AI技術發展的重要挑戰。農業部洞悉此一問題,在發展智慧農業時特別重視數據格式的標準化,讓各種農業物聯網設備能互通,這是一個具有遠見的舉措。在業界,不少公司早已注重數據科學(Data Science),例如華邦電子在其新進員工訓練中加入了數據科學相關內容,讓他們了解能處理公司數據的重要性,我也有幸曾受邀擔任相關課程的講師。

經濟部中小企業署最近積極規畫培訓傳統企業導入AI,並邀請專家學者編撰教學教材。署方在檢視初版授課大綱後,發現教材偏重於資訊專業論述,不適合其他非資訊領域的學員。經過多次討論後,我們認為課程重點應該是讓學員了解數據,而非專注於學習AI模型的原理。例如在紡織廠,員工需要學習的是了解紡織機生成的數據代表什麼意義、如何正確標註這些數據,並知道如何找到對應的AI工具來解決問題。在運用AI工具時,講師不應要求紡織員工學習電腦語言、修改AI模型或填寫超參數,因為這樣會增加學習難度。正確的方法是找到友善的AI工具,學員只需通過圖形化介面輸入專業數據即可獲得結果,無需編寫程式。

我的結論是,非資訊領域的百工百業要實現AI賦能,應培訓員工了解其專業數據,並提供不需編寫程式的AI工具。而AI專家的責任則在於開發這樣的無碼工具,最好能如ChatGPT這般親民。只有百工百業的員工了解自己專業的數據,運用AI時才不會造成知識的幻覺。