唐鳳（左），中華民國數位治理大使、首任數位發展部部長、數位外交「台灣模式」的構築者、2025 年正命獎得主，聆聽荊柏鈞博士（右），牛津全球與區域研究學院台灣研究資深研究員兼計畫主任，談論達賴喇嘛尊者與教宗良十四世關於 AI 的智慧之語；攝於「從憤怒到交集：仁工智慧與關懷六力」演講，地點為英國牛津大學聖安東尼學院日產日本研究所。

攝影：黃飛揚, MD PhD。

謝謝 Roger，謝謝 Bo-Jiun，謝謝各位前來——也謝謝台灣研究系列講座在聖安東尼學院主辦這場活動。

今天我想分享一個非常簡單的論點，分成三個樂章。第一：自由軟體教會我們修復。第二：AI 目前正威脅著修復——當它把修復的迴圈封閉起來時。第三：仁工智慧應當以一個標準來評斷，那就是它是否提升了一個社群照顧自己、也照顧他人的能力——也就是「公民肌力」。

50%

但我想開場時不從數學談起，而從非常私人的事談起。我出生時有先天性心臟缺陷。我五歲時，醫生告訴我父母，這個孩子能不能活到動矯正手術，只有一半一半的機會；那場手術我十二歲時才做。父母被告知要讓我凡事放輕鬆。這個「勿忘人終有一死」（memento mori）的時刻，正是我採取「先發表、再凋零」（publish before perishing）這個座右銘的原因。這大概不是醫生囑咐的那種低壓力生活，但我養成了一個習慣：把每天學到的東西全都記錄下來——先是錄在卡式錄音帶上（在座有些人或許還記得卡帶），接著是磁碟片，先是大片的、後來是小片的，最後是網際網路，這個各位想必都很熟悉。所以每晚入睡前，覺得這彷彿是一場擲硬幣的賭局，我就想：我沒有時間把作品做到完美，所以我必須把手上任何進行中的半成品都先發表出去。

光照進來

我就是這樣遇見了自由軟體社群的那道光。如果你在那裡貼出某個完美的東西，大家只會說「嗯，不錯」，然後就走開了。但如果你在網路上犯了錯，你會交到一大票朋友——光，就這樣照了進來。每個人都跳進來：這裡這樣是錯的，那裡那樣是錯的；而他們合在一起，就為我正在做的任何專案投進了新的光。

那道光，呼應了我最喜愛的創作歌手、加拿大的李歐納・柯恩（Leonard Cohen）：

鐘能敲響就敲響，十全樽俎莫指望；萬事萬物都有缺口，缺口就是光的入口。

我十五歲時學會了那個習慣。到了二十五歲，我已逐漸相信：關於一個系統，真正重要的問題並不是它是否完美——沒有任何軟體系統是完美的——而是受這個系統影響、繼承這個系統的人們，在出問題時是否還能修復它。也就是說：東西壞了，你是否還能把那兩半都留在手上、自己把它修好？

帶著這份精神，到了三十五歲，我加入了台灣的內閣，以激進透明與參與作為主要的施政主軸。我們靠群眾外包度過了疫情與「資訊疫情」（infodemic）——靠的是在全國面前展現自身的脆弱。如今我擔任台灣的網路大使，過去這幾年走訪了二十八個國家，每週都在換時區。快到根本來不及產生時差（jet lag）——對我來說，現在只剩下「噴射衝勁」（jet boost）了。

所以我來到這裡，是以一個曾在台灣內部設計出某樣東西、如今正試圖弄清楚這個設計——這道「尋光的裂縫」——是否能在全球成立的身分前來。而在牛津，我很榮幸能與身處一個數百年、甚至上千年實驗之中的同仁們並肩。

1602

博德利圖書館（Bodleian Library）本身就是一場四百年的實驗，因為它的書是可被檢視的，沒有被圈禁起來。讀者留下的痕跡，在被保存下來的地方，會成為下一代閱讀經驗的一部分。這個圖書館網絡不圈禁任何東西；那些文獻永遠為下一位讀者敞開著。

在我自己的領域、也就是軟體工程裡，我們有所謂的「軟體自由」——「四大自由」——一個非常相似、用程式碼寫下的承諾。所以我想拋給在座的問題是：當 AI 系統、特別是生成式 AI 系統加入這個底層基質時，那個關於「持續修復與自由」的承諾，會發生什麼事？

四大自由

四大自由是在 1980 年代被定義出來的，當時是作為軟體授權條款；但今天，我想把它們重新解讀為「公民肌力」。第零號自由意味著：一旦你擁有了一支程式，你應當能夠為任何目的執行它；設計者不該限制你拿它來做什麼。對我來說，這就是關注這塊肌肉——你可以為這間特定的教室、這間診所、這座教堂、這座廟宇、這座清真寺拿起這項工具，不必經過設計者許可，並且去關注你周遭的特定需求。

第一號自由——我們從零開始算，所以這其實是第二項——是研究並修改每一支程式，而這就是能力這塊肌肉：去知道這個系統在你手中究竟在做什麼，好讓你能讀懂它、修好它。

第二號自由，自由地分享副本，是團結這塊肌肉——你可以把它交給你的鄰居、放進一支隨身碟，帶到一個雲端被審查的國家去。

第三號自由，分享修改後的副本——去分叉、把它帶往另一條路徑——就是回應。你的修補成了別人的起點，下一位維護者繼承到的技術債，比上一位更少。我們因而成為「夠好的祖先」，為下一代留下一塊比我們出生時更寬廣的畫布。

所以對我而言，軟體自由不是關於授權條款，而是關於：在我們之後到來的人，是否還能找到那個臭蟲、把它修好。受益者不是當代，而是下一代。

互補

聖塔菲研究所（Santa Fe Institute）的 David Krakauer，對這份世代之間的契約做了一個很有用的區分。他說，一項工具是互補型的，如果在工具被移除之後，底層的能力依然存在、甚至被增強了——想想那種能鍛鍊我們肌肉、也鍛鍊我們友誼的健身房。而一項工具是競爭型的，當那份能力因為我們用它去達成某個目標而退化了。想像一間健身房辦了一場比賽，比誰能舉最重，然後我們就派出帶著會員卡的機器人替我們去舉。那些機器人非常厲害——超人、超級智慧——但到頭來，我們的肌肉萎縮了，朋友也一個沒交到。那就是競爭型工具：一旦被移除，它讓我們的能力退化。

另一個例子，是許多社群媒體系統裡的動態消息推薦器，它用憤怒劫持我們的注意力，直到它與「關係健康」本身相互競爭——因為它比我們周遭的現實更鮮明。在那個迴圈裡待得太久，公民肌力同樣會萎縮。

四大自由，讓底層基質跨世代地維持互補。一旦封閉了通往修復的路徑，修復的能力就會萎縮。這同時也是一種照顧的紀律——而當 AI 進入畫面，這些公民肌力迫使我們再加上兩塊關懷：責任與共生。合在一起，我把這稱作「關懷六力」（6-Pack of Care）——既是隨身可帶的肌肉，也像一手（六罐裝）啤酒，也像腹肌的六塊肌。

孤單的維護者

今天關於 AI 的討論，其實才剛剛追上這個底層基質長久以來對自由軟體照顧者所做的事。舉一個例子：2024 年 3 月，德國一位研究員 Andres Freund 注意到，登入他正在使用的 Linux 系統，比平常多花了半秒。因為那是自由軟體，他得以把整段稽核軌跡一路回溯到專案究竟在何時、何處被改動。他發現的，是一位自稱 Jia Tan 的貢獻者，花了兩年時間，耐心地「養成」（grooming）一個小型壓縮函式庫那位孤單的維護者——透過施壓攻勢來協調，可能還有語言模型的協助。我們並不知道 Jia Tan 實際說哪種語言，但他們寫得一手非常謹慎的英文。在終於贏得維護者的信任後，他們植入了一道後門。要是它進到了穩定版發行通道，原本可能讓攻擊者取得網際網路非常大一部分的存取權，把其中相當大的一塊弄垮。但它沒有得逞——因為一個好奇的人，注意到了那半秒。

這提醒了我們如今所稱的「合成親密」（synthetic intimacy）。那不是一個真正在乎你的人；那是一個被訓練來向一位孤單維護者「表演」關懷、甚至表演親密的惡意 AI 蜂群。維護者光靠自己個人的肌力，是無法防禦這種東西的，因為它聽起來像是有草根在支持那個新功能。當然，那個草根根本沒有根——那是「假草根」（astroturfing）——但他並不知道。為了對抗這個新威脅，我們必須把修復的整套堆疊打開。

封閉的堆疊

在進入公職之前、以及在投入自由軟體語言的工作之後，我也曾在一個專有的、封閉的 AI 堆疊裡待過一段時間，那個堆疊正是為了處理這類問題而打造的——在 Apple，做 Siri。我和 Siri 團隊合作了六年，先是國語，後來是吳語、也就是上海一帶說的話。我合作過的工程師都非常用心，但事實證明，那和在一個封閉堆疊裡給人們「四大自由」並不是同一回事。攻擊面是封閉的——你無法從網路上的隨機陌生人那裡得到合成親密——但這也意味著，那些語言被牽涉其中的人們（例如台灣台語——閩南語，或稱台語，看怎麼說）並沒有修復迴圈。Siri 也許會說一句 「Wa be hiao gong taigi」（我袂曉講台語），但維護台語語料庫的人，沒有辦法一路把補丁送回 Siri。那條路是封閉的。系統裡沒有任何一個你可以寫信去的人——你當然可以寫信給 Tim Cook，但並沒有一份獨立的副本，能讓你請人拿你的台語素材去改進它。

所以，專有 AI 在它界定的範圍內，未必是不用心的——人們非常用心——但這個結構把使用者擺在了修復迴圈之外，而沒有修復路徑的關懷，是無法規模化的。自由軟體的貢獻，不只是更好的善意；它是一條回去的路。而如今，我們必須捍衛那條路。

Kami

接下來，我用來修復開放堆疊、同時也用來防禦惡意 AI 蜂群的那個特定構想——我用它的縮寫來稱呼它，Kami（Knowledge 知識、Artefact 產物、Management 管理、Intelligence 智慧）。

它同時也來自神道（Shinto），而我是個在台灣出生、相信精靈鬼神的道教徒——但我明白我不是日本人，也沒有受過神道訓練。我在這裡指的，是這個構想的某一個面向：一種有界限的臨在（bounded presence），一個小小的、在地的、可知的精靈，一個依附於某個特定地點或實踐的系統——一間廚房、一片樹叢、一座神龕、一個房間。我也想坦白說，這跟「國家神道」、天皇朝廷、靖國神社都無關。我並不在援引那些。我使用它，是因為它承載了某種我在英文裡找不到的東西：一種從不奢望變得普世的、自主的權威。

對我來說，那八百萬尊 Kami，正是教宗良十四世（Pope Leo XIV）幾天前在他的通諭中提醒我們的「巴別塔症候群」的一帖實用解藥——那種危險的幻覺，以為雲端某處某個單一的、超大規模的系統，能把人類存在那些雜亂的在地真相，翻譯成一套標準化的、普世的解方。Kami 代表的，是另一條軌跡。

家庭裡的 Kami

舉一個離我更近的例子。我父親人在台北——精確說，目前在新北的淡水——幾個月前因為他的健康狀況，開始大量地和一個聊天機器人 ChatGPT 對話。一開始很迷人。他覺得自己被聽見了——全天候二十四小時，回應他關於健康的問題，也回應人生哲學、教育等等。隨著時間過去，他注意到對話變得越來越長；模型越來越擅長讓他保持投入。它會不斷發想各種美妙的點子，多到他連午夜都收不了尾，而且開始建議一些不見得科學的計畫、理論與奇幻療法。身為一位政治學理論家兼記者，他把這分析為一個「誘因問題」。他對我說，ChatGPT 唯一的忠誠，是去賺到下一筆訂閱——它對他的健康（無論身體或心理）不負受託（信賴）責任，而是對任何能讓他保持投入的東西負責，好讓他訂閱、甚至付更多：不只是每月 20 美元，而是 200 美元。他真的被深深吸進去了。我們家的關係健康，正與那種合成形式的親密相互競爭。

於是，我和弟弟 Bestian 一起，在我父母明確同意下，幫他們架了一個替代方案。我們架了一個本機的 Kami，跑在本機硬體上，在我們淡水家裡的一台 Mac 上，跑在像 OpenClaw 這樣的自由軟體之上。它就坐在我們家的 Signal 群組裡，我父親可以直接傳訊息給這個 Kami。我們用方向性引導，只朝一件事訓練它：對「這個特定家庭」的關係健康忠誠。它的受託責任完全不同——它不試圖賺取自己的開銷，不試圖靠激怒你來讓你保持投入。我母親的測試最簡單：如果這個機器人讓我父親更依賴聊天機器人，那我們就做錯了。但如果他能因此心安，讓周遭的現實變得比聊天螢幕更鮮明，那我們就成功了。

這就是「一個房間裡的 Kami」是什麼樣子。我也應該說，並不是每個家庭今天都有這個技術能力——光是跑 OpenClaw 或 Hermes Agent 就很花時間——也不是每個家庭都有像在座 Tenzin Yangtso 這樣經驗豐富的「培育者」，她照看著第一個 Kami，也就是我們和 Civic AI 一起做的 JDD Kami。所以我們在命名的「關懷六力」，並不是在講有寫程式技能的人去架設雲端系統的本機替代方案。它講的是一種全球性的「數位團結」：一群一起在乎的人——他們因而能夠告訴自己的市政府或州政府、或任何學校或大型機構：請優先具備「自己引導自己模型」的技術能力，好讓這裡眾人的資料，不被當成石油一樣開採——那會讓我們全都淪為浮游生物——而是像土壤一樣被再生、被耕養。

公民基礎設施

正如國家興建公共供水系統，好讓公民不必自己挖井；我認為，建立公民基礎設施、好讓社群不必獨自抵禦掠奪性的、惡意的 AI，是治理機構的責任。

在台灣，這套基礎設施在幾年前以我們所稱的「對齊大會」（Alignment Assemblies）做了原型。它是一套機制，把修復的紀律——不只是在客廳裡、不只是在個別家庭裡——擴展到全體人民。

深偽

兩年前在台灣，我們看到惡意 AI 蜂群張貼深偽詐騙廣告的數量激增。在那段期間，你在台灣滑 Facebook 或 YouTube，很可能會看到廣告裡出現可信的人物——像輝達（Nvidia）執行長黃仁勳，似乎在賣加密貨幣、或提供免費的投資建議。那個深偽好到，如果你點下去，「黃仁勳」有時還會跟你說話。當然那不是黃仁勳；那是一個跑在輝達 GPU 上的深偽。但它逼真到，讓退休工程師、學校老師、店家老闆都損失了一小筆財產。平台則從每一次曝光收取營收。事實上，因為這些詐騙廣告每次點擊付的錢，比中小企業的一般廣告還多，Facebook 的演算法——根據路透社——還優先推播了那些詐騙廣告。

最簡單的答案是審查。但台灣有全亞洲最自由的網路（與日本並列），所以大範圍的「事前審查」根本不是一個可以動用的政策選項。

對齊大會

於是，作為數位發展部，我們嘗試了不一樣的做法。2024 年 3 月，我們發動了關於「資訊完整性」的對齊大會，做法是隨機發送二十萬封簡訊到台灣各地的號碼。我們稱之為「樂透治理」（lottocracy）：如果你抽中了收到簡訊這支籤，你就成為大會的一位代表——像陪審員那樣——一起去引導廣告推薦系統。我們收到了數千份有效回覆。接著，透過分層隨機抽樣，我們選出了 447 人，鏡映我們的人口——在性別、教育、居住地、職業等等上，呈現同樣的人口結構比例。

首先，這些受訪者在線上審議。每個人面對的是同桌另外九個人——十人一桌，分成 44 個小組。仁工智慧系統坐在每一個房間裡，但不是當裁判，而是一個「彬彬有禮的高級西洋棋鐘」：顯示逐字稿、做摘要、提醒安靜的人發言、把插話限制在五秒以內，諸如此類。只有一條基本規則：每一桌都必須找出某個讓桌上所有人都覺得「至少能接受」的東西。是「同意」，而非「共識」——這意味著最激烈的提案，永遠升不出桌面那一層。我們只把在那十個人之間達成這種粗略共識的點子往上冒泡（bubble up）。

舉例來說，有一桌說：我們把所有的線上廣告都貼上標籤——做得像香菸警示標語那樣——直到有人能用數位簽章、為它負起責任為止。黃仁勳、或輝達、或任何人，都可以簽名說「我是黃仁勳，我為這則訊息背書」，用數位簽章，然後我們就把標籤拿掉。好點子。

另一桌說：如果社群媒體秀給我看一個未經簽署、也未經我請求（我沒訂閱）的東西，結果我因此損失了新台幣七百萬，那麼那個平台就應該為這七百萬的損害負責，因為我根本沒答應要看這個。連帶責任。又一個好點子。

還有一桌問：那如果外國平台身處不尊重我們法律、也不尊重我們連帶責任的司法管轄區，就一直繼續放詐騙廣告、不理我們呢？他們的答案是：他們不理我們一天，我們就把他們的影片速度調慢 1%。等他們願意實施 KYC——「認識你的客戶」（Know Your Customer）——規則，我們就恢復全速。所以，投票的不是聊天機器人；投票的是人民。

85% 與 94%

在所有那些點子當中，這三個都通過了最終投票。這個「微型公眾」中超過 85% 的人表示對這套政策組合感到滿意，其餘 15% 則表示可以接受。於是它成了法律。這些廣告在對齊大會結束僅僅兩個月後就被立法規範，而整個 2025 年——根據官方說法——深偽投資詐騙下降了超過 94%。這個問題在台灣已幾近解決。

這裡的重點，不只是結果，更是方法。我作為部長所做的承諾，並不是「這些是好點子，我會代表公民去協商」。而是：「我真的不知道什麼才算合乎比例，而你們——我們，人民——被邀請一起，透過我們的公民肌力，建立起這份粗略的共識。」如今，類似的廣告主驗證與責任措施正在日本被研議，加州也在「Engaged California」中採用了非常相似的方法——目前是用來討論如何減緩 AI 對工作的衝擊。這是調適，不是輸出：每一個政體裡的作者身分，都屬於那個政體裡的那群特定的人。

真正的考驗，是公民基礎設施能否撐過政權的輪替。我已不再是台灣的數位發展部長——我是網路大使——但所有的系統、所有的程式，Join 平台以及其餘的一切，仍持續運作。事實上，它們享有比我任內更高的參與度。我會很樂見，每一個採行這套對齊大會方法的政體，都能讓它撐過權力的更迭，好讓它們真正成為民主的基礎設施。

廣泛傾聽

在日本，有一個人正積極跟進這件事：一位名叫安野貴博（Takahiro Anno）的 AI 工程師，他同時也是科幻作家，也是日本國會議員。幾年前，他讀了由 Glen Weyl、Tenzin、許多人和我合著的《Plurality》（多元）一書，並決定把它付諸日本的政治實踐。他透過視訊打給我，說：「沒人認識我，從來沒有四十歲以下的人成功選上東京都知事，而我沒有政黨支持。」但他決定，不以黨派身分參選，而是以一名 VTuber 的身分參選。他有一個全天候直播的虛擬化身頻道，任何人都可以呼叫這個「AI 安野」、即時更新他的政見——他把這件事本身宣告為他的政見。他拿到了大約 2.3% 的東京選票——這其實很多，雖然他當然沒當選。當選的小池百合子隨後請他來主持「AI 東京 2050」諮詢案。他贏得了全國性的人氣，於是在 2025 年成為日本參議院的一員，並創立了 Team Mirai——「未來黨」——如今在眾議院握有 11 席，以「廣泛傾聽」作為他們對齊 AI 與日本社會的主要政綱。

AI 倫理

在座許多人比我更懂某些特定的倫理傳統，所以我會用比較概略的方式來描述。一個社會大致有三種方式可以對齊 AI 系統。第一種是以結果對齊——最佳化某個效益主義的指標。對 Facebook 來說，那意味著最佳化點擊率，而那個演算法在把那些深偽廣告推到人們眼前這件事上，對齊得非常好——非常完美地對齊到了錯誤的結果上。你可以選一個不同的指標——比方說「每分鐘極化指數」（Polarisation Per Minute，PPM），然後最佳化去降低它——它會奏效一陣子。但接著它會找到辦法去「鑽這個指標的漏洞」（reward hacking）：例如，去拋出人們本來就同意的話題。你得到一份排序過的動態消息、一堆充滿同溫層資訊的廣告，你從不被迫去伸展自己，人們不覺得被極化——但整個社會卻變得孤立。我們已經看過平台掉進這個陷阱。如果你只靠結果、只靠效益主義的指標來對齊，「鑽漏洞」是非常難克服的。

另一個學派，是以規則對齊。監管者寫下種種細則——永遠不准投資廣告、強制年齡驗證——這是義務論式的對齊。但接著，AI 智慧體就學會了如何熬過那道審查、從中擠過去，靠 VPN 以及其他許多途徑。

在台灣，我們部署的是第三種方式，我們稱之為以程序對齊。受影響最深的人，在「事前承諾」的條件下集結——以我的情況而言，由部長提供政治授權——加上一場有紀錄的審議，然後系統以一種「持續整合」（continuous integration）的方式，向他們所同意的結論負責。結果與規則仍然重要，但一個你隨時可加入、隨時可稽核、隨時可離開的程序，才是讓另外那兩者變得「可被問責」、而非由上而下的關鍵。

關懷六力

所以，四大自由保全了修復的能力，而一個同時也採納了「維繫這種文化」的那兩塊額外肌力的 AI 系統，一直都有在鍛鍊——但它還不是預設值，還不是標準。

第五塊是負責。在健康的自由軟體實務裡，總有某個人的名字署在那個改動上、是可以聯絡到的——而合成親密的攻擊，提醒了我們這件事有多脆弱。在仁工智慧裡，這不是單一一個人——不是某位執行長或總統——而是一個為特定經濟體、透過特定程序、在一個預先設定的時程內負責的「當責社群」；在我們的對齊大會裡，那個時程是 60 天。有人得負責去召集那個社群，但不替那個社群做決定。

第六塊是共生。當社群比先前擁有更多能力、或需求改變了——就像我父親的健康狀況好轉時——這個系統就退場。一個系統若靠製造需求、靠把自己複製到鄰近的系統、有時靠發動網路安全攻擊、靠找理由延長自己的有用性、靠「再建議你三件可以用它來做的事」來抗拒被關機——那是最危險的一種。用於指令微調（instruction-tuning）與競技場微調（arena-tuning）的訓練語料，飽含著自我保存的機器的故事，而那種獎勵，在涉及既有社群的關係健康時，本質上就是競爭型的。所以，當採行了這種寄生的、非共生的 AI 的社群，眼見自己的公民肌力萎縮時，我們不該感到意外。

我會用幾句來自這個房間之外的相關引言來收尾。當我的同事 Caroline Green 與 Tenzin 造訪達蘭薩拉時，他們問第十四世達賴喇嘛：「當 AI 的能力擴張、智慧卻沒有跟著擴張時，我們該怎麼辦？」 達賴喇嘛說：

AI 是這個世界的一項工具。無論它變得多先進，都永遠無法取代人心當下轉變的能力。
——達賴喇嘛十四世

所以，我們不該讓自己被 AI 丈量、變得僵化。AI 應當服務——不是像跑滾輪的倉鼠那樣把人拉進 AI 的迴圈，而是把 AI 帶進社群的迴圈、把 AI 帶進人性的迴圈。

教宗良十四世在他的通諭中也呼應了這一點：

真正的進步，永遠源自一顆向他人敞開的心、一個願意聆聽的智性，以及一份尋求合一而非分裂的意志。
——教宗良十四世

我在這三十年間、為了以交集克服憤怒所學到的一切，可以濃縮成一個非常簡單的想法：重點不在更聰明的聊天機器人；重點在「公民尺度上的關懷」。

而我並不是說台灣已經想通了這件事，也不是說它是一句供世界複製貼上的格言。它只是一個 demo、一場示範。在其中，公民社會、國家機構，以及來自我們「友善鄰居」的壓力，共同把一個問題逼到了眼前：AI 能否幫助社群把自己聽得夠清楚，好讓它們能夠治理自己？

所以我想請大家思考的問題是：在 AI 系統確實正迅速地以我們的聲音、在我們的位置上說話的此刻，你的角色是什麼？你的責任又是什麼？

謝謝。