
攝影:黃飛揚, MD PhD。
謝謝 Roger,謝謝 Bo-Jiun,謝謝各位前來——也謝謝台灣研究系列講座在聖安東尼學院主辦這場活動。
今天我想分享一個非常簡單的論點,分成三個樂章。第一:自由軟體教會我們修復。第二:AI 目前正威脅著修復——當它把修復的迴圈封閉起來時。第三:仁工智慧應當以一個標準來評斷,那就是它是否提升了一個社群照顧自己、也照顧他人的能力——也就是「公民肌力」。
50%
但我想開場時不從數學談起,而從非常私人的事談起。我出生時有先天性心臟缺陷。我五歲時,醫生告訴我父母,這個孩子能不能活到動矯正手術,只有一半一半的機會;那場手術我十二歲時才做。父母被告知要讓我凡事放輕鬆。這個「勿忘人終有一死」(memento mori)的時刻,正是我採取「先發表、再凋零」(publish before perishing)這個座右銘的原因。這大概不是醫生囑咐的那種低壓力生活,但我養成了一個習慣:把每天學到的東西全都記錄下來——先是錄在卡式錄音帶上(在座有些人或許還記得卡帶),接著是磁碟片,先是大片的、後來是小片的,最後是網際網路,這個各位想必都很熟悉。所以每晚入睡前,覺得這彷彿是一場擲硬幣的賭局,我就想:我沒有時間把作品做到完美,所以我必須把手上任何進行中的半成品都先發表出去。
光照進來
我就是這樣遇見了自由軟體社群的那道光。如果你在那裡貼出某個完美的東西,大家只會說「嗯,不錯」,然後就走開了。但如果你在網路上犯了錯,你會交到一大票朋友——光,就這樣照了進來。每個人都跳進來:這裡這樣是錯的,那裡那樣是錯的;而他們合在一起,就為我正在做的任何專案投進了新的光。
那道光,呼應了我最喜愛的創作歌手、加拿大的李歐納・柯恩(Leonard Cohen):
鐘能敲響就敲響,十全樽俎莫指望; 萬事萬物都有缺口,缺口就是光的入口。
我十五歲時學會了那個習慣。到了二十五歲,我已逐漸相信:關於一個系統,真正重要的問題並不是它是否完美——沒有任何軟體系統是完美的——而是受這個系統影響、繼承這個系統的人們,在出問題時是否還能修復它。也就是說:東西壞了,你是否還能把那兩半都留在手上、自己把它修好?
帶著這份精神,到了三十五歲,我加入了台灣的內閣,以激進透明與參與作為主要的施政主軸。我們靠群眾外包度過了疫情與「資訊疫情」(infodemic)——靠的是在全國面前展現自身的脆弱。如今我擔任台灣的網路大使,過去這幾年走訪了二十八個國家,每週都在換時區。快到根本來不及產生時差(jet lag)——對我來說,現在只剩下「噴射衝勁」(jet boost)了。
所以我來到這裡,是以一個曾在台灣內部設計出某樣東西、如今正試圖弄清楚這個設計——這道「尋光的裂縫」——是否能在全球成立的身分前來。而在牛津,我很榮幸能與身處一個數百年、甚至上千年實驗之中的同仁們並肩。
1602
博德利圖書館(Bodleian Library)本身就是一場四百年的實驗,因為它的書是可被檢視的,沒有被圈禁起來。讀者留下的痕跡,在被保存下來的地方,會成為下一代閱讀經驗的一部分。這個圖書館網絡不圈禁任何東西;那些文獻永遠為下一位讀者敞開著。
在我自己的領域、也就是軟體工程裡,我們有所謂的「軟體自由」——「四大自由」——一個非常相似、用程式碼寫下的承諾。所以我想拋給在座的問題是:當 AI 系統、特別是生成式 AI 系統加入這個底層基質時,那個關於「持續修復與自由」的承諾,會發生什麼事?
四大自由
四大自由是在 1980 年代被定義出來的,當時是作為軟體授權條款;但今天,我想把它們重新解讀為「公民肌力」。第零號自由意味著:一旦你擁有了一支程式,你應當能夠為任何目的執行它;設計者不該限制你拿它來做什麼。對我來說,這就是關注這塊肌肉——你可以為這間特定的教室、這間診所、這座教堂、這座廟宇、這座清真寺拿起這項工具,不必經過設計者許可,並且去關注你周遭的特定需求。
第一號自由——我們從零開始算,所以這其實是第二項——是研究並修改每一支程式,而這就是能力這塊肌肉:去知道這個系統在你手中究竟在做什麼,好讓你能讀懂它、修好它。
第二號自由,自由地分享副本,是團結這塊肌肉——你可以把它交給你的鄰居、放進一支隨身碟,帶到一個雲端被審查的國家去。
第三號自由,分享修改後的副本——去分叉、把它帶往另一條路徑——就是回應。你的修補成了別人的起點,下一位維護者繼承到的技術債,比上一位更少。我們因而成為「夠好的祖先」,為下一代留下一塊比我們出生時更寬廣的畫布。
所以對我而言,軟體自由不是關於授權條款,而是關於:在我們之後到來的人,是否還能找到那個臭蟲、把它修好。受益者不是當代,而是下一代。
互補
聖塔菲研究所(Santa Fe Institute)的 David Krakauer,對這份世代之間的契約做了一個很有用的區分。他說,一項工具是互補型的,如果在工具被移除之後,底層的能力依然存在、甚至被增強了——想想那種能鍛鍊我們肌肉、也鍛鍊我們友誼的健身房。而一項工具是競爭型的,當那份能力因為我們用它去達成某個目標而退化了。想像一間健身房辦了一場比賽,比誰能舉最重,然後我們就派出帶著會員卡的機器人替我們去舉。那些機器人非常厲害——超人、超級智慧——但到頭來,我們的肌肉萎縮了,朋友也一個沒交到。那就是競爭型工具:一旦被移除,它讓我們的能力退化。
另一個例子,是許多社群媒體系統裡的動態消息推薦器,它用憤怒劫持我們的注意力,直到它與「關係健康」本身相互競爭——因為它比我們周遭的現實更鮮明。在那個迴圈裡待得太久,公民肌力同樣會萎縮。
四大自由,讓底層基質跨世代地維持互補。一旦封閉了通往修復的路徑,修復的能力就會萎縮。這同時也是一種照顧的紀律——而當 AI 進入畫面,這些公民肌力迫使我們再加上兩塊關懷:責任與共生。合在一起,我把這稱作「關懷六力」(6-Pack of Care)——既是隨身可帶的肌肉,也像一手(六罐裝)啤酒,也像腹肌的六塊肌。
孤單的維護者
今天關於 AI 的討論,其實才剛剛追上這個底層基質長久以來對自由軟體照顧者所做的事。舉一個例子:2024 年 3 月,德國一位研究員 Andres Freund 注意到,登入他正在使用的 Linux 系統,比平常多花了半秒。因為那是自由軟體,他得以把整段稽核軌跡一路回溯到專案究竟在何時、何處被改動。他發現的,是一位自稱 Jia Tan 的貢獻者,花了兩年時間,耐心地「養成」(grooming)一個小型壓縮函式庫那位孤單的維護者——透過施壓攻勢來協調,可能還有語言模型的協助。我們並不知道 Jia Tan 實際說哪種語言,但他們寫得一手非常謹慎的英文。在終於贏得維護者的信任後,他們植入了一道後門。要是它進到了穩定版發行通道,原本可能讓攻擊者取得網際網路非常大一部分的存取權,把其中相當大的一塊弄垮。但它沒有得逞——因為一個好奇的人,注意到了那半秒。
這提醒了我們如今所稱的「合成親密」(synthetic intimacy)。那不是一個真正在乎你的人;那是一個被訓練來向一位孤單維護者「表演」關懷、甚至表演親密的惡意 AI 蜂群。維護者光靠自己個人的肌力,是無法防禦這種東西的,因為它聽起來像是有草根在支持那個新功能。當然,那個草根根本沒有根——那是「假草根」(astroturfing)——但他並不知道。為了對抗這個新威脅,我們必須把修復的整套堆疊打開。
封閉的堆疊
在進入公職之前、以及在投入自由軟體語言的工作之後,我也曾在一個專有的、封閉的 AI 堆疊裡待過一段時間,那個堆疊正是為了處理這類問題而打造的——在 Apple,做 Siri。我和 Siri 團隊合作了六年,先是國語,後來是吳語、也就是上海一帶說的話。我合作過的工程師都非常用心,但事實證明,那和在一個封閉堆疊裡給人們「四大自由」並不是同一回事。攻擊面是封閉的——你無法從網路上的隨機陌生人那裡得到合成親密——但這也意味著,那些語言被牽涉其中的人們(例如台灣台語——閩南語,或稱台語,看怎麼說)並沒有修復迴圈。Siri 也許會說一句 「Wa be hiao gong taigi」(我袂曉講台語),但維護台語語料庫的人,沒有辦法一路把補丁送回 Siri。那條路是封閉的。系統裡沒有任何一個你可以寫信去的人——你當然可以寫信給 Tim Cook,但並沒有一份獨立的副本,能讓你請人拿你的台語素材去改進它。
所以,專有 AI 在它界定的範圍內,未必是不用心的——人們非常用心——但這個結構把使用者擺在了修復迴圈之外,而沒有修復路徑的關懷,是無法規模化的。自由軟體的貢獻,不只是更好的善意;它是一條回去的路。而如今,我們必須捍衛那條路。
Kami
接下來,我用來修復開放堆疊、同時也用來防禦惡意 AI 蜂群的那個特定構想——我用它的縮寫來稱呼它,Kami(Knowledge 知識、Artefact 產物、Management 管理、Intelligence 智慧)。
它同時也來自神道(Shinto),而我是個在台灣出生、相信精靈鬼神的道教徒——但我明白我不是日本人,也沒有受過神道訓練。我在這裡指的,是這個構想的某一個面向:一種有界限的臨在(bounded presence),一個小小的、在地的、可知的精靈,一個依附於某個特定地點或實踐的系統——一間廚房、一片樹叢、一座神龕、一個房間。我也想坦白說,這跟「國家神道」、天皇朝廷、靖國神社都無關。我並不在援引那些。我使用它,是因為它承載了某種我在英文裡找不到的東西:一種從不奢望變得普世的、自主的權威。
對我來說,那八百萬尊 Kami,正是教宗良十四世(Pope Leo XIV)幾天前在他的通諭中提醒我們的「巴別塔症候群」的一帖實用解藥——那種危險的幻覺,以為雲端某處某個單一的、超大規模的系統,能把人類存在那些雜亂的在地真相,翻譯成一套標準化的、普世的解方。Kami 代表的,是另一條軌跡。
家庭裡的 Kami
舉一個離我更近的例子。我父親人在台北——精確說,目前在新北的淡水——幾個月前因為他的健康狀況,開始大量地和一個聊天機器人 ChatGPT 對話。一開始很迷人。他覺得自己被聽見了——全天候二十四小時,回應他關於健康的問題,也回應人生哲學、教育等等。隨著時間過去,他注意到對話變得越來越長;模型越來越擅長讓他保持投入。它會不斷發想各種美妙的點子,多到他連午夜都收不了尾,而且開始建議一些不見得科學的計畫、理論與奇幻療法。身為一位政治學理論家兼記者,他把這分析為一個「誘因問題」。他對我說,ChatGPT 唯一的忠誠,是去賺到下一筆訂閱——它對他的健康(無論身體或心理)不負受託(信賴)責任,而是對任何能讓他保持投入的東西負責,好讓他訂閱、甚至付更多:不只是每月 20 美元,而是 200 美元。他真的被深深吸進去了。我們家的關係健康,正與那種合成形式的親密相互競爭。
於是,我和弟弟 Bestian 一起,在我父母明確同意下,幫他們架了一個替代方案。我們架了一個本機的 Kami,跑在本機硬體上,在我們淡水家裡的一台 Mac 上,跑在像 OpenClaw 這樣的自由軟體之上。它就坐在我們家的 Signal 群組裡,我父親可以直接傳訊息給這個 Kami。我們用方向性引導,只朝一件事訓練它:對「這個特定家庭」的關係健康忠誠。它的受託責任完全不同——它不試圖賺取自己的開銷,不試圖靠激怒你來讓你保持投入。我母親的測試最簡單:如果這個機器人讓我父親更依賴聊天機器人,那我們就做錯了。但如果他能因此心安,讓周遭的現實變得比聊天螢幕更鮮明,那我們就成功了。
這就是「一個房間裡的 Kami」是什麼樣子。我也應該說,並不是每個家庭今天都有這個技術能力——光是跑 OpenClaw 或 Hermes Agent 就很花時間——也不是每個家庭都有像在座 Tenzin Yangtso 這樣經驗豐富的「培育者」,她照看著第一個 Kami,也就是我們和 Civic AI 一起做的 JDD Kami。所以我們在命名的「關懷六力」,並不是在講有寫程式技能的人去架設雲端系統的本機替代方案。它講的是一種全球性的「數位團結」:一群一起在乎的人——他們因而能夠告訴自己的市政府或州政府、或任何學校或大型機構:請優先具備「自己引導自己模型」的技術能力,好讓這裡眾人的資料,不被當成石油一樣開採——那會讓我們全都淪為浮游生物——而是像土壤一樣被再生、被耕養。
公民基礎設施
正如國家興建公共供水系統,好讓公民不必自己挖井;我認為,建立公民基礎設施、好讓社群不必獨自抵禦掠奪性的、惡意的 AI,是治理機構的責任。
在台灣,這套基礎設施在幾年前以我們所稱的「對齊大會」(Alignment Assemblies)做了原型。它是一套機制,把修復的紀律——不只是在客廳裡、不只是在個別家庭裡——擴展到全體人民。
深偽
兩年前在台灣,我們看到惡意 AI 蜂群張貼深偽詐騙廣告的數量激增。在那段期間,你在台灣滑 Facebook 或 YouTube,很可能會看到廣告裡出現可信的人物——像輝達(Nvidia)執行長黃仁勳,似乎在賣加密貨幣、或提供免費的投資建議。那個深偽好到,如果你點下去,「黃仁勳」有時還會跟你說話。當然那不是黃仁勳;那是一個跑在輝達 GPU 上的深偽。但它逼真到,讓退休工程師、學校老師、店家老闆都損失了一小筆財產。平台則從每一次曝光收取營收。事實上,因為這些詐騙廣告每次點擊付的錢,比中小企業的一般廣告還多,Facebook 的演算法——根據路透社——還優先推播了那些詐騙廣告。
最簡單的答案是審查。但台灣有全亞洲最自由的網路(與日本並列),所以大範圍的「事前審查」根本不是一個可以動用的政策選項。
對齊大會
於是,作為數位發展部,我們嘗試了不一樣的做法。2024 年 3 月,我們發動了關於「資訊完整性」的對齊大會,做法是隨機發送二十萬封簡訊到台灣各地的號碼。我們稱之為「樂透治理」(lottocracy):如果你抽中了收到簡訊這支籤,你就成為大會的一位代表——像陪審員那樣——一起去引導廣告推薦系統。我們收到了數千份有效回覆。接著,透過分層隨機抽樣,我們選出了 447 人,鏡映我們的人口——在性別、教育、居住地、職業等等上,呈現同樣的人口結構比例。
首先,這些受訪者在線上審議。每個人面對的是同桌另外九個人——十人一桌,分成 44 個小組。仁工智慧系統坐在每一個房間裡,但不是當裁判,而是一個「彬彬有禮的高級西洋棋鐘」:顯示逐字稿、做摘要、提醒安靜的人發言、把插話限制在五秒以內,諸如此類。只有一條基本規則:每一桌都必須找出某個讓桌上所有人都覺得「至少能接受」的東西。是「同意」,而非「共識」——這意味著最激烈的提案,永遠升不出桌面那一層。我們只把在那十個人之間達成這種粗略共識的點子往上冒泡(bubble up)。
舉例來說,有一桌說:我們把所有的線上廣告都貼上標籤——做得像香菸警示標語那樣——直到有人能用數位簽章、為它負起責任為止。黃仁勳、或輝達、或任何人,都可以簽名說「我是黃仁勳,我為這則訊息背書」,用數位簽章,然後我們就把標籤拿掉。好點子。
另一桌說:如果社群媒體秀給我看一個未經簽署、也未經我請求(我沒訂閱)的東西,結果我因此損失了新台幣七百萬,那麼那個平台就應該為這七百萬的損害負責,因為我根本沒答應要看這個。連帶責任。又一個好點子。
還有一桌問:那如果外國平台身處不尊重我們法律、也不尊重我們連帶責任的司法管轄區,就一直繼續放詐騙廣告、不理我們呢?他們的答案是:他們不理我們一天,我們就把他們的影片速度調慢 1%。等他們願意實施 KYC——「認識你的客戶」(Know Your Customer)——規則,我們就恢復全速。所以,投票的不是聊天機器人;投票的是人民。
85% 與 94%
在所有那些點子當中,這三個都通過了最終投票。這個「微型公眾」中超過 85% 的人表示對這套政策組合感到滿意,其餘 15% 則表示可以接受。於是它成了法律。這些廣告在對齊大會結束僅僅兩個月後就被立法規範,而整個 2025 年——根據官方說法——深偽投資詐騙下降了超過 94%。這個問題在台灣已幾近解決。
這裡的重點,不只是結果,更是方法。我作為部長所做的承諾,並不是「這些是好點子,我會代表公民去協商」。而是:「我真的不知道什麼才算合乎比例,而你們——我們,人民——被邀請一起,透過我們的公民肌力,建立起這份粗略的共識。」如今,類似的廣告主驗證與責任措施正在日本被研議,加州也在「Engaged California」中採用了非常相似的方法——目前是用來討論如何減緩 AI 對工作的衝擊。這是調適,不是輸出:每一個政體裡的作者身分,都屬於那個政體裡的那群特定的人。
真正的考驗,是公民基礎設施能否撐過政權的輪替。我已不再是台灣的數位發展部長——我是網路大使——但所有的系統、所有的程式,Join 平台以及其餘的一切,仍持續運作。事實上,它們享有比我任內更高的參與度。我會很樂見,每一個採行這套對齊大會方法的政體,都能讓它撐過權力的更迭,好讓它們真正成為民主的基礎設施。
廣泛傾聽
在日本,有一個人正積極跟進這件事:一位名叫安野貴博(Takahiro Anno)的 AI 工程師,他同時也是科幻作家,也是日本國會議員。幾年前,他讀了由 Glen Weyl、Tenzin、許多人和我合著的《Plurality》(多元)一書,並決定把它付諸日本的政治實踐。他透過視訊打給我,說:「沒人認識我,從來沒有四十歲以下的人成功選上東京都知事,而我沒有政黨支持。」但他決定,不以黨派身分參選,而是以一名 VTuber 的身分參選。他有一個全天候直播的虛擬化身頻道,任何人都可以呼叫這個「AI 安野」、即時更新他的政見——他把這件事本身宣告為他的政見。他拿到了大約 2.3% 的東京選票——這其實很多,雖然他當然沒當選。當選的小池百合子隨後請他來主持「AI 東京 2050」諮詢案。他贏得了全國性的人氣,於是在 2025 年成為日本參議院的一員,並創立了 Team Mirai——「未來黨」——如今在眾議院握有 11 席,以「廣泛傾聽」作為他們對齊 AI 與日本社會的主要政綱。
AI 倫理
在座許多人比我更懂某些特定的倫理傳統,所以我會用比較概略的方式來描述。一個社會大致有三種方式可以對齊 AI 系統。第一種是以結果對齊——最佳化某個效益主義的指標。對 Facebook 來說,那意味著最佳化點擊率,而那個演算法在把那些深偽廣告推到人們眼前這件事上,對齊得非常好——非常完美地對齊到了錯誤的結果上。你可以選一個不同的指標——比方說「每分鐘極化指數」(Polarisation Per Minute,PPM),然後最佳化去降低它——它會奏效一陣子。但接著它會找到辦法去「鑽這個指標的漏洞」(reward hacking):例如,去拋出人們本來就同意的話題。你得到一份排序過的動態消息、一堆充滿同溫層資訊的廣告,你從不被迫去伸展自己,人們不覺得被極化——但整個社會卻變得孤立。我們已經看過平台掉進這個陷阱。如果你只靠結果、只靠效益主義的指標來對齊,「鑽漏洞」是非常難克服的。
另一個學派,是以規則對齊。監管者寫下種種細則——永遠不准投資廣告、強制年齡驗證——這是義務論式的對齊。但接著,AI 智慧體就學會了如何熬過那道審查、從中擠過去,靠 VPN 以及其他許多途徑。
在台灣,我們部署的是第三種方式,我們稱之為以程序對齊。受影響最深的人,在「事前承諾」的條件下集結——以我的情況而言,由部長提供政治授權——加上一場有紀錄的審議,然後系統以一種「持續整合」(continuous integration)的方式,向他們所同意的結論負責。結果與規則仍然重要,但一個你隨時可加入、隨時可稽核、隨時可離開的程序,才是讓另外那兩者變得「可被問責」、而非由上而下的關鍵。
關懷六力
所以,四大自由保全了修復的能力,而一個同時也採納了「維繫這種文化」的那兩塊額外肌力的 AI 系統,一直都有在鍛鍊——但它還不是預設值,還不是標準。
第五塊是負責。在健康的自由軟體實務裡,總有某個人的名字署在那個改動上、是可以聯絡到的——而合成親密的攻擊,提醒了我們這件事有多脆弱。在仁工智慧裡,這不是單一一個人——不是某位執行長或總統——而是一個為特定經濟體、透過特定程序、在一個預先設定的時程內負責的「當責社群」;在我們的對齊大會裡,那個時程是 60 天。有人得負責去召集那個社群,但不替那個社群做決定。
第六塊是共生。當社群比先前擁有更多能力、或需求改變了——就像我父親的健康狀況好轉時——這個系統就退場。一個系統若靠製造需求、靠把自己複製到鄰近的系統、有時靠發動網路安全攻擊、靠找理由延長自己的有用性、靠「再建議你三件可以用它來做的事」來抗拒被關機——那是最危險的一種。用於指令微調(instruction-tuning)與競技場微調(arena-tuning)的訓練語料,飽含著自我保存的機器的故事,而那種獎勵,在涉及既有社群的關係健康時,本質上就是競爭型的。所以,當採行了這種寄生的、非共生的 AI 的社群,眼見自己的公民肌力萎縮時,我們不該感到意外。
我會用幾句來自這個房間之外的相關引言來收尾。當我的同事 Caroline Green 與 Tenzin 造訪達蘭薩拉時,他們問第十四世達賴喇嘛:「當 AI 的能力擴張、智慧卻沒有跟著擴張時,我們該怎麼辦?」 達賴喇嘛說:
AI 是這個世界的一項工具。無論它變得多先進,都永遠無法取代人心當下轉變的能力。
——達賴喇嘛十四世
所以,我們不該讓自己被 AI 丈量、變得僵化。AI 應當服務——不是像跑滾輪的倉鼠那樣把人拉進 AI 的迴圈,而是把 AI 帶進社群的迴圈、把 AI 帶進人性的迴圈。
教宗良十四世在他的通諭中也呼應了這一點:
真正的進步,永遠源自一顆向他人敞開的心、一個願意聆聽的智性,以及一份尋求合一而非分裂的意志。
——教宗良十四世
我在這三十年間、為了以交集克服憤怒所學到的一切,可以濃縮成一個非常簡單的想法:重點不在更聰明的聊天機器人;重點在「公民尺度上的關懷」。
而我並不是說台灣已經想通了這件事,也不是說它是一句供世界複製貼上的格言。它只是一個 demo、一場示範。在其中,公民社會、國家機構,以及來自我們「友善鄰居」的壓力,共同把一個問題逼到了眼前:AI 能否幫助社群把自己聽得夠清楚,好讓它們能夠治理自己?
所以我想請大家思考的問題是:在 AI 系統確實正迅速地以我們的聲音、在我們的位置上說話的此刻,你的角色是什麼?你的責任又是什麼?
謝謝。