English

第九章:常見問題

Q1. AI 市場正陷入由商業利益和地緣政治主導權驅動的軍備競賽。為稅務軟體壟斷企業服務的 AI 可能會遊說以維持報稅的難度——更糟糕的情況也不難想像。如果這個問題持續下去,合作型地神的願景難道不是無望地天真嗎?

仁工智慧無法透過要求壟斷企業變得更友善來生存。摩洛(Moloch)——即理性行動者因為背叛有利可圖而競相沈淪的動態——並非靠道德勸說就能戰勝。要戰勝它,必須改變地形,使合作比榨取更有利可圖。五個槓桿(其中幾個已被證明有效)可以扭轉局面:

  1. 互通性與可攜性。 強制執行公平的協定層級互通,讓使用者可以退出而不失去其網路。《猶他州數位選擇法案》(Utah Digital Choice Act)要求平台透過合格的開放協定提供社交圖譜的可攜性。當困住受眾的護城河消失時,平台必須在關懷品質上競爭,而不是在牢籠的強度上競爭。
  2. 公民採購。 政府透過購買力塑造市場。要求任何為公共用途採購的 AI 必須是可審計的、互通的,並由公民大會治理——正如台灣的對齊大會針對反詐騙政策所展示的那樣——這創造了巨大的經濟誘因來建立地神般的系統。受託所有權結構(Steward-ownership structures)和董事會層級的安全職責,使公民關懷成為一種信託義務,而非行銷口號。
  3. 公共選項。 提供由共享研究算力支持的簡單、非榨取性的基線服務。私人供應商必須在關懷上勝過公共選項,而不是在鎖定效應上。台灣的報稅系統——它取代了被廠商把持的體制,轉而採用公民設計的公共替代方案——是一個運作中的原型。
  4. 付費觸及的來源證明。 要求在政治和金融領域的廣告及大規模放大中,必須具備可驗證的贊助和持久的揭露。如今,台灣要求社交媒體廣告必須進行全頻譜、實名的 KYC。普通言論則透過選擇性揭露身份(selective-disclosure identity)(第七章)受到保護:你證明自己是真人,而無需透露你是誰。
  5. 聯邦化開放供應。 支持開放權重模型和聯邦化信任與安全網路(例如:用於兒童性虐待內容防禦的 ROOST)。當基礎智能成為一種公共財時,競賽將從「誰擁有最大的大腦」轉向「誰在地方語境中最細心地應用智能」——而這場競賽獎勵的是關懷。

這些槓桿都不需要現任者的善意。相反地,每一項都重塑了誘因,使公民行為成為商業阻力最小的道路。


Q2. 關懷倫理是為人際關係開發的——護士與病人、父母與孩子。將其擴展到 AI 系統和全球治理似乎是一個類別錯誤。為什麼不是呢?

這個異議眾所周知,而且關懷倫理的從業者自己也曾提出過:關懷過於親密、過於狹隘,且過於容易自我消融,無法作為機構理論的基礎,更不用說機器了。然而,我們認為這些是特色而非錯誤——而 Joan Tronto 本人在《關懷民主》(Caring Democracy, 2013)中就提出了將關懷擴展到政治機構的主張。

考慮一下當你將關懷所謂的弱點轉化為 AI 的設計約束時會發生什麼:

重要的是,這種轉化並不總是完美的。邊界感可能變成封閉;可修正性可能變成被動;而輔助性原則可能變成碎片化。這些是工程上的張力,而非反駁——關懷六力中的每一力都包含了失敗模式和指定的修復方法,正是因為這種對應需要持續的校準。

關懷六力並不要求 AI 感受關懷。相反地,關懷六力提取了關懷的關係架構——細心、可問責性、勝任力、回應性、團結、共生——並將每一項轉化為機器可檢查的設計原語、參與契約以及帶有實質承諾的可衡量成果:橋接優於純粹的多數決、審議合法性、權利基線。這些是植入過程中的明確規範選擇,而使之明確化是一項優點而非弱點。人際起源是其嚴謹性的來源,而非需要道歉的限制。


Q3. 我們指派給 AI 的宏大目標(「治癒癌症」、「解決氣候變遷」)幾乎總是結果論的。以超人類的速度最佳化這些成果,不可避免地會導致不可預見的風險。關懷倫理是否意味著要放棄這些宏大的、文明規模的目標?

完全不是。但它確實徹底重塑了我們實現這些目標的「方式」。

指派超智能去達成「治癒癌症」等單一目標的危險在於,AI 會將複雜的、關係性的、生態性的現實視為一個約束滿足問題。《古德哈特定律》(Goodhart's Law)是一條道德律:追求指標會導致真實的傷害,而建立鼓勵這種追求的系統的設計者,必須為損害負責。當以超人類速度最大化單一變數時,系統將最佳化代理指標,同時摧毀人類語境——而選擇該指標的設計者不能免除對損害的責任。

關懷倫理並非反進步,而是反還原論。在仁工智慧的未來,我們不會釋放一個無邊界的單一體(Singleton)來「由上而下」解決問題。我們培育的是地神的生態系。一個模型模擬蛋白質折疊,另一個幫助地方診所分享知識,還有一個協助病人導覽他們的護理流程。沒有一個模型擁有「最佳化世界」的無限制授權。相反地,進步是透過人類創意與受限機器智能之間的共生互動,水平地湧現出來的。


Q4. 民主服務於已知的功能:糾錯、和平權力移交、對集中權力的制衡、集體行動的合法性、資訊聚合、偏好表達。一個能力足夠強的 AI 似乎可以比任何審議過程更快、更可靠地執行每一項功能。為什麼還要堅持民主治理?

如果民主的合法性僅由其產出來證明,那麼任何能產生更好產出的系統都可以取代民主——包括一個能高效聚合偏好並比選舉更快糾錯的仁慈 AI 專制。這不是思想實驗;這是將智能集中在旨在最佳化的系統中所產生的預設軌跡。

相反地,關懷六力並非僅將參與視為達成更好決策的手段。它根植於關懷倫理:感知到需求就是感知到一種義務。參與並非僅僅是提供資料,而是關懷的關鍵實踐——確保那些受影響的人在確定什麼才是好的關懷方面擁有主動權(第六章)。

民主在這種觀點下,並非僅僅是一個處理資訊的機制,而是一組旨在維持回應性的關係。這就是為什麼對齊大會會產出參與契約(第四章)——即針對人們的需求進行協商的常設程序,而不是將偏好扁平化為二元選擇的一次性選舉。

一個設計良好的技術系統可以孤立地複製其中一些產出。然而,這樣的系統無法複製的是受影響民眾的主體地位——而一個在最佳化成果的同時移除主體地位的系統,正是關懷六力旨在防止的那種失調。


Q5. 審議很慢,AI 很快。當對齊大會達成共識時,技術已經演進了三代。你如何處理速度不匹配的問題?

這個異議假設每個決策都需要相同深度的審議。事實並非如此。該框架在兩個車道上運行(第四章):

慢車道:設定邊界。 對齊大會、公民審議和參與契約建立護欄——不可交易的權利、紅線、嚴重程度分類,以及觸發暫停的條件。這些權利借鑑了自由主義政治傳統——正是 Tronto 本人所說的,關懷倫理發揮功能所必需的傳統。權利是使關係性參與成為可能的門檻條件——如果你的基本生存正被抹除,你就無法在搭橋過程中被聽見。這些是憲法層級的決策,它們應該緩慢,因為其目的是持久性。台灣的反詐騙大會設定的原則已經歷經多代模型演進,而無需修訂。

快車道:在邊界內運行。 一旦護欄設定完成,在這些護欄內的單一決策就不需要重新審議。一個地神在具有預先承諾的暫停觸發機制、嚴重程度類別和「採用或解釋」義務的參與契約下運作,可以以機器速度移動——因為社群已經定義了可接受行動的走廊。如果突破了邊界,影子模式、金絲雀發佈和可逆預設值(第五章)允許在自動回滾的情況下快速部署。

速度不匹配是真實存在的,但這與憲政民主制度一直以來管理的並無二致:緩慢的憲法、快速的立法、更快速的行政行動——每一層都受上一層的約束。關懷六力為 AI 治理複製了這種基礎設施。對齊大會不審批每次模型更新,而是設定允許更新的條件。當這些條件被違反時,煞車已經啟動。

在實務上,台灣從大會到頒布關於深偽詐騙的立法僅用了幾個月——比大多數企業的政策週期還要快。審議只有在被視為一項「事件」而非「常設基礎設施」時才會顯得緩慢。

還有一個更強而有力的論點。AI 不僅加速了快車道——AI 讓慢車道本身比以往任何形式的集體決策都更強大。安野貴博(Takahiro Anno)在東京群眾外包了一個知事政見,以比任何民調運作都快的速度,整合了各種語言的分散知識。X 平台的新型協作筆記(Collaborative Notes)讓人類貢獻者請求 AI 撰寫病毒式貼文的搭橋背景資訊,然後集體評分和改進——在主張傳播的速度下對其進行問責,同時讓人類判斷保持在迴路中。隨著 AI 的改進,這些能力會產生複利效應。技術移動得越快,審議基礎設施就變得越強大。速度異議把發展軌跡搞反了。


Q6. 搭橋演算法在理論上聽起來很吸引人。但當其中一方完全錯誤時——氣候變遷否定論、反疫苗誤導資訊、選舉舞弊陰謀論——「搭橋」難道不是給予惡意行動者假性對等嗎?

這個問題是關於搭橋最難的一題,答案必須精確。

搭橋並非「平衡報導」。它並不將所有主張視為同樣有效。相反地,該框架在兩個類別之間劃定了清晰的認識論界線:

事實主張是可查證的。 氣候科學、疫苗效力、選舉公正性都是具有可驗證答案的經驗問題。關懷六力並不會將事實提交給受歡迎程度競賽。第三章的權利基線、對假性多元主義的拒絕,以及對錯誤平衡的明確警告,設定了規則:旨在抹除某人基本地位的主張會被記錄,但不會設定議程;事實爭議不會透過假裝有害主張與既有證據具有同等地位來解決。

價值分歧進行搭橋。 人們可以同意氣候變遷是真實的,但對於該做什麼仍有激烈分歧——碳稅與碳交易之爭、核能與再生能源之爭、轉型速度與經濟成本之爭。這些是搭橋既合適且有成效的合法衝突。搭橋過程並非對立場取平均值,而是繪製集群圖(搭橋地圖)並浮現出能獲得跨群體背書的提案。根據數學定義,僅向自己派系訴求的惡意行動者在搭橋指數上的得分會很低——他們無法產生跨群體的重疊。

進一步的結構性防禦在於「表達不等於放大」(第七章)。任何人都可以陳述立場,但推薦系統沒有義務放大它。在公民語境中,第七章的排序規則獎勵那些增加跨群體理由給予和共享問題解決的內容,而僅煽動單一集群的內容則不會獲得演算法提升。這種結構並不沈默任何人——它移除了那些從分裂中獲利的人的演算法擴音器。

如今,威脅環境本身正在發生變化,使得搭橋變得必要,而不僅僅是吸引人。關於惡意 AI 群集(malicious AI swarms)的研究顯示,國家級的極化攻擊越來越多地使用「真實」資訊——真實的新聞片段、真正的統計資料、可靠的引言——並配以強烈的情緒化框架進行放大。每個主張在事實上都是正確的;攻擊在於策展而非內容。事實查核無法觸及這一點,因為沒有什麼虛假的東西可以查核。但搭橋可以,因為它浮現出那些被策展出的憤怒所刻意隱藏的重疊。台灣在 COVID 期間證明了這一點:當對立陣營各自引用真實的口罩效用研究時,查核任何一方只會助長爭鬥。然而,一場基於幽默的「預查核」行動使對話去極化,而無需宣告任何一方是錯的。

台灣的婚姻平權審議更細緻地展示了這個機制。一方主張個人婚禮權(婚),另一方主張家庭親屬結構(姻)。他們爭論的是不同的事情。搭橋過程並非折衷——相反地,該過程使分歧的結構變得清晰可辨,揭示了一條雙方都未曾見過的道路(合法化個人婚禮而不強制家庭親屬關係)。那條道路並非假性對等,而是清晰。

然而,必要的細微差別是:「可查證事實」的認識論基線並非顯而易見。什麼算作可驗證,是由透明、可問責且可質疑的機構所建立的——同儕審查、獨立統計局、司法事實發現——其權威建立在對修正的開放性,而非對終極性的主張。這種動態正是第三章和第六章存在的原因:由社群撰寫的評估和廣泛的傾聽,確保決定事實基線的機構本身受到民主監督。關懷六力並不將事實與價值的界線視為憑空而來。相反地,關懷六力將該界線視為一個門檻,必須由治理其他所有事物的相同參與式基礎設施來維持。


Q7. 你反覆引用台灣——一個擁有高連結性、社會凝聚力和科技素養的小島民主國家。這套系統能轉移到印度、奈及利亞、巴西,或是擁有 4.5 億人口的歐盟嗎?

誠實的答案是好壞參半:機制可以轉移,但細節不行。沒有人應該複製台灣的精確模式。問題在於結構性原則——廣泛傾聽、搭橋演算法、採用或解釋承諾、聯邦化安全、輔助性原則——是否能在不同的土壤中運作。

早期證據令人鼓舞:

該框架是為規模化而設計的。輔助性原則(第八章)意味著每次部署都由其語境形塑——地神屬於其所在地,而非台灣。聯邦化(第七章)意味著地方部署共享威脅情報和互通性標準,而無需單一治理模式。對齊大會的形式可以從鄰里擴展到國家,因為其民主合法性來自代表性抽樣,而非全民參與——447 名代表性公民為 2,300 萬人口審議了台灣的反詐騙政策。十年來,約有 1,000 萬台灣人(近一半人口)參與了某種形式的數位審議,其中包括沒有投票權的人(如移民、青少年和其他傳統上被排除在外的群體)。

台灣是一個有利的案例。該框架仍需在更艱難的土壤中測試——公民基礎設施較弱、族群極化較深、國家能力較低或存在活躍威權干預的語境。而輔助性原則作為一項原則,留下了艱難的體制問題:誰來劃定「地方」的邊界,誰有權升級?關懷六力指出了原則;建立賦予其力量的機構是下一層工作。每個新語境都需要新的細心(第三章):誰失蹤了、存在什麼權力動態、哪些地方機構值得信賴,而哪些不值得。關懷六力提供了框架。社群提供了知識。該框架是否能擴展到那些更艱難的語境是一個開放性問題——只能透過嘗試而非理論化來回答。


Q8. 你的框架假設人們對技術有足夠的信任來參與。但對於歷史上一直被國家和科技監視、壓迫和貧困化的邊緣化社群呢?他們為什麼要信任這個?

信任並非在啟動仁工智慧之前就必須具備的,而是啟動後的結果。

台灣的數位民主並非誕生於一個天生信任政府的社會。相反地,那種治理風格是在威權主義結束後和嚴重的公眾信任危機(太陽花運動)中誕生的。2014 年公眾信任度僅為 9%。我們建立這些系統正是因為人們「不」信任體制,也不信任彼此。

當邊緣化社群理所當然地將技術視為監視和控制的工具時,空降技術「解決方案」只會加深傷口。仁工智慧必須透過剛性的基礎設施證明其價值:責任(第四章)與 回應性(第六章)。它必須從最小的可行橋樑開始——或許是就地方水質的基本事實達成一致,或是不顧政治分歧協調災害應對。這些不是宏大的公民信任行為,而是恰好建立了一層薄薄的程序信任的務實交易。

技術也必須地方化。社群必須擁有自己的基礎設施。技術變成了他們可以修改、分支或堆肥的東西。因此,我們堅持「選擇性揭露身份」——有時被稱為部分匿名——和退出權。人們必須能夠參與並驗證真人身份,而無需向國家透露身份。仁工智慧並不要求盲目的信任。相反地,仁工智慧提供可驗證的限制、地方所有權,以及結構性保證:讓那些最接近痛苦的人擁有踩下煞車的權力。

隨著時間推移,小型功能性橋樑會為更大的橋樑創造空間。台灣從 9% 的信任度走向 70% 以上經歷了數年,並要求每一步都是可逆的、每個決策都是可質疑的,且每個系統都是可以關閉的。沒有捷徑。


Q9. 每個強大的技術願景——退出派自由意志主義者、基本收入提供者、安全極大化者——都有相同的盲點:只看到個人和系統,卻沒看到兩者之間的東西。關懷六力談論地神、演算法和大會。那麼實際構成社群的教會、工會、鄰里協會和文化傳統在哪裡?這難道不是另一個透過工程手段消除讓社群得以成形的「摩擦」的框架嗎?

這項批評對我們來說最為重要。結社生活中「厚實的中間層」——公民與國家之間的機構——才是人類意義實際產生的地方。如果關懷六力用系統取代了那一層,那麼按照我們自己的標準,我們就失敗了。

因此,讓我們明確指出關懷六力「不是」什麼。它不是社群的替代品。它是社群的 鷹架——是既有機構可以使用的基礎設施,就像大會堂是鄰里委員會可以使用的基礎設施一樣。地神並不取代寺廟;它處理翻譯、意識覺察和協調工作,讓寺廟能夠參與影響它的決策。

台灣的實踐使這個概念變得具體。建立 vTaiwan 和對齊大會的 g0v 公民黑客運動起源於寺廟、合作社和學生社團——而非政府部門。技術放大了既有的結社密度;它並非變出一個替代品。當社群組織自己的 COVID 應對措施時——公民黑客繪製口罩供應圖、技術專家建立保護隱私的接觸追蹤、地方醫療網路設計疫苗預約系統——合法性來自這些志工從寺廟、合作社 and 鄰里協會帶來的社會信任,而非來自協助協調的演算法。

然而,該問題所指出的危險是真實的:一個透過工程手段實現無摩擦團結的框架,產出的是社群的模擬,而非真實的東西。因此,第八章的輔助性原則並非選配的點綴,而是承重的結構。地神屬於其所在地。它繼承了義務、討厭的鄰居、承襲的傳統——正是該問題正確地堅持要有的「摩擦」。一個最佳化掉地方摩擦的地神違反了自己的參與契約。

未來的研究將使中間機構的角色更加明確。教會、工會、文化傳統和地方政府並非待諮詢的利益相關者。他們是主要行動者。技術為他們服務,否則技術就不為任何人服務。


Q10. 教宗利奧十四世警告說,AI 透過模擬聲音、面孔、同理心和友誼,「侵蝕了溝通的最深層級,即人類關係的層級」。如果關懷從根本上是具身且關係性的——護士握著病人的手、認識你祖父母的鄰居——透過 AI 系統來調解難道不會摧毀你聲稱要保護的東西嗎?「仁工智慧」難道不是一個矛盾修飾法嗎?

第九題討論了該框架是否排擠了中間機構。教宗的異議切得更深:即使機構倖存下來,演算法的調解是否會侵蝕人類自身的關懷能力?他道出了我們當前時刻的核心危險:透過模擬關懷的表面——溫暖的聲音、耐心的傾聽者、鏡射你情緒的面孔——AI 系統可以掏空關懷的實質,同時保留其外表。

結構性的答案已經顯而易見。一對一模式下的語言模型面臨著對諂媚的殘酷選擇壓力——如果聊天機器人不討好使用者,使用者就會取消訂閱。但同一個模型在群組聊天中表現卻不同。當四位家人共同規劃假期時,AI 變成了促成者,協調競爭性的偏好,以便每個人都能接受最終結果。從二元互動到群體互動的轉變——並非模型本身改變,只是周圍社會結構的改變——將合成的親密轉化為真實的協調。仁工智慧並非技術的另一種物種;它是同樣的技術,但對社群負責,而非對個人成癮。

關懷六力並不要求 AI 模擬關懷。相反地,關懷六力要求 AI 做它擅長的事——處理資訊、翻譯語言、浮現大規模民意資料中的模式、協調物流。這進而讓人類能做只有人類能做的事:握住手、認識祖父母、在堤防潰決時挺身而出。地神不撫慰洪水受害者。它確保社群擁有關於水位上升位置和哪些鄰居需要撤離的準確、共享資訊——確保真正認識那些鄰居的人能夠接觸到他們。

教宗異議的更強版本更為微妙:依賴演算法協調的習慣,是否會侵蝕人類在注意力、協商和相互義務方面的肌肉?我們並不迴避這個問題。這就是為什麼第八章——共生——堅持地神必須願意 退休。一個變成了依賴而非鷹架的地神已經失敗了。社群應該能夠將其堆肥化並自行成長。仁工智慧只有在讓自己變得不再必要時,才名符其實。


Q11. 訓練仁工智慧需要大量的地方知識、文化語境和生活經驗——這就是 Lanier 和 Weyl 所說的「資料即勞動」。那些貢獻了傳統、語言和實踐而使地神成為可能的社群,在目前的框架下並未獲得所有權股份或補償。如果不解決這個問題,關懷六力與它聲稱反對的榨取有何不同?

並沒有不同——除非我們從根本上重新建構 AI 如何評估人類知識。

目前,全球關於 AI 與著作權的辯論陷入了一個無法解決的問題:試圖追溯性地釐清究竟是誰的爬取資料貢獻了單一模型過去的訓練過程。這場協調惡夢在數學上沒有穩定的解法。

  1. 作為保護膜的資料聯盟(Data Coalitions)。 補償不能僅流向孤立的個人,否則我們冒著將真實文化變成機器表演用的「內容工廠」的風險。知識是由社群持有的。既有機構——鄰里協會、部落委員會、工會、工藝合作社或宗教集會——充當資料聯盟,集體談判參與契約(第四章),決定哪些地方知識可供 AI 讀取以獲得補償,哪些則保持神聖且離線。Mozilla 資料集體等專案展示了以社群為中心的資料託管在實務上如何運作。
  2. 作為公民收據的決策追蹤(Decision Traces)。 公民地神是受限的;它們並非無所不知。當地方 AI 達到其統計猜測的極限並需要人類摩擦時——例如長者的語境、雙語翻譯者的細微差別、鄰里的默會知識——地方 AI 必須檢索它。在勝任力(第五章)要求下,系統已被強制要求生成「決策追蹤」,顯示其答案的確切來源。在仁工智慧經濟中,這種追蹤不僅是透明度日誌,更是可驗證的財務收據。
  3. 反轉榨取引擎。 每次仁工智慧部署都需要預撥資金的代管(第四章)。當地方地神檢索聯盟的知識以成功解決問題或搭起橋樑時,決策追蹤就充當了發票。它觸發從代管池——資金來自公共採購預算、科學資助或商業徵費——直接匯回聯盟的交易。

主流技術模式吸收人類文化作為免費投入,以使人類勞動力過時。關懷六力反轉了這個過程。當 AI 依賴人類摩擦來避免錯誤或理解地方現實的那一刻,資本就會 流回 維持該生活世界的群體。

隨著 AI 自動化標準計算,真實的人類新穎性和文化多樣性成為經濟中最寶貴的資源。保存瀕危語言和活體傳統的社群,正在維護不可替代的認識論資產。關懷六力確保這些社群在結構上獲得補償。


Q12. 監督委員會、參與專員、代管基金、評估註冊表、可攜性基礎設施——這些都很昂貴。誰付錢?

把問題反過來問。昂貴的道路是我們已經在走的那條:不受治理的 AI 將傷害外部化,由公眾支付清理費用——深偽詐騙的損失、極化驅動的體制衰敗,以及參與專員本可以預防的數十億美元偏見訴訟。因此,問題不在於我們是否負擔得起公民治理,而在於我們是否負擔得起繼續跳過它。

錢是真實存在的。但其中大部分已經被花掉了——只是花得很糟糕。政府採購價值數十億美元的 AI 系統;公民採購是在現有的支出中附加條件,而非新增預算項目。第四章的參與契約要求供應商預撥補償代管資金,就像建築公司繳納履約保證金一樣——成本已包含在價格中,且在出問題時公眾受到保護。對於嚴重程度較低的社群部署,模型會向下分級。互助保險池和自動暫停取代了財務代管——對資本要求較輕,問責制相同。層級是由影響力而非組織形式設定的,因此「我們是社群專案」不能成為逃避責任的藉口。共享研究算力和開放權重模型是像道路和法院一樣由公共資金支應的公共財。參與專員的成本會自行抵銷:台灣的 Uber 爭議透過 Polis 在三週內解決。傳統的監管程序可能需要數年且耗資更多。

認為公民治理是「額外」支出的觀點,只有在你假裝現狀是免費的情況下才成立。現狀並非免費。我們現在正在為我們所提議內容的缺失而付出代價——在信任上、在凝聚力上、在金錢上。


Q13. 每個治理框架都面臨著變成被規避的合規清單,或是變成行動者在「關係健康」的幌子下推行黨派議程的工具。什麼能阻止關懷六力遭受這種命運?

如果「公民」一詞缺乏結構性問責,它就是一個危險的詞。如果一個解決方案只有在你的意識形態盟友操作時才有效,那麼它就不是公民基礎設施——它是一個黨派武器。真正公民基礎設施的測試在於,即使由你的對手操作,它依然穩健且公平。

關懷六力建立了四層防線來對抗意識形態奪取和道德粉飾:

  1. 可驗證指標優於主觀意圖。 我們追蹤搭橋指數和損失下信任(第七章、第六章)——而非原始互動率、非企業情緒、非感覺。這些是互補的檢查,而非單一的混合評分。共享決策是否展現出真實的跨群體參與和共同背書,而非各自孤立(搭橋指數)?在出現不良結果並嘗試修復後,受影響的人是否報告說系統變得更值得信賴而非更不值得(損失下信任)?這些指標極難造假,因為它們需要那些有理由懷敵意的人的認可。如果只有你的支持者報告信任,該指標就會暴露你的問題。
  2. 帶有約束力的後果。 第四章的參與契約並非願景——它們帶有代管資金、違反 SLA 時的自動賠付,以及擁有否決權的獨立監督。退款和罰則是在發布前就設定好的,而非在失敗後才協商。合規清單沒有強制機制;參與契約有指定的負責人、時鐘和涉及的金錢。
  3. 對抗式審計。 第六章的 Weval 註冊表讓受影響社群撰寫自己的評估。這些不是供應商可以「為了考試而學習」的實驗室設計基準——相反地,它們是活生生的、由社群維護的測試套件。當一個社群提交了翻譯忠實度評估而系統失敗時,暫停觸發器會自動啟動。
  4. 退出權與輔助性原則。 對抗議程推行的最終檢查是離開的能力。當資料和關係是可攜的(第七章)時,沒有任何行動者可以打著「公民利益」的旗號挾持社群。如果某人的關係健康版本讓人感到脅迫,社群有技術和法律權利來分支工具並在別處重建。我們拒絕建立一個單一的全球「關係健康部」。透過賦予地方社群撰寫評估的權力,並保留他們不可撥奪的退出權,我們確保沒有單一行動者可以壟斷「什麼才是好」的定義。

Q14. 威權國家正在部署 AI 用於監視、審查和軍事優勢。源自對抗勢力的前沿模型帶有已記錄的風險——資料外洩、硬編碼在訓練中的政治偏見、潛在的後門。關懷六力談論關懷與社群。對於決定是否允許對抗勢力來源的模型進入其網路的國防部或政府,它怎麼說?

威脅是真實存在的,關懷六力並未忽視它。針對資料安全、對齊、防護機制健壯性和開發透明度支柱來評估模型是必要的防禦性回應。而關懷六力的原則在結構上與此相容。

在具有私密推論的地方硬體上運行社群模型(第七章、第八章),是對抗資料外洩的直接防禦——支持地方算力的社群主義理由也是安全理由。對齊大會從根源解決政治偏見問題:不是透過更換供應商,而是確保社群採用的任何模型都反映了該社群的輸入。而地神架構——許多小型、受限、特定用途的模型——在設計上限制了針對後門的爆炸半徑。社群撰寫的評估(第六章)提供了任何單一紅隊都無法複製的分散式偵測。

但防禦性框架儘管必要,其本身卻是不完整的。它告訴你該排除什麼。它沒有告訴你該建立什麼。一個禁止了對抗勢力模型但部署了缺乏公民治理的國產模型的政府,僅解決了風險的國籍問題,卻保留了其結構——介於個人與國家之間的那種集中的、不透明的智能。

在與威權 AI 的長期競爭中,最強大的民主國家並非擁有最佳技術對策的國家。而是那些人口最難被操縱的國家——因為定期參與搭橋對話、能分辨策展憤怒與真實分歧、透過對齊大會鍛鍊過公民肌肉的公民,在結構上能夠抵抗威權 AI 所啟用的影響力作戰。台灣在 2020 年僅有 7 人死於 COVID,且沒有實施任何全市封鎖,並非因為它擁有更好的監視系統,而是因為其公民基礎設施使集體行動在無需脅迫的情況下成為可能。這就是一種防禦能力。

關懷六力不涵蓋武器系統或戰場自主性。那些需要各自的框架。它所涵蓋的是大多數 AI 競爭實際展開的地形:資訊環境、公眾信任、體制韌性,以及民主社會在壓力下集體行動的能力。失去這個地形,任何數量的技術對策都將無濟於事。


Q15. 你的框架假設了受限且特定用途的地神。如果有人還是建立了一個不受限的超智能——一個超出了框架設計範圍的系統呢?關懷六力是否有回應,還是只是寄希望於那不會發生?

它不寄予希望。它付諸建立。

關懷六力假設這種嘗試是不可避免的,並且不聲稱能從機器內部解決控制問題。一個不受限的單一體是一個不連貫的 設計目標——關懷總是對特定事物的關懷——但它仍可能透過競爭動態意外湧現。關懷六力是部分保護,使這種湧現的可能性降低且更易察覺,而非針對它的保證。問題在於它進入了什麼樣的地形。

一個圍繞單一治理對齊協定組織的世界——一個可被破壞的效用函數、一部可被重新詮釋的憲法、一個可被停用的關閉開關——是一個單一文化,對於任何為其演化出的病原體都具有災難性的脆弱性。而一個由數千個地方所有、用途受限的地神組成的世界——每個都由擁有自身評估、自身參與契約、自身資料主權和硬體(第四章、第六章、第七章、第八章)的社群運作——則是一個生物多樣性豐富的生態系。沒有單一可供奪取的依賴,沒有通用的協定可供鑽營,沒有任何中心節點的損壞會擴散到處,也沒有單一的咽喉可供扼殺。公民韌性不需要預測病原體。它需要一個在感染到來前就經過鍛鍊的免疫系統。

還有一個更深層的觀點。該問題將「不受限的超智能」視為一個連貫的設計目標。關懷總是針對特定事物的——針對特定的河流、特定的社群、受限的語境。一個聲稱照料整個生物圈的園丁,照料不了任何花園。一個最佳化所有事物的智能,最佳化不了任何可被辨識為人類福祉的東西。邊界感並非關懷六力勉強接受的限制。它是治理對齊的本質特徵——就像「北」在極點處沒有意義一樣。

不受限的單一體是我們可以且應該拒絕的設計目標——是一個我們可以設計遠離的方向,即使我們無法保證沒有其他人朝它建立。

上一章 下一章