EP-55 |當 AI 住進你的電腦裡:5個我最常用的AI工具
探討 2025 年 AI 發展的六大典範轉移,包括 Andrej Karpathy 提出的 RLVR 新訓練法、在地端 Agent 與 Vibe Coding 概念。文章更分享如何將 Notion、Antigravity 等五大工具導入工作流,讓 AI 真正成為你的數位第二大腦。
2025 年已經快結束,今年感覺又更捲了。除了 AI 大廠之間的競爭比往年更為激烈,人資市場上也開始要求應聘者具有使用 AI 搭配工作的經驗。
臺灣的人力資源市場上已經明顯出現「要求應徵者會用 AI、且有 AI 工具實作經驗」的現象,而且不只發生在 AI/工程職缺,連 HR、行銷、財務、設計等職務也開始把 AI 工具能力寫進條件。這個趨勢也被大型人力平台與企業訪談內容明確點出,AI 正在被視為職場「基本配備」之一。
但是,捫心自問:你真的懂得使用 AI 嗎?如果你還停留在「把 AI 當成加強版 Google」的階段,那你可能正錯失紅利。
在我們談論如何優化個人工作流之前,讓我們先跟隨 AI 領域的大神——Andrej Karpathy 的視角,看看 2025 年的 AI 發展有哪些關鍵的「典範轉移」。
解讀 Andrej Karpathy 的六大「典範轉移」
如果說 2023 年是大型語言模型(LLM)的爆發元年,那麼 2025 年就是它們真正「長出大腦」、改變我們工作本質的一年。
Andrej Karpathy,他是前特斯拉 AI 總監、OpenAI 的創始成員,以及深度學習領域的頂尖專家。前幾天他在部落格中回顧了充滿變數的 2025 年,指出我們正經歷六個關鍵的「典範轉移」(Paradigm Changes)。
1. 訓練新顯學:讓模型學會「慢思考」 (RLVR)
過去幾年,訓練一個 AI 模型的標準流程是:先閱讀海量網路文章(預訓練),再教它如何對話(SFT),最後透過人類評分來微調(RLHF)。但在 2025 年,一個新的關鍵步驟確立了霸主地位:「來自可驗證獎勵的強化學習」(RLVR)。
什麼是 RLVR?簡單來說,就是讓 AI 在有標準答案的領域(如數學題、程式碼謎題)反覆練習。因為答案是客觀可驗證的(對就對,錯就錯),AI 可以進行無數次自我博弈,從錯誤中學習。
Karpathy 指出,這種訓練讓模型自發性地發展出了「推理能力」。像 DeepSeek R1 或 OpenAI o1/o3 這樣的模型,學會了將複雜問題拆解成中間步驟,甚至在遇到死胡同與錯誤時懂得回頭重來。這也帶來了新的算力定律:我們可以用更長的「思考時間」(Inference-time compute)來換取更高的智力表現。
2. AI 是「幽靈」不是「動物」:參差不齊的智慧
我們常習慣用生物演化的角度來看待 AI,期待它們像動物一樣全面進化。Karpathy 認為這是一個錯誤的類比。他提出了一個有點毛骨悚然但精準的比喻:我們不是在培育動物,而是在「召喚幽靈」。
人類的大腦是為了在叢林中生存演化而來的;而 LLM 的神經網路則是為了模仿人類文本、解數學題和討好人類評分員而優化的。這導致 AI 的能力呈現極度的「鋸齒狀」(Jagged Intelligence):它們同時是博學多聞的天才,卻又可能像個小學生一樣犯下低級錯誤,甚至輕易被簡單的話術騙過。
因此,傳統的「跑分測試」(Benchmarks)在 2025 年已逐漸失去公信力,因為針對特定考題的過度優化(刷題),讓分數與實際能力脫鉤。
3. Cursor 效應:AI 應用層的崛起
2025 年,程式碼編輯器 Cursor 的崛起證明了一件事:在「通用模型」與「最終用戶」之間,存在一個巨大的「應用層」機會。
Karpathy 預測,OpenAI 或 Google 等實驗室將傾向於培養出「能力通用的優秀大學生」(基礎模型);而像 Cursor 這樣的應用開發商,則負責將這些大學生組織起來,配備專屬的工具、數據和工作流程,將它們訓練成特定領域的「專業團隊」。這意味著,未來的軟體將是由多個 AI 代理(Agents)協作運行的複雜系統。
4. 住在你電腦裡的「靈體」:本地端 Agent
Anthropic 推出的 Claude Code 展示了 AI 助理的正確型態。與其在遙遠的雲端伺服器上運行,未來的 AI 更應該直接住在你的電腦裡(Localhost)。
為什麼?因為只有在本地端,AI 才能直接存取你的檔案、環境設定和隱私數據,並以極低的延遲與你互動。Karpathy 形容這是一種全新的互動典範:AI 不再只是你瀏覽器裡的一個網頁(像 Google 搜尋那樣),它更像是一個寄宿在你電腦終端機裡的「靈體」,隨時準備幫你調度資源、解決問題。
5. 「氛圍編碼」(Vibe Coding):寫程式的終極目標
「Vibe Coding」是 Karpathy 在 2025 年發明的一個熱門詞彙。它的意思是:你只需要用自然語言描述你的感覺、需求或「氛圍」,AI 就能幫你寫出程式。
這不僅讓不懂程式的人能開發軟體,更讓專業工程師的產能大爆發。Karpathy 坦言,他自己現在會為了找一個小 Bug,或者只為了一次性的需求,就隨手「Vibe」出一個完整的應用程式,用完即丟。程式碼變得像免洗餐具一樣廉價、可塑且短暫。這將徹底改變軟體工程的樣貌與工作描述。
6. 未來的介面:AI 生成的 GUI
目前的 AI 互動主要還是靠文字(Chat),但人類其實討厭閱讀大量文字。Karpathy 認為,文字是電腦喜歡的格式,而不是人類喜歡的。
以 Google 的 Gemini Nano banana 模型為例,未來的 AI 不應只會吐出文字,而應該能直接「生成介面」。當你問它數據時,它直接畫出圖表;當你問它流程時,它直接生成互動式投影片或網頁應用。AI 將結合文字生成、圖像生成與世界知識,為人類量身打造最適合的資訊呈現方式。
如果你對原文有興趣,可以逕自閱讀 karpathy 的文章:2025 LLM Year in Review
如何讓 AI 正確地導入我們的工作流
現在已經是 2025 年末了,我應該不用再多加介紹 ChatGPT、Gemini、Claude 等聊天機器人了。
每個人都懂得打開網頁,將自己的問題丟給 AI ,期待能得到解答。
但是 AI 能力有邊界,導致我們有些時候會認為他絕頂聰明,有些時候又覺得蠢到無法置信。尤其是各家模型能力邊界還不同,會造成不同的結果。
例如最近我快要被 Gemini 給氣死,我需要讓它擔任提示詞設計師,寫出用來生成影片的提示詞,但是它都會誤以為要生成圖片或影片。
同樣的提示詞,拿去給 ChatGPT 使用,完全沒問題,正確地提供給我影片生成提示詞。
我又換到 Notion ,使用 Gemini 3 Pro 模型,也是沒問題。
所以問題可能出在 Gemini 網頁版,Google 工程師也許調整了某些設定,導致模型每次看到關鍵字就下意識要生圖或生影片。
因此更重要的問題是,我們該如何「正確地」將 AI 導入工作流?才不會浪費一堆時間摸索?
關鍵心法只有一個:不要是你去找 AI,而是要讓 AI 住在你的工作環境裡。
不再是「複製貼上」文字到 ChatGPT 網頁版,而是讓 AI 直接讀取你的檔案、你的程式碼、你的筆記。這樣它才不會瞎掰,才能成為真正懂你的工作夥伴。
以下我挑選了五個不同場景的工具,分別代表了雲端知識庫、地端開發環境、專業搜尋、深度學習與辦公室應用,讓你看看什麼叫「AI 原生」的工作方式:
1. 雲端 AI 知識庫:Notion
如果你跟我一樣是 Notion 重度使用者,一定會愛死Notion AI。
以前我們找資料是「翻箱倒櫃」,在無數個頁面和資料庫中搜尋關鍵字。現在,你只需要在 Notion 問它:「我們上個月關於某個會議的會議結論是什麼?」、「幫我整理這個專案的所有待辦事項」。
它會直接閱讀你所有的筆記(運用 RAG 技術),然後給出精準的答案,還會附上來源連結。這不只是筆記軟體,這是你的外接大腦。
💡 RAG (檢索增強生成):簡單說,就是讓 AI 先去翻你的書(資料庫),找到答案後再回答你,而不是憑空瞎掰。
2. 地端 AI 知識庫與 Coding 神器:Google Antigravity
如果說 Notion 是處理文檔的雲端大腦,那 Google Antigravity 就是住在你電腦裡的「萬能數位管家」。
別被「Coding 神器」這個名字嚇到了,它不只能寫程式,更擅長處理你電腦裡的大小事。Antigravity 直接在你本機運行,這意味著它可以直接存取並修改你的檔案。
你可以請它幫你校對、潤飾正在寫的 Markdown 文章(就像我現在正在做的事);或是讓它寫個批次檔(Batch file),一鍵幫你把亂七八糟的下載資料夾整理得井井有條。當然,如果你想要更進階一點,開發一些自動化的小程式來取代重複性工作,也只需要一句指令。
這就是 Andrej Karpathy 所說的「Vibe Coding」——你負責發號施令(Vibe),繁瑣的執行細節就交給它。
3. 專業搜尋與投資分析:Perplexity
如果你需要進行深入的市場研究,或是分析美股趨勢, Perplexity 絕對是比 Google 搜尋更強大的選擇。
它就像是一個不知疲倦的研究員,能同時閱讀數十個網頁,並整合成一篇結構完整的報告給你。特別值得一提的是它的 Comet瀏覽器的助理功能,它不像傳統 AI 是一對一的問答,而是能夠呼叫數個 AI Agent 同時執行任務。
如果你要「分析 Tesla 2025 Q3 的財報亮點與潛在風險」,你可以指派一個 Agent 去找財報原件、一個 Agent 去看華爾街分析師評論、另一個 Agent 去查股價歷史波動,最後導出所有資訊,彙整成一份深度報告。
4. 用於深度學習:NotebookLM
遇到幾百頁的 PDF 報告、艱澀的學術論文,或是長達一小時的會議錄音, NotebookLM 是我目前的唯一解。
它最強大的功能不是摘要(雖然摘要也很強),而是「語音導覽」(Audio Overview)。把資料丟進去,它會生成一段兩個 AI 主持人對談的 Podcast。他們會互相討論文件內容,用生動、口語的方式把生硬的知識講給你聽。
你甚至能讓它產出簡報、測驗、學習卡,再把資料導入 Google Workspace。
5. Google Workspace 的最佳助手:Gemini
對於每天活在 Gmail、Google Docs 和 Slides 的上班族來說, Gemini for Google Workspace 就是那個隨傳隨到的強力實習生。
收到一封落落長的 Email 討論串?直接按一下「摘要」,它幫你抓重點。
老闆要你把一份 Word 報告做成 PPT?在 Slides 側邊欄呼叫 Gemini,跟它說:「根據 Drive 裡的這份文件,幫我生成簡報大綱。」
它打破了檔案之間的隔閡,讓資料流動不再需要人工搬運。
工商時間
如果你也對於打造個人化 AI 生產力系統有興趣,我創立了付費社群「社畜進化論」,專為想用 AI 提升工作效率的上班族設計。
💎 會員專屬權益
基礎課程:涵蓋 AI 知識管理、AI Coding、AI 自動化
深度內容:每月至少 2 篇學習筆記、實測腳本或影片講解
交流討論:遇到問題可以在社群提問,一起找解方
優惠方案:進階課程享會員專屬折扣
💰 訂閱方案
月費制:$5 USD / 月
年費制:$50 USD / 年(省 $10)



