正規表示法::不貪多演算

不論在哪種語言，正規表示法(regular Expression，簡稱RE)預設上都會盡可能的擷取更多的資料範圍，一般稱為貪心演算法。當然本篇不是在研究演算法本身，只是作為常用RE的筆記。

但是一般實務上，通常並不需要貪心演算，許多情況下，貪心演算甚至會礙事。所以，當我們在抓取資料的時候，必須要告訴電腦：老實點，別太貪心！這在RE裡面是怎麼表示呢？就是在次數表示符(quantifier)後面，加註一個『?』，例如：

『.*』代表抓取任意字元、任意次數、貪心演算
『.*?』代表抓取任意字元、任意次數、不貪心演算
『.+』代表抓取任意字元、一次以上、貪心演算
『.+?』代表抓取任意字元、一次以上、不貪心演算

在quantifier 後面加註問號，並不會改變他的意義，改變的只有他的『貪婪程度』。

其他例子：
\d*? ：任意數字、任意次數、不貪心演算
\w*? ：任意文字、任意次數、不貪心演算
\D*? ：任意非數字、任意次數、不貪心演算
\W*? ：任意非文字、任意次數、不貪心演算

其他正規表示式的參考資料

1. 比對「一個字元」的符號：
[...] ... 當中任何一個字元
[^...] 除了 ... 之外的任何一個字元
. 任何一個字元

2. 「定位」功能的 anchor：
^... 以 ... 開頭的字串
...$ 以 ... 結尾的字串
\b 文數字/非文數字的邊界。

3. 計數用, 表達「重複出現多少次」的 quantifier：
{5} 重複 5 次
* {3,7} 重複 3 到 7 次
? 可有可無 (0 次或 1 次)
* 重複出現任意次, 包含 0 次
+ 重複出現任意次, 至少 1 次

常用符號：
\d 等同 [0-9]，代表『任意數字』
\D 等同 [^0-9]，代表『任意非數字』
\w 等同 [a-zA-Z0-9_]，代表『任意文字』
\W 等同 [^a-zA-Z0-9_]，代表『任意非文字』
\s 等同 [ \t\n]，代表『任意空白字元』
\S 等同 [^ \t\n]，代表『任意非空白字元』

轉錄：
http://deer.nublog.cc/article.php?u=DeeR&i=20080225

留言

這個網誌中的熱門文章

Vibe Coding：為什麼 Junior 更快上手？Senior 要如何追趕？

現象層面（市場觀察）最近有篇文章討論 junior & senior 開發者在 AI 時代的角色轉變，非常熱門。身為 Cympack 產品開發團隊，我們也一直關注這個議題，在閱讀這篇文章時觀察到一些有趣的現象，對我們來說，這正好反映出 AI 正在改變開發生態，junior 借力 AI 快速成長、senior 則需要在「架構思維」與「多 agent 協作」中找到新定位，其中有些啟發（insight) 可以跟大家分享。為什麼 Junior 更容易上手 vibe coding？心智負擔低 → Junior 沒有太多傳統 code workflow 的框架包袱敢於嘗鮮 → Gen Z / 年輕工程師天生習慣用 prompt-based 工具、跟 LLM 互動少「優雅程式設計」的束縛 → 不太糾結「這樣寫會不會不夠優雅」，反而 embrace 快速迭代、快速出成果反觀 Senior：熟悉大型系統設計有豐富的「工程正統流程」知識（架構設計、測試策略、效能優化、設計模式）對 AI 生成 code 的品質 / 維護性通常比較保留部分 10+ 年資深工程師，對 prompt engineering 沒那麼熟練，還在觀望技能面（未來的關鍵能力） Vibe coding 本質上 = prompt engineering + AI co-pilot 管理能力能力項目誰目前比較有優勢？ Prompt 撰寫 / AI 互動 Junior 較強（熟悉 chat-based 流程）系統設計 / 架構把關 Senior 較強 AI 生成 code 驗證 / Bug 察覺能力 Senior 較強（能看出潛在問題）快速疊代 / Hackathon 式開發 Junior 較強長期維護性 / 穩定性 Senior 較強總結 Junior 確實更快適應 vibe coding，並且更習慣以「chat-based coding」的工作流開發。 Senior 擁有驗證 AI 產物與系統設計的深度能力，但若不主動練習 vibe coding，長期會逐漸落後於新一波開發潮流。就如同在 GAI 技術年會分享，希望帶給各位的感受，『與 AI 協...

繼續閱讀>>

Vibe Coding 協作到自建 Dev Agent？從 Claude / Codex 到 OpenHands

過去一年，越來越多工程師開始把 AI 真正帶進工作流程。從一開始用 ChatGPT、Claude 來問語法問題，到後來很多人愛上 Cursor，直接在編輯器裡讓 AI 幫忙改 code、補 test case、甚至自動整理 PR。這樣的開發體驗，已經大大改變了我們寫程式的方式。更現實的是，在很多企業內部、政府單位、或涉及機密資料的專案裡，其實根本不能直接用 Cursor 或雲端 LLM 工具。畢竟這些服務通常會把資料傳到雲端模型做處理，萬一專案裡有未公開的技術、敏感客戶資料，或是受限於法規（像金融、醫療、政府標案），直接用雲端 AI 工具就會踩紅線。因此，許多團隊反而更希望「自己架一套 Dev Agent」，可以在內網執行，資料完全掌握在自己手上，該整合的內部工具、該讀的私有 repo、該串的 CI/CD pipeline，全部客製化、安全可控。這時候，像 OpenHands 這樣的開源 Dev Agent 框架就特別有價值。它的出發點不是單純的 AI 助手，而是讓你能夠打造出一個真的可以跑在自己環境裡、可以理解整個開發流程的 AI 工程師。從建置到部署，從 CLI 操作到瀏覽器查詢，從多檔案編輯到自動測試，全部都能自己完成，甚至還能針對不同專案調整專屬的工作流。對很多開始探索 AI 協作開發的團隊來說，這是一條從「AI 幫你寫一段程式」，走向「AI 幫你解決一整個任務」的進化路徑。而且，還是在可控、可自定義、安全的環境裡完成的。 🧩 主要概述 OpenHands 是由 All‑Hands AI 開發的開源「軟體開發代理人平台」，能模仿人類工程師從建立程式、修改程式碼、執行指令，到瀏覽網頁、呼叫 API……等一整套開發流程它提供雲端（OpenHands Cloud）與本地 Docker 運行版本，用戶能配置 LLM（如 Claude、OpenAI、Gemini…) 📚 核心特性與怎麼使用代理人的工具能力支援代碼編輯、命令行、執行環境、網頁瀏覽、API 呼叫—接近人類開發者完整技能。其中 OpenHands Cloud 版本提供 $50 試用額度讓大家方便使用，又或者如果自己本機有 docker 的話，可以自己Local 版本透過 Docker 自架環境。 ...

繼續閱讀>>

Google Gemini 全端 AI Agent 快速入門 - 打造「思考」的 AI 助理

一套從搜尋、反思到輸出的全端 AI 代理人範例，讓你看懂什麼叫 Research Agent 在 AI 工具百家爭鳴的今天，大家都在問一個問題：「我能不能不只問 AI 答案，而是讓它像一位助理一樣，有流程、有反思、還有出處，真正幫我完成一件事？」 Google 最近釋出了一個相當具有指標意義的開源專案 gemini-fullstack-langgraph-quickstart ，正是為了解這個問題而誕生。這套系統到底是什麼？這個範例不是傳統 Chatbot，而是展示一個完整的 AI research agent ：它會根據使用者的提問，自動發想搜尋關鍵字、查資料、整合重點，最後給出答案還附上引用來源。背後的邏輯設計得非常扎實，不只是能跑，更是具備可讀性、可擴展性與可商用性。它的流程大致如下： 1. 使用者輸入問題（例如：「抖音是否影響台灣選舉？」） 2. Gemini LLM 幫你想出關鍵字（不只是照抄問題） 3. 呼叫 Google Search API 抓資料 4. LangGraph 控制流程 → 判斷資料夠不夠 → 若不足，自動補查 5. 整合最終答案，並產生 citation（來源說明）你可以想像這就像一位實習助理幫你寫報告，不只輸出一段內容，而是會去查、會判斷、會補資料，而且說明「我為什麼這樣說」。 LangGraph 是什麼角色？ LangGraph 就是整個 Agent 背後的控制系統。用白話講，它幫你定義 AI 每一步要幹嘛、遇到什麼狀況該走哪條路、要不要反思、要不要再查，甚至可以定義條件邏輯與資料流動。這就不像寫一個單純的 Chat API，而是比較像「把一個流程圖變成可以跑的程式」。對工程師來說，它提供了從 prompt 到流程控制的設計彈性；對產品設計來說，它讓 AI 有了「多步驟任務執行」的能力。技術架構與使用方式這整套系統是 Fullstack 架構，前後端都幫你整好了，技術選型也非常實用：前端：Vite + React + TailwindCSS + Shadcn UI 後端：FastAPI + LangGraph...

繼續閱讀>>

熱血漢誌 - 技術新鮮人到技術經理人，必懂的事

搜尋此網誌