跳到主要內容

發表文章

Chandra OCR 本地部署與實測驗證完整指南

Chandra OCR 是一款功能強大的開源 OCR 模型,專為解決複雜排版、長文檔、模糊掃描件的識別難題而設計 [ 00:17 , 00:54 ]。它具備 9B 參數,支持超過40種語言(包含中文及手寫體),並能進行結構化輸出(如 Markdown, HTML),有效處理表格、公式、頁眉頁腳等複雜元素 [ 01:26 ]。 一、 安裝與部署步驟 影片介紹了兩種部署方式,一種是透過 M Studio (應為 LM Studio) 的簡易安裝,另一種是透過官方倉庫在 Ubuntu 系統上進行本地部署。 方式一:M Studio (簡易安裝) 在 M Studio 中,點擊「發現」(Discover) [ 02:02 ]。 在搜索框中輸入模型名稱(Chandra OCR)。 選擇 4-bit 或 8-bit 的量化版本。 點擊「下載」即可開始使用 [ 02:12 ]。 方式二:官方倉庫本地部署 (以 Ubuntu 為例) 影片重點演示了在 Ubuntu 系統上的部署流程 [ 02:23 ]: 安裝 uv : # 執行命令安裝 uv [00:02:27] (影片中顯示了相關命令) 克隆 (Clone) 官方倉庫: # 執行 git clone 命令 [00:02:30] (影片中顯示了相關命令) 進入項目目錄: # 執行 cd 命令進入項目路徑 [00:02:34] (影片中顯示了相關命令) 安裝項目依賴: # 使用 uv 命令安裝項目 [00:02:38] (影片中顯示了相關命令) 激活虛擬環境: # 執行命令激活虛擬環境 [00:02:43] (影片中顯示了相關命令) 安裝 Chandra OCR: # 使用 pip 命令安裝 [00:02:47] (影片中顯示了相關命令) 二、 啟動與測試驗證 部署完成後,影片展示瞭如何啟動 Web UI 界面並進行多項功能驗證。 啟動 Web UI 執行官方提供的命令來啟動 Demo UI [ 02:59 ]。 啟動成功後,在瀏覽器中打開對應的本地地址 [ 03:06 ]。 在 UI 界面左側,點擊下拉菜單並選擇「HF」來加載模型。此時後端會開始下載模型權重文件 [ 03:13 ]。 實測驗證 影片使用了多種複...
最近的文章

從 IT 專業到企業領導:一條不只是職涯的路

以下只是一段自己對自己對的對談,稍微記錄一下感覺, 很難確切的來說知道了什麼,但多少透過與 AI 協作紀錄一下自己的心路歷程。 一位 IT 專業人士,到轉型為產品技術管理,公司技術長,執行長或者管理者。不論規模大小,相信各位在這條路不只是憑運氣,也不是靠職能上的奇蹟,而是長期的累積、影響力的擴展,以及願意不斷學習與成長的結果。 當年資愈深,愈能理解企業運作的全貌:產品、流程、文化、客戶、政治——這些都不再只是「部門」的事情,而是一個有機的系統,以及許多的一間扛起,有的時候這很隱晦,但也是很直覺,不是需要想太多的事情。 IT 的角色,很容易接觸各種領域:營運、財務、行銷、供應鏈。這樣的歷練,不僅培養了全局觀,也累積了跨部門的信任與影響力。 而真正讓人從技術專家轉向領導者的關鍵,是願意承擔責任。 從只關心技術能量,專案交付,逐步轉為思考損益(P&L),去理解每個決策背後的營收與成本。 這過程不容易,要時刻不斷提醒自己,這過程裡需要不斷挑戰自己,把熟悉的事放下,去擁抱那些一開始看不懂、也不確定能不能做好的領域。 很多人會說,IT 人不懂商業;但事實上,技術思維若能與商業敏感度結合,反而能帶來更深的策略視野。尤其在以科技為驅動的時代,懂技術的 CEO 更能看清平台、風險與未來。 不過,走這條路的難度,在於心態的調整,我也持續在學習中。 學得越多,越會發現自己的渺小。以前總覺得一切都能掌控,但當層次越高、責任越重,就越能體會「能做的其實很有限」。許多時候,我們陷在自己的慣性思考裡,看似掌握,其實被框架困住。 在這過程中,能夠遇到說真話的人,『那些不迎合、不迴避、願意一針見血指出問題的人——都是珍貴的貴人。』因為正是他們,讓你看見盲點,學會承擔,學會放下。 這條路不只是升遷的軌跡,而是一段修煉。學會放下掌控、學會面對真實、學會信任團隊,也學會在不確定中繼續前進。 我自己也還在摸索,在這條路上,學習、看見、承擔、放下、再學習。 目標不是為了成為某個職稱,而是為了讓自己能夠更清楚地建立起一個又一個屬於自己的代表作,面對自己、面對他人,和找到自己的天命。

生成式引擎優AT(GEO):AI 時代的增長策略與指標

生成式引擎優AT(GEO):AI 時代的增長策略與指標 GEO,即 生成式引擎優化(Generative Engine Optimization) 的縮寫(也稱為 AEO 或 LLMO),其重點是讓您的品牌在 AI 生成的答案中被注意到——並被準確地呈現。這包括 Google 的「AI 總覽」(AI Overviews)以及像 ChatGPT 和 Gemini 這樣的 AI 助理所產生的結果。 目標是確保當 AI 工具回答用戶問題時,您的品牌能夠出現 ,即使沒有人點擊連結。 隨著 AI 工具變得越來越普遍,它們正在改變人們的搜尋方式,提供更直接、個人化的答案,而且往往不需要將用戶導向其他網站。 這意味著數位行銷正在轉變—— 從 追逐點擊轉向在 AI 的答案中直接建立品牌可見度和信任 。 可以這樣想:傳統的 SEO 就像在繁忙的街道上競爭最好的店面。 GEO 則像是確保當地的導遊知道您的店家,並會向遊客推薦它。 在本指南中,您將學習如何在 AI 驅動的搜尋時代讓您的品牌被注意到,以及如何追蹤您的 AI 可見度。 三件改變一切的事 以下是為什麼每位行銷人員現在都必須了解 GEO 的原因: 一: 現在美國所有搜尋中有 16% 會顯示 AI 總覽 (自 2025 年 3 月以來增加了一倍多)。這大約是每 6 次搜尋中就有 1 次,Google 透過 AI 總覽直接在搜尋頁面上回答查詢,而不是將他們引導至網站。這些查詢中有 97% 是資訊型查詢,這是 SEO 的主要焦點之一。 二: 當 AI 總覽出現時,排名第一的搜尋結果點擊率下降了 34.5% ——這是一個內建的變化,可能對網路上的任何網站造成巨大的流量衝擊。 三: 所有主要的 AI 助理都可以搜尋網路 ,使它們成為 Google 的新替代方案。問題是,就像 AI 總覽一樣,它們會立即回答問題,而且並不總是連結到它們提到的產品或服務(而且人們也不總是點擊)。 但在您為徹底改革行銷策略而感到恐慌之前,這裡有個好消息: AI 仍然依賴傳統搜尋 。 AI 助理使用一種稱為 RAG(檢索增強生成)的技術,這意味著它們會主動搜尋 Google、Bing 和其他搜尋引擎以查找當前資訊。因此,如果您在傳統搜尋中已經排名良好,那麼您就已經在 AI 引用和提及的競爭中了。 更高...

筆記, Obsidian Excalidraw + Google Gemini 圖解三步驟教學!用 100 張視覺模板,打造 AI 圖解工作流

文章:Obsidian Excalidraw + Google Gemini 圖解三步驟教學!用 100 張視覺模板,打造 AI 圖解工作流 來源:YouTube 頻道「跟朱騏一起打造知識型一人公司」 影片連結: Obsidian Excalidraw + Google Gemini 圖解三步驟教學! 您是否也想將複雜的文字轉化為清晰、吸睛的圖解,但又不知道該從何下手?這部影片教學將示範一個強大的工作流程,結合 Obsidian Excalidraw 插件與 Google Gemini AI,讓您在短短五分鐘內就能完成專業的視覺圖解 [ 01:40 ]。 這個工作流的核心,是來自創作者 Dave Grey 所繪製的 100 張視覺化模板 [ 00:22 ]。透過這套流程,AI 將協助我們從這 100 張模板中,挑選最適合您文章的架構,並建議您應該在圖上放置哪些關鍵文字 [ 00:55 ]。 以下是打造 AI 圖解工作流的三大步驟: 步驟一:下載並開啟 100 張視覺化模板 首先,您需要取得這 100 張模板,並在 Obsidian 中設定好 Excalidraw 環境。 下載模板: 點擊影片資訊欄中的連結,前往 Dave Grey 的網站 [ 02:51 ]。在網站中點擊「Save to file」,將檔案(副檔名為 .excalidraw)儲存到您 Obsidian 資料夾(Vault)中的任一位置 [ 03:06 ]。 安裝插件: 在 Obsidian 中,進入「社群插件」,搜尋並安裝「Excalidraw」插件 [ 03:58 ]。 轉換格式: 安裝插件後,點擊您剛剛儲存的 .excalidraw 檔案。此時它看起來會像是一堆文字 [ 05:06 ]。點擊右上角的「...」選單,選擇「convert to new format」(轉換為新格式)[ 04:56 ]。 開啟畫布: 轉換完成後,再次點擊右上角選單,選擇「Open as Excalidraw」[ 05:38 ]。您現在就能看到全部 100 張視覺化模板了。您可以將它們「解散群組」(Ungroup),以便單獨選取 [ 06:13 ]。 步驟二:使用 Google Gemini 推薦模板與文字 接下來,我們將利用 AI 來協助我們思考。您可以...

透過沙箱技術讓 Claude Code 更安全自主

Claude Code 的新沙箱功能——一個 bash 工具和網頁版 Claude Code——透過啟用檔案系統和網路隔離這兩大邊界,減少了權限提示並提升了使用者安全。 在 Claude Code 中,Claude 會與您一起編寫、測試和偵錯程式碼,瀏覽您的程式碼庫、編輯多個檔案,並執行指令來驗證其工作。給予 Claude 如此多對您的程式碼庫和檔案的存取權限可能會帶來風險,尤其是在提示注入(prompt injection)的情況下。 為了解決這個問題,我們在 Claude Code 中引入了兩項基於沙箱技術的新功能,兩者都旨在為開發者提供一個更安全的工作環境,同時也讓 Claude 能夠更自主地運行,並減少權限提示。在我們的內部使用中,我們發現沙箱技術安全地減少了 84% 的權限提示。透過定義 Claude 可以自由工作的既定邊界,它們提升了安全性與自主性。 確保 Claude Code 使用者的安全 Claude Code 在一個基於權限的模型上運行:預設情況下,它是唯讀的,這意味著它在進行修改或執行任何指令之前都會請求許可。但也有一些例外:我們會自動允許像 echo 或 cat 這樣的安全指令,但大多數操作仍需要明確批准。 不斷點擊「批准」會減慢開發週期,並可能導致「批准疲勞」(approval fatigue),使得使用者可能不會密切注意他們批准的內容,進而降低了開發的安全性。 為了解決這個問題,我們為 Claude Code 推出了沙箱技術。 沙箱技術:一個更安全、更自主的方法 沙箱技術創造了預先定義的邊界,Claude 可以在其中更自由地工作,而不需要為每個動作都請求許可。啟用沙箱後,您會收到大幅減少的權限提示,並獲得更高的安全性。 我們的沙箱方法建立在作業系統層級的功能之上,以啟用兩個邊界: 檔案系統隔離 :確保 Claude 只能存取或修改特定的目錄。這在防止被提示注入的 Claude 修改敏感的系統檔案方面尤為重要。 網路隔離 :確保 Claude 只能連接到經批准的伺服器。這可以防止被提示注入的 Claude 洩露敏感資訊或下載惡意軟體。 值得注意的是,有效的沙箱技術需要同時具備檔案系統和網路隔離。如果沒有網路隔離,一個被入侵的代理(agent)可能會竊取像 SSH 金鑰這樣的敏感檔案;如果...

Threads 成長趨勢完整分析:從全球現象到台灣奇蹟

Meta 於 2023 年 7 月推出的社群平台 Threads,在短短兩年多的時間裡創造了社群媒體史上最驚人的成長奇蹟。截至 2025 年第三季,Threads 已達到 4 億月活躍用戶 ,不僅成功挑戰 X(前 Twitter)的地位,更在台灣市場創下全球使用率第二高的驚人表現。這個被台灣網友親暱稱為「脆」的平台,其成功背後蘊含著深刻的市場洞察、技術創新,以及對社群互動本質的重新定義。 Threads 月活躍用戶成長趨勢圖 (2023-2025) 爆炸性成長軌跡:打破所有社群平台紀錄 史無前例的啟動速度 Threads 的成長速度完全顛覆了社群平台發展的既有認知。平台在上線僅 7 小時內就突破 1000 萬用戶 , 5 天內達到 1 億用戶 ,創下史上最快達到此里程碑的紀錄。相較之下,ChatGPT 需要 2 個月,TikTok 需要 9 個月,而 Instagram 則花了 2.5 年才達到相同用戶數。 這種爆炸性成長的關鍵在於 Threads 與 Instagram 的 深度整合 。擁有超過 20 億月活躍用戶的 Instagram 為 Threads 提供了現成的龐大用戶基礎,使用者可以一鍵導入 Instagram 的追蹤關係,大幅降低了平台轉換的門檻。 穩定成長階段的挑戰與復甦 儘管初期成長驚人,Threads 也經歷了典型的新平台「蜜月期結束」現象。在首月結束時,日活躍用戶數從高峰期的 4400 萬驟降至 800 萬,降幅達 82%。然而,Meta 執行長馬克·祖克柏早已預期這種下降,並將重點轉向 用戶留存和參與度提升 。 從 2024 年下半年開始,Threads 展現出強勁的復甦動能。第三季到第四季間,月活躍用戶增加了 5000 萬,隨後再增加 7500 萬,顯示出平台已建立穩定的成長基礎。[^8] 台灣市場:全球第二大使用國的成功密碼 驚人的市場滲透率 台灣在 Threads 全球版圖中佔據極其重要的地位。根據 Similarweb 數據,台灣的 Threads 流量佔全球總量的 14.22% ,僅次於美國的 18.67%,位居全球第二。更令人印象深刻的是,台灣用戶的 平均使用時間幾乎是其他國家的兩倍 ,成長率更達到 25.94%。 文化適應性與使用習慣 台灣 Threads 市場的成功源於多...

蘋果的越南豪賭:用一個「不存在的產品」,解開中美地緣政治的死結

最近許多新聞開始出來,Apple 將推出智慧家居產品系列 homepod 是其中一塊,同時有許多細節值得細細品味。 當所有人的目光還聚焦在iPhone產能如何「去中國化」的宏大敘事上時,一個反常識的細節卻被忽略了:蘋果選擇將其下一個全新的、可能顛覆智慧家庭市場的硬體類別——一個帶螢幕的家庭中樞設備,其誕生的第一聲啼哭,放在了越南。 這不是一次普通的產能「搬家」,而是蘋果歷史上的首次。過去數十年,從iPod到iPhone再到Vision Pro,蘋果的鐵律是在中國完成新產品從0到1的孵化,再利用其無可匹敵的供應鏈能力將其推向全球。而這次,蘋果掌舵者提姆・庫克(Tim Cook)卻選擇了一片全新的土壤,與老搭檔比亞迪一起,在越南為一個「未來之子」安家。 問題是,為什麼?為什麼要用一個承載著「下一個入口」期望的全新產品,去冒險挑戰一個尚未成熟的製造基地? 答案可能比我們想像的更為深刻。 蘋果的「越南賭局」,賭的不是一條產線的成敗,而是整個智慧家庭戰役的未來,以及在地緣政治的驚濤駭浪中,為下一個十年的帝國尋找一個安全的錨點。 雙重焦慮:失落的客廳與懸頂的達摩克利斯之劍 要理解庫克的這步險棋,必須先看懂蘋果正面臨的「雙重焦慮」。 第一重焦慮,來自於那片蘋果始終未能征服的領地——用戶的客廳。 在智慧型手機、手錶、耳機市場封王之後,蘋果在智慧家庭領域卻像一個迷路的巨人。儘管坐擁軟體核心HomeKit,但多年來,其硬體產品線卻始終羸弱。相比亞馬遜的Alexa生態和Google的Nest系列早已透過低價、開放的策略,將智慧音箱和螢幕變成了數億家庭的「類水電煤」基礎設施,蘋果的HomePod更像是一個曲高和寡的昂貴擺件。蘋果佔領了用戶的口袋和手腕,卻唯獨在「家」這個最重要的場景中,成了局外人。 第二重焦慮,則來自庫克一手打造的、那個曾經讓蘋果引以為傲,如今卻日益沉重的「中國枷鎖」。 中美貿易的持續緊張,讓蘋果這家全球市值最高的公司,前所未有地暴露在地緣政治的風險之下。川普時代揚言的額外關稅,以及針對中國供應鏈國家的延伸打擊,都像一把懸在蘋果頭上的達摩克利斯之劍。庫克的供應鏈哲學曾是效率和成本的極致體現,但現在, 當你的後花園(中國)風雨飄搖時,最明智的不是加固籬笆,而是在別處開闢一個全新的果園。 這兩大焦慮,一個關乎未來增長,一個關乎生死存亡...