kevinclaw 智能對話系統 — 系統版本演進與變更歷史手冊
最後更新:2026-06-21
編寫單位:VER12/13 研發小組
文檔狀態:✅ 生產就緒
本文件詳細記錄了 kevinclaw 智能對話系統自啟動以來的核心版本演進、重要里程碑,以及近期基於 Git Commit 歷史的具體變更記錄。本手冊將作為版本管理與維護的唯一權威指南。
📅 版本演進里程碑與重大變革
| 版本 | 日期 | 核心功能變更 | 架構變革說明 |
|---|---|---|---|
| v13.5 (當前) | 2026-06-21 | ClawHub 技能目錄與 AI 動態驅動 | 實作 GET /admin/api/clawhub/installed 與 POST /admin/api/clawhub/uninstall API。於 conversation_routes.py 實作動態 Prompt 注入,指導 AI Agent 呼叫 terminal_execution 執行本機技能。 |
| v13.2 | 2026-06-21 | 雙應用商店與金鑰限流防護 | 實作 MCP 伺服器與 ClawHub 技能商店介面,支援 explore 與 search;加入 Gemini Provider API 的 rate limit 自主限流器。 |
| v13.0 | 2026-06-20 | 多 AI 供應商整合 (Phase 5) | 全面改為 services/providers/ 插件化驅動架構,金鑰對稱加密儲存於資料庫,提供 /admin/providers Web 管理面板。 |
| v12.0 | 2026-06-19 | 智慧 MCP 協定相容性優化 | 解決 NDJSON 協定超時問題(相容 LSP 與 NDJSON),增加 Filesystem 多目錄支援,引入 Smart MCP Reload 機制防止會話中斷。 |
| v11.0 | 2026-06-18 | 對話定時排程系統 (Scheduler) | 實作以對話為中心的背景排程(Snapshot/Follow Latest 雙模式),背景背景線程定時重跑,並支援執行歷史日誌管理。 |
| v10.0 | 2026-06-15 | Telegram MCP 深度優化 | 解決 Telegram 4096 字元發送上限(自動語意切片),實作發送狀態實體送達校驗。防範 AI 在 Telegram 操作中的幻覺與越權。 |
| v9.0 | 2026-06-12 | 瀏覽器 (Puppeteer) 與 Terminal 執行 | 引入唯讀/互動雙瀏覽器模式,新增 Terminal 執行工具(沙箱 Sandbox / 完全控制 Full 雙模式)。 |
| v8.0 | 2026-06-08 | 基礎 MCP 協定與 ERP 多庫查詢 | 引入 Model Context Protocol (MCP) 架構,整合初版 Telegram/Filesystem MCP,支援 MSSQL 跨庫多別名查詢與自動 Schema 探索。 |
| v1.0 | 2025-09-06 | 初版發布:帳號權限管理系統 | 奠定 SQLite auth.db、RBAC 角色權限矩陣、Session 管理與審計日誌基礎。 |
🌱 早期系統開發歷程 (2025-07 ~ 2026-06)
本章節收錄自系統立項以來的早期歷史開發軌跡與每日里程碑(自原始技術文件遷移):
1. 起源(2025-07-25 ~ 2025-07-30):Flask 基礎版
- 2025-07-25:基礎 Web 介面與對話功能上線(Flask)。
- 2025-07-26:完成聊天、網頁搜尋、清除對話核心功能。
- 2025-07-27:文件上傳與 AI 解析、MSSQL 首次整合。
- 2025-07-28:Ollama 本地模型支援,MSSQL 多輪對話穩定。
- 2025-07-29:AI 角色(Role ID)帶入 SQL 分析功能。
- 2025-07-30:前端版面整理,檔案上傳排版修復。
2. V9 風格重整(2025-07-31 ~ 2025-08-02):前端現代化
- 2025-07-31:全新 VER9 介面風格,手機 RWD 支援,側邊欄選單修復。
- 2025-08-02:集中式 Render 架構(
message_renderer.py),Markdown 串流緩衝優化,模型串流/非串流可維護切換機制。
3. AutoSQL 與自然語言查詢(2025-08-04 ~ 2025-08-09)
- 2025-08-04:自然語言包裝 SQL 送 AI 分析,
max_results由config.ini控制。 - 2025-08-05:AutoSQL 多輪對話記憶機制完成,Ollama 支援。
- 2025-08-06:AutoSQL 嚴格觸發條件、網頁搜尋結果自動超連結。
- 2025-08-07:AutoSQL 三大模組(IT/SO/MO)全通過測試,多輪對話穩定。
- 2025-08-08:製造工單(WO)查詢加入,全後端 LOG 機制。
- 2025-08-09:MES AutoSQL 欄位精確化,IT 本週/上週/今日報告修復。
4. 知識庫(KB RAG)建置(2025-08-20 ~ 2025-09-05)
- 2025-08-20:KB 後端上線,RAG 前端整合,
/kb獨立分頁。 - 2025-08-22:KB 基本功能:上傳、索引、搜尋確認 OK。
- 2025-08-24:遷移至 ChromaDB,上傳+搜尋流程穩定。
- 2025-08-25:推理模型思考過程過濾機制,KB 混合語義+BM25 檢索。
- 2025-08-26:KB 串流回應整合,AI 思考框顯示截圖修復。
- 2025-08-27:KB 分區管理(7 個分區:IT/HR/Finance/Legal/Marketing 等),文件拖曳上傳。
5. 認證授權系統(2025-09-06):企業多用戶管理
- 2025-09-06:auth_plugin 上線:本地用戶認證、群組/角色管理、管理後台。
- 2025-09-06:權限分層:BASIC / PRIVILEGED / ADMIN 群組,KB 納入群組管控。
- 2025-09-06:審計日誌時區修正,管理後台登出功能。
6. 推理模型與語音(2025-09-07 ~ 2025-10-06)
- 2025-09-07:DeepSeek R1T/V3.1 多模型 API KEY 整合。
- 2025-10-02:段落排版多次迭代優化,DeepSeek V3.1 加入。
- 2025-10-04:語音輸入(ASR)上線(Web Speech API,需 HTTPS)。
- 2025-10-05:TTS 語音朗讀功能穩定(Web Speech TTS)。
- 2025-10-06:推理模型思考輸出控制可配置化,語音選單折疊設計。
7. 多模型 Fallback 與對話串(2025-12 ~ 2026-02)
- 2025-12-15:網頁搜尋引擎 V6(Bing 優先)。
- 2026-02-12:Z.AI 新模型整合,思考型/串流型切換。
- 2026-02-14:台灣法律專家角色新增。
8. AI Agent 核心架構(2026-06-07 ~ 2026-06-14)
- 2026-06-07:串流排版多次修正,換用 OWL-Alpha 模型。
- 2026-06-08:對話串管理(多串、封存、刪除),SSE 串流穩定。
- 2026-06-09:歷史輪詢機制修正,AutoSQL/MCP 路由多輪記憶。
- 2026-06-11:文件上傳多輪對話修正,網頁搜尋摘要存入對話串。
- 2026-06-12:歷史對話記憶恢復,sub-chat 記憶修復。
- 2026-06-13:Fallback Model(429 限流自動切換),KaTeX 數學公式渲染。
- 2026-06-14:第一版 AI Agent(Tool Call 架構)上線,主模型: OWL-Alpha。
9. AI Agent 工具擴充(2026-06-14 ~ 2026-06-16)
- 2026-06-14:Agent 工具管理框架(
AgentToolManager鬆散耦合架構)。 - 2026-06-15:多 DB 智能查詢(3個MSSQL別名並行),跨回合會話記憶。
- 2026-06-15:Brave Search API 整合進 Agent。
- 2026-06-15:新增對話中止按鈕,個別問答刪除按鈕。
- 2026-06-16:Puppeteer Headless Browser 工具上線(AI 控制瀏覽器)。
- 2026-06-16:多 DB 別名查詢規則衝突修復,記憶架構強化。
10. Terminal、Puppeteer Full Mode、MCP(2026-06-17 ~ 2026-06-19)
- 2026-06-17:Terminal 執行工具上線(Sandbox/Full 兩模式)。
- 2026-06-17:Puppeteer Full Mode(互動式瀏覽器完整控制)上線。
- 2026-06-17:OpenRouter 識別名稱改為
kevinclaw(config.ini控制)。 - 2026-06-18:MCP Server 插件架構導入(
agent_plugins/自動掃描)。 - 2026-06-18:Telegram MCP Server 整合(7個工具:收發訊息、查詢對話等)。
- 2026-06-18:MCP 權限系統(
MCP_ACCESS+TELEGRAM_SEND),審計日誌。
🛠️ 基於 Git Commit 的詳細變更歷史
以下是系統進入 AI Agent 深度迭代及近期重構擴展階段以來的具體 Git 提交歷史:
1. ClawHub 技能動態驅動與目錄 (v13.5)
c395049c51– fixed AI prompt to accept new skill- 在
routes/conversation_routes.py的對話處理程式中,新增動態掃描.agents/skills下所有SKILL.md指令本文並注入至系統提示詞的機制。 - 明確警告 AI Agent 禁止直接呼叫技能同名函數,引導其使用
terminal_execution呼叫執行指令。
- 在
21e2028e45– adding skill catagory that already installed in admin interface- 新增已安裝 ClawHub 技能目錄 Table 於設定頁面,展示 Slug、名稱、說明、首頁連結;實作安全防禦路徑遍歷的卸載 API。
2. 雙商店與 AI 限流 (v13.2)
f24a6fee54– adding mcp market and clawhub mcp market function- 於後台 settings 頁面整合 MCP 伺服器商店與 ClawHub 雙標籤頁商店,支援搜尋防抖(Debounce)與一鍵點選安裝。
894977a358– adding rate limit function on gemini provider- 實作針對 Google Gemini 直連通道的 Token/Request 自主限流保護,以滑動窗口機制避免頻繁觸發 429 錯誤。
3. PaddleOCR 圖片文件辨識服務與 MCP
0b8ce64514– fixed ocr_server cannot start- 修正 OCR MCP 服務啟動失敗問題。
50a7242fb2– debug mcp paddle-ocr cannot start service, adding cloud paddleocr as main choice- 整合雲端版面解析 API 與本地離線備援引擎;硬編碼
PADDLE_PDX_CACHE_HOME緩存路徑至 E 槽工作區以防 C 槽損壞或檔案鎖定衝突。
- 整合雲端版面解析 API 與本地離線備援引擎;硬編碼
4944975d2b– adding paddle-ocr MCP- 新增
paddle-ocrMCP 伺服器,提供文字提取、表格轉換為 Markdown、排版解析、Office 轉檔功能。
- 新增
4. 多 AI 供應商與 UI 修復 (v13.0)
a3c4f5a07c– fixed mcp server multi-thread conflict issue- 解決 MCP Server 列表獲取時,多個背景背景線程競爭讀取
config.ini的衝突問題。
- 解決 MCP Server 列表獲取時,多個背景背景線程競爭讀取
51e1c1551b&d269c2d21a– fixed google gemini switch mode / provider switch issues- 修復前台切換 AI 供應商時有時卡在 OpenRouter 的 Bug,強化 Gemini 直連驅動稳定性。
9b8280612b&45623e6410– 漢堡選單修復- 解決手機版漢堡按鈕遮擋網站標題、選單過長無法下滑滾動的 UI 問題。
749ce0ca34– change webpage headline to kevinclaw v9.0- 前端標題正式更名更版。
62a24320dc– 增加 AI PROVIDER 選項,並初步測得 GEMINI OK- 奠定動態載入 AI 供應商與直連 Google Gemini 的基礎。
060e61c75c– after new app.py walkthrough issues collections- 收集重構後的系統相依性,產出整合診斷與清理指令。
e82f614d88– history conversation could change headline topic, and fixed the mssql query saved back to history conversation no headline issue- 修復歷史會話標題修改同步問題與 MSSQL 查詢結果儲存時標題遺失的 Bug。
6b1c487e4f– fixed admin console no reflection when page down- 修正管理員控制台分頁向下滾動時未載入資料的渲染 Bug。
56845607d6– fixed admin interface cound not show the homepage- 修復 Flask 路由優先順序衝突導致後台首頁無法開啟的問題。
5. 主程式瘦身與重構 (Slimming Project)
135dc47d8d– making mcp server reload function much more intellegent- 重構
reload_config()判定邏輯,僅重新啟動已修改/刪除的 MCP 進程,不中斷運行中的 Telegram/Filesystem 進程。
- 重構
67cc686731– re-build app.py cannot start service already fixed- 解決瘦身重構過程中因 import 循環依賴導致服務無法啟動的問題。
bdb05b024c– 第四階段後無法開啟服務,先COMMIT- 記錄重構中途的中斷點,確保版本演進軌跡完整。
1285e426e0&75382a59ef&04ca336cbd&5aebee486e– app.py 主檔瘦身計劃 Phase I~IV- 將數千行的單體
app.py大幅拆分、解耦:將對話路由、角色權限、檔案處理、資料庫連線移入/routes,將背景排程移入/services/scheduler_service.py。
- 將數千行的單體
da554ad3f5– fixed 首頁無法打開在PHASE I後- 修復 Slimming 重構首階段的路由導向 Bug。
eaf9e4720c– 後台加入 AI 提示詞角色管理界面- 提供可視化後台以新增/編輯角色 (Roles) 的系統提示詞與群組權限關係。
6. 排程與 Telegram MCP 優化 (v11.0 / v10.0)
3b7dad520c– 修正排程任務與各路由間 TIMEOUT 配置不一致等問題- 校準背景 Runner 的 Request Timeout。
dc62109644– 發現執行一次的排程功能造成異常,無法手動執行排程- 修復一次性排程的單次觸發 Bug。
f406373403– 修正刪對話串時同時刪排程,排程日誌清理功能- 提供生命週期連動安全保護,增加前台對話列表的排程狀態
⏰表記與 Schedule Key 浮動懸停提示。
- 提供生命週期連動安全保護,增加前台對話列表的排程狀態
917ecd84f0– 背景排程自動跑此時補好- 補足背景任務自動執行及週期輪詢狀態的邏輯。
68dff765f4– Conversation-Centric Scheduler Implementation Phase I – fixed管理界面排程任務不能秀出,加ICON在前端對話串- 新增前端對話列表與背景排程的整合視覺提示。
2f21050459– Conversation-Centric Scheduler phase I implementation- 正式實作將一般對話轉換為定時排程的控制後台與背景背景線程 Runner。
f74130e5fe&e465323360– 修正 TELEGRAM MCP SENDMESSAGE 超限分批派送- 解決 Telegram 4096 字元發送上限,實作自動語意切片,防止 Markdown 程式碼語法割裂。
028e85883f&44a022f3c2– 修正 Telegram 訊息送達回執校驗- 校驗 Telegram API 送信的反饋,防止虛報發送成功。
c103352746– MCP Preset integrations (filesystem, fetch, telegram)- 預設提供 Filesystem、Fetch、Telegram 三大常用 MCP 原生預設範本。
45e75fe1e8&b14a3a4cb7– MCP Adaptor for AI Agent tool calls- 實作與標準 MCP Server 連接的 stdio/LSP/NDJSON 配接器,無縫串聯 Agent Tool 與外部 MCP。
7. 前端與 Tool Call 雜項優化
f0865e02b8&97f48d231a– 修正 TOOLCALL 執行時訊息一閃而逝的問題- 優化前端對話串流渲染,確保 Tool Call 的思考與呼叫過程可見且停留足夠時間。
6b29df3ca4– 修正 TELEGRAM MCP 前後端使之更嚴謹,先查核聊天室ID才作業, 並嚴格禁止幻覺編造信息- 加強 Telegram MCP 的安全性,限制權限範圍並阻止 AI 虛構回應。
73a960429c– fixed the traceback error code showed to frondend web page, telegram mcp server- 隱藏後端詳細 Traceback 報錯,避免敏感路徑或資料洩漏,提升安全性。
8588769c46– add web-search-mcp 8020 into 8030 startup batch file and rebuild telegram mcp server user logon interface- 重構 Telegram MCP 使用者登入介面並校正啟動指令。
d7c9aee296&1223595aa4– 修正排版小亂碼- 處理特殊字元或 BOM 引發的前端字元顯示問題。
14479d386a– 補歷史對話串叫回時前端未把後端存入的PROFILE, AI AGENT, ROLE ID等帶回- 確保切換歷史對話串時,底層的 AI 角色 Profile 與 Agent 設定能精確復原。
文件維護歷史歸檔 — kevinclaw 智能對話系統研發小組
