目錄
問一個問題:「分析 AAPL 最近三年的財務健康度」。傳統方式是你自己去抓財報、讀新聞、整理數字。Dexter 讓這件事變成:你丟問題進去,agent 自己跑完整個研究流程,最後給你結論。
25.2k ⭐、3.1k forks,由 virattt 開發,2026 年 5 月發佈 v2026.5.9。
Agent 執行架構
flowchart TD
Q["使用者問題"] --> P["任務分解\nTask Planning"]
P --> T1["Financial Datasets API\n財報 / 資產負債表 / 現金流"]
P --> T2["Exa 網路搜尋\nTavily fallback"]
T1 --> V["自我驗證\nSelf-Validation"]
T2 --> V
V -- "結果不足" --> P
V -- "結果充分" --> R["輸出結論"]
R --> Log[".dexter/scratchpad/\nJSONL 稽核記錄"]
Dexter 不是 RAG pipeline,也不是 LLM 加 search 的簡單組合。它的核心是一個計畫—執行—驗證的迴圈:先把問題拆成子任務,執行每個子任務取得資料,然後自我評估結果是否夠完整,不夠就繼續迭代。
幾個設計決策值得關注
Loop Detection 與執行步數上限
Autonomous agent 最容易出的問題是失控迴圈——agent 認為自己需要更多資料,不斷呼叫工具,最後 API 費用爆炸。Dexter 內建 loop detection 和最大執行步數限制,強制截停。這不是 nice-to-have,是讓 agent 在實際環境跑得起來的基本防線。
JSONL Scratchpad
所有工具呼叫、查詢參數、回傳結果、推理步驟都以 newline-delimited JSON 寫進 .dexter/scratchpad/。這讓你可以事後重建 agent 的完整決策鏈,知道它為什麼得出某個結論,也方便 debug 哪個步驟的結果出了問題。
LangSmith 評估框架
內建 eval runner,用 LLM-as-judge 方式評分——讓另一個 LLM 評估 Dexter 的答案是否正確。可以對全部測試問題跑,也可以抽樣。這讓你可以量化 agent 在不同 LLM provider 或 prompt 版本下的品質差異,而不只是靠人工感覺。
多 Provider 支援
預設 OpenAI,但可以替換成 Anthropic Claude、Google Gemini、xAI,或用 Ollama 在本地執行。provider 的切換是設定層面的,不需要改 agent 邏輯。這對想要控制成本或測試不同模型效果的人來說很實用。
WhatsApp 整合
把手機連到 gateway,直接用 WhatsApp 發問,不需要開終端機。對於習慣手機操作的使用情境,這個整合降低了使用門檻。
技術棧
TypeScript(codebase 99.4%)、Bun runtime(v1.0+)。財務數據來自 Financial Datasets API(機構級資料),網路搜尋用 Exa API,Tavily 作為 fallback。
使用前要知道的事
Dexter 明確標注:輸出是教育和資訊用途,不是投資建議,結果可能不準確或過時。財務數據的正確性取決於上游 API,LLM 的推理也可能出錯。
它適合探索性的研究問題、理解財報結構、學習 autonomous agent 的設計模式。不適合直接用於交易決策。
參考資料
相關標籤
相關文章
DeepSeek V4 發布:1.6 兆參數開源模型挑戰 GPT-5,還跑在華為晶片上
DeepSeek V4 是一個 1.6 兆參數(49B 活躍)的 MoE 開源模型,100 萬 token 上下文,在部分基準測試上超越 GPT-5.2,且是首款針對華為 Ascend 晶片最佳化的 DeepSeek 模型。
AI 如何重塑人的思考方式:工具之外的認知轉變
AI 工具改變的不只是你做事的速度,而是你思考問題的方式——從「怎麼做」轉向「做什麼」和「判斷對不對」,這個轉變對工程師的長期影響值得認真思考。
AI Agent 費用爆炸怎麼辦?選對模型與工具的實戰指南
AI agent 的帳單暴增通常來自三個地方:選了比任務需求更強的模型、沒控制 tool call 的深度、以及 context window 浪費。正確的成本控制策略是依任務複雜度選模型,不是全部用最強的。