tech 2026年5月11日 · 3 分鐘閱讀 · －次閱讀

Dexter：25k ⭐ 的自主金融研究 Agent，任務分解 + 自我驗證 + JSONL 稽核

TL;DR

問一個財務問題，Dexter 自動拆解成子任務、選工具執行（財報 API + 搜尋）、自我驗證直到結果夠充分，所有推理步驟記錄到 JSONL scratchpad。TypeScript + Bun，支援多個 LLM provider。

目錄

問一個問題：「分析 AAPL 最近三年的財務健康度」。傳統方式是你自己去抓財報、讀新聞、整理數字。Dexter 讓這件事變成：你丟問題進去，agent 自己跑完整個研究流程，最後給你結論。

25.2k ⭐、3.1k forks，由 virattt 開發，2026 年 5 月發佈 v2026.5.9。

Agent 執行架構

flowchart TD
  Q["使用者問題"] --> P["任務分解\nTask Planning"]
  P --> T1["Financial Datasets API\n財報 / 資產負債表 / 現金流"]
  P --> T2["Exa 網路搜尋\nTavily fallback"]
  T1 --> V["自我驗證\nSelf-Validation"]
  T2 --> V
  V -- "結果不足" --> P
  V -- "結果充分" --> R["輸出結論"]
  R --> Log[".dexter/scratchpad/\nJSONL 稽核記錄"]

Dexter 不是 RAG pipeline，也不是 LLM 加 search 的簡單組合。它的核心是一個計畫—執行—驗證的迴圈：先把問題拆成子任務，執行每個子任務取得資料，然後自我評估結果是否夠完整，不夠就繼續迭代。

幾個設計決策值得關注

Loop Detection 與執行步數上限

Autonomous agent 最容易出的問題是失控迴圈——agent 認為自己需要更多資料，不斷呼叫工具，最後 API 費用爆炸。Dexter 內建 loop detection 和最大執行步數限制，強制截停。這不是 nice-to-have，是讓 agent 在實際環境跑得起來的基本防線。

JSONL Scratchpad

所有工具呼叫、查詢參數、回傳結果、推理步驟都以 newline-delimited JSON 寫進 .dexter/scratchpad/。這讓你可以事後重建 agent 的完整決策鏈，知道它為什麼得出某個結論，也方便 debug 哪個步驟的結果出了問題。

LangSmith 評估框架

內建 eval runner，用 LLM-as-judge 方式評分——讓另一個 LLM 評估 Dexter 的答案是否正確。可以對全部測試問題跑，也可以抽樣。這讓你可以量化 agent 在不同 LLM provider 或 prompt 版本下的品質差異，而不只是靠人工感覺。

多 Provider 支援

預設 OpenAI，但可以替換成 Anthropic Claude、Google Gemini、xAI，或用 Ollama 在本地執行。provider 的切換是設定層面的，不需要改 agent 邏輯。這對想要控制成本或測試不同模型效果的人來說很實用。

WhatsApp 整合

把手機連到 gateway，直接用 WhatsApp 發問，不需要開終端機。對於習慣手機操作的使用情境，這個整合降低了使用門檻。

技術棧

TypeScript（codebase 99.4%）、Bun runtime（v1.0+）。財務數據來自 Financial Datasets API（機構級資料），網路搜尋用 Exa API，Tavily 作為 fallback。

使用前要知道的事

Dexter 明確標注：輸出是教育和資訊用途，不是投資建議，結果可能不準確或過時。財務數據的正確性取決於上游 API，LLM 的推理也可能出錯。

它適合探索性的研究問題、理解財報結構、學習 autonomous agent 的設計模式。不適合直接用於交易決策。

參考資料

← 上一篇 OpenStock：11k ⭐ 的開源股市儀表板，AGPL 授權、可自架、永久免費

下一篇 → 越懂事越委屈？解析「情緒融合」如何讓你失去自我

相關標籤

#ai #llm #fintech #open-source

相關文章

tech

2026年5月23日

DeepSeek V4 發布：1.6 兆參數開源模型挑戰 GPT-5，還跑在華為晶片上

DeepSeek V4 是一個 1.6 兆參數（49B 活躍）的 MoE 開源模型，100 萬 token 上下文，在部分基準測試上超越 GPT-5.2，且是首款針對華為 Ascend 晶片最佳化的 DeepSeek 模型。

#ai #deepseek #llm #open-source #china-tech

tech

2026年6月6日

AI 如何重塑人的思考方式：工具之外的認知轉變

AI 工具改變的不只是你做事的速度，而是你思考問題的方式——從「怎麼做」轉向「做什麼」和「判斷對不對」，這個轉變對工程師的長期影響值得認真思考。

#ai #cognitive-change #llm #productivity #thinking #knowledge-work

tech

2026年5月28日

AI Agent 費用爆炸怎麼辦？選對模型與工具的實戰指南

AI agent 的帳單暴增通常來自三個地方：選了比任務需求更強的模型、沒控制 tool call 的深度、以及 context window 浪費。正確的成本控制策略是依任務複雜度選模型，不是全部用最強的。

#ai #llm #cost-optimization #agent #engineering