目錄
LLM Assistant 是一個 arXiv 學術論文知識平台,每日自動爬取論文並建立向量索引,使用者可用中英文提問,系統以混合搜尋 + 文件重排後由 Ollama LLM 回答,並支援 Email 訂閱與 Grafana 監控。
背景
研究人員需追蹤大量 arXiv 論文,手動搜尋效率低且缺乏雙語 Q&A 支援。這個專案目標是打造一條全自動的學術知識管線,讓使用者透過自然語言查詢特定領域的最新研究,並透過 Email 訂閱定期接收摘要。
挑戰
需在同一 Docker Compose 環境中協調多個異質服務:Prefect 定時爬蟲、Qdrant 向量資料庫、Ollama LLM 推理、Langfuse prompt 追蹤與 Prometheus 監控,同時讓混合搜尋(dense + sparse)在重排後維持答案品質,並支援中英雙語 query rewriting。
解法
採用微服務架構,各服務職責單一,以 Docker Compose 統一部署:
- 以 Prefect 3 建置每日 arXiv 論文爬取排程,儲存 metadata 與 PDF 至 MinIO
- 以 Qdrant 建置向量資料庫,實作 hybrid search(dense + sparse)與文件重排(re-ranking)
- 以 FastAPI 建置 API Gateway,整合 RAG 流程、query rewriting 與雙語 Q&A
- 以 Ollama 驅動本地 LLM 推理,搭配 Langfuse 追蹤 prompt 品質
- 以 Prometheus + Grafana 建置系統監控看板,React + Gradio 提供雙前端介面
架構圖
flowchart LR
subgraph Data[DataSource]
Arxiv
end
Arxiv --> Ingest
subgraph Ingest[Data Ingestion Pipeline]
Scheduler[Daily Schedule]
IngestFlow[Fetch + Parse + Chunk + Embed + Index]
end
subgraph API[API Layer]
FastAPI[Client API for auth]
NoteServer[RAG Service]
end
Client --> FastAPI
FastAPI --> NoteServer
subgraph Retrieve[Retrieve pipeline]
Search[Hybrid Search] --> Rerank
Rerank --> prompt
end
subgraph LLM[LLM Engines]
Ollama[Ollama]
end
subgraph Storage[Storage]
MinIO[("MinIO : PDFs")]
PostgreSQL[("PostgreSQL : Metadata")]
Qdrant[("Qdrant : Vectors")]
end
NoteServer --> Retrieve
Storage --> Retrieve
prompt --> LLM
LLM --> API
Scheduler --> IngestFlow
IngestFlow --> Storage
subgraph Subscription[Email Subscription Pipeline]
SubSched[Daily Schedule]
SubFlow[Filter → Fetch → Summarize → Send]
SubSched --> SubFlow
end
Storage --> Subscription
流程圖
flowchart TD
A(["使用者輸入問題"]) --> B[Query Rewriting 中英轉換]
B --> C[Qdrant Hybrid Search\ndense + sparse]
C --> D[文件重排 Re-ranking]
D --> E[Ollama LLM 生成答案]
E --> F[Langfuse 記錄 prompt trace]
F --> G(["回傳雙語答案"])
H(["Prefect 每日排程"]) --> I[爬取 arXiv 論文]
I --> J[Chunk + Embed]
J --> K[寫入 Qdrant + MinIO]
成果
完成端到端 RAG 學術知識平台,支援每日自動論文更新、中英雙語 Q&A 與 Email 訂閱通知,Grafana + Langfuse 提供完整可觀測性,React 與 Gradio 雙介面可同時運行。
相關標籤
相關文章
Live English Tutor
即時語音 AI 英文家教:WebRTC 麥克風互動 + Gemini 即時糾錯 + 課後中文報告。
Stock MLOps
端到端台美股 ML 系統:MLflow + Prefect + Evidently + CI/CD,從訓練到部署全程可追蹤。
STT-TTS Unified
Edge TTS(322 語音)+ 本地 Whisper 的一站式語音平台,完全免費無需 API Key。