Fetch Tool 设计方案

1. 需求概述

为 LLM Agent 设计一个 fetch 工具，功能包括：

方案	优点	缺点
A. Jina AI Reader API	效果好，支持 JS 渲染	需要 API Key，依赖外部服务
B. go-readability 自实现	无需 API Key，完全离线，可定制	无法处理 JS 渲染的页面

采用方案 B（自实现），原因：

库	用途
`github.com/go-shiori/go-readability`	提取网页正文（ Mozilla Readability Go 移植）
`github.com/tiktoken-go/tokenizer`	Token 计数（纯 Go 实现，无 CGO 依赖）

type FetchTool struct {
    httpClient *http.Client
    maxSize    int64 // 最大响应大小 (10MB)
}

参数	类型	必填	默认值	说明
url	string	是	-	要获取的 URL
max_tokens	number	否	4096	最大输出 token 数（max: 30000）

// tools/interface.go DefaultRegistry()
r.RegisterCore(NewFetchTool())

协议检查：仅允许 http:// 和 https://
内网IP检查：拒绝以下 IP 范围：
- 127.0.0.0/8 (loopback)
- 10.0.0.0/8
- 172.16.0.0/12
- 192.168.0.0/16
- 169.254.0.0/16 (link-local)
- 0.0.0.0/8
域名检查：拒绝 localhost、localhost.localdomain

# {页面标题}

**URL:** {页面URL}

---

{正文内容}

---

*已截取 {实际token数} / {限制token数} tokens*

如果被截断：

# {页面标题}

**URL:** {页面URL}

---

{前文内容}...

---

*⚠️ 内容已截断（已截取 {实际} / {限制} tokens）*