mirror of
https://github.com/simstudioai/sim.git
synced 2026-02-12 07:24:55 -05:00
* improvement(docs): updated script to copy over icons, cleanup unnecessary pages * updated script with auto-icon generation * ignore translations, only icons changed * updated images * updated i18n.lock * updated images
150 lines
7.2 KiB
Plaintext
150 lines
7.2 KiB
Plaintext
---
|
||
title: Tavily
|
||
description: 搜索和提取信息
|
||
---
|
||
|
||
import { BlockInfoCard } from "@/components/ui/block-info-card"
|
||
|
||
<BlockInfoCard
|
||
type="tavily"
|
||
color="#0066FF"
|
||
/>
|
||
|
||
{/* MANUAL-CONTENT-START:intro */}
|
||
[Tavily](https://www.tavily.com/) 是一款专为 LLM 应用设计的 AI 驱动搜索 API。它提供可靠的实时信息检索功能,并针对 AI 使用场景优化了功能,包括语义搜索、内容提取和结构化数据检索。
|
||
|
||
使用 Tavily,您可以:
|
||
|
||
- **执行上下文搜索**:基于语义理解获取相关结果,而不仅仅是关键词匹配
|
||
- **提取结构化内容**:以干净、可用的格式从网页中提取特定信息
|
||
- **访问实时信息**:从整个网络中检索最新数据
|
||
- **同时处理多个 URL**:在单次请求中从多个网页提取内容
|
||
- **接收 AI 优化结果**:获取专为 AI 系统使用而格式化的搜索结果
|
||
|
||
在 Sim 中,Tavily 集成使您的代理能够在其工作流程中搜索网络并提取信息。这支持需要从互联网获取最新信息的复杂自动化场景。您的代理可以制定搜索查询,检索相关结果,并从特定网页中提取内容,以支持其决策过程。此集成弥合了您的工作流程自动化与网络上广泛知识之间的差距,使您的代理无需人工干预即可访问实时信息。通过将 Sim 与 Tavily 连接,您可以创建能够跟上最新信息的代理,提供更准确的响应,并为用户带来更多价值。
|
||
{/* MANUAL-CONTENT-END */}
|
||
|
||
## 使用说明
|
||
|
||
将 Tavily 集成到工作流程中。可以搜索网页并从特定 URL 提取内容。需要 API 密钥。
|
||
|
||
## 工具
|
||
|
||
### `tavily_search`
|
||
|
||
使用 Tavily 执行由 AI 驱动的网页搜索
|
||
|
||
#### 输入
|
||
|
||
| 参数 | 类型 | 必需 | 描述 |
|
||
| --------- | ---- | -------- | ----------- |
|
||
| `query` | 字符串 | 是 | 要执行的搜索查询 |
|
||
| `max_results` | 数字 | 否 | 最大结果数量 \(1-20\) |
|
||
| `topic` | 字符串 | 否 | 类别类型:general、news 或 finance \(默认:general\) |
|
||
| `search_depth` | 字符串 | 否 | 搜索范围:basic \(1 积分\) 或 advanced \(2 积分\) \(默认:basic\) |
|
||
| `include_answer` | 字符串 | 否 | LLM 生成的响应:true/basic 表示快速回答,advanced 表示详细回答 |
|
||
| `include_raw_content` | 字符串 | 否 | 解析的 HTML 内容:true/markdown 或文本格式 |
|
||
| `include_images` | 布尔值 | 否 | 包括图片搜索结果 |
|
||
| `include_image_descriptions` | 布尔值 | 否 | 为图片添加描述性文本 |
|
||
| `include_favicon` | 布尔值 | 否 | 包括 favicon URL |
|
||
| `chunks_per_source` | 数字 | 否 | 每个来源的最大相关块数 \(1-3,默认:3\) |
|
||
| `time_range` | 字符串 | 否 | 按最新时间筛选:day/d、week/w、month/m、year/y |
|
||
| `start_date` | 字符串 | 否 | 最早发布日期 \(YYYY-MM-DD 格式\) |
|
||
| `end_date` | 字符串 | 否 | 最晚发布日期 \(YYYY-MM-DD 格式\) |
|
||
| `include_domains` | 字符串 | 否 | 逗号分隔的白名单域名列表 \(最多 300 个\) |
|
||
| `exclude_domains` | 字符串 | 否 | 逗号分隔的黑名单域名列表 \(最多 150 个\) |
|
||
| `country` | 字符串 | 否 | 提升指定国家的结果 \(仅限 general 主题\) |
|
||
| `auto_parameters` | 布尔值 | 否 | 根据查询意图自动配置参数 |
|
||
| `apiKey` | 字符串 | 是 | Tavily API 密钥 |
|
||
|
||
#### 输出
|
||
|
||
| 参数 | 类型 | 描述 |
|
||
| --------- | ---- | ----------- |
|
||
| `query` | 字符串 | 已执行的搜索查询 |
|
||
| `results` | 数组 | 工具输出的结果 |
|
||
|
||
### `tavily_extract`
|
||
|
||
使用 Tavily 同时从多个网页提取原始内容
|
||
|
||
#### 输入
|
||
|
||
| 参数 | 类型 | 必需 | 描述 |
|
||
| --------- | ---- | -------- | ----------- |
|
||
| `urls` | 字符串 | 是 | 要提取内容的 URL 或 URL 数组 |
|
||
| `extract_depth` | 字符串 | 否 | 提取深度 \(basic=1 积分/5 个 URL,advanced=2 积分/5 个 URL\) |
|
||
| `format` | 字符串 | 否 | 输出格式:markdown 或 text \(默认:markdown\) |
|
||
| `include_images` | 布尔值 | 否 | 在提取输出中包含图像 |
|
||
| `include_favicon` | 布尔值 | 否 | 为每个结果添加 favicon URL |
|
||
| `apiKey` | 字符串 | 是 | Tavily API 密钥 |
|
||
|
||
#### 输出
|
||
|
||
| 参数 | 类型 | 描述 |
|
||
| --------- | ---- | ----------- |
|
||
| `results` | 数组 | 已提取的 URL |
|
||
|
||
### `tavily_crawl`
|
||
|
||
使用 Tavily 系统化地爬取并提取网站内容
|
||
|
||
#### 输入
|
||
|
||
| 参数 | 类型 | 必需 | 描述 |
|
||
| --------- | ---- | -------- | ----------- |
|
||
| `url` | 字符串 | 是 | 开始爬取的根 URL |
|
||
| `instructions` | 字符串 | 否 | 爬取器的自然语言指令 \(每 10 页消耗 2 积分\) |
|
||
| `max_depth` | 数字 | 否 | 从基础 URL 探索的深度 \(1-5,默认:1\) |
|
||
| `max_breadth` | 数字 | 否 | 每个页面级别跟随的链接数量 \(≥1,默认:20\) |
|
||
| `limit` | 数字 | 否 | 停止前处理的总链接数量 \(≥1,默认:50\) |
|
||
| `select_paths` | 字符串 | 否 | 用逗号分隔的正则表达式模式,用于包含特定的 URL 路径 \(例如,/docs/.*\) |
|
||
| `select_domains` | 字符串 | 否 | 用逗号分隔的正则表达式模式,用于限制爬取特定域名 |
|
||
| `exclude_paths` | 字符串 | 否 | 用逗号分隔的正则表达式模式,用于跳过特定的 URL 路径 |
|
||
| `exclude_domains` | 字符串 | 否 | 用逗号分隔的正则表达式模式,用于屏蔽特定域名 |
|
||
| `allow_external` | 布尔值 | 否 | 在结果中包含外部域名链接 \(默认:true\) |
|
||
| `include_images` | 布尔值 | 否 | 在爬取输出中包含图像 |
|
||
| `extract_depth` | 字符串 | 否 | 提取深度:basic \(1 积分/5 页\) 或 advanced \(2 积分/5 页\) |
|
||
| `format` | 字符串 | 否 | 输出格式:markdown 或 text \(默认:markdown\) |
|
||
| `include_favicon` | 布尔值 | 否 | 为每个结果添加 favicon URL |
|
||
| `apiKey` | 字符串 | 是 | Tavily API 密钥 |
|
||
|
||
#### 输出
|
||
|
||
| 参数 | 类型 | 描述 |
|
||
| --------- | ---- | ----------- |
|
||
| `base_url` | 字符串 | 被爬取的基础 URL |
|
||
| `results` | 数组 | 被爬取的页面 URL |
|
||
|
||
### `tavily_map`
|
||
|
||
使用 Tavily 探索并可视化网站结构
|
||
|
||
#### 输入
|
||
|
||
| 参数 | 类型 | 必需 | 描述 |
|
||
| --------- | ---- | -------- | ----------- |
|
||
| `url` | 字符串 | 是 | 开始映射的根 URL |
|
||
| `instructions` | 字符串 | 否 | 用于映射行为的自然语言指导 \(每 10 页消耗 2 积分\) |
|
||
| `max_depth` | 数字 | 否 | 从基础 URL 探索的深度 \(1-5,默认值:1\) |
|
||
| `max_breadth` | 数字 | 否 | 每级要跟随的链接数量 \(默认值:20\) |
|
||
| `limit` | 数字 | 否 | 要处理的总链接数量 \(默认值:50\) |
|
||
| `select_paths` | 字符串 | 否 | 用于 URL 路径过滤的逗号分隔正则表达式模式 \(例如:/docs/.*\) |
|
||
| `select_domains` | 字符串 | 否 | 限制映射到特定域的逗号分隔正则表达式模式 |
|
||
| `exclude_paths` | 字符串 | 否 | 排除特定 URL 路径的逗号分隔正则表达式模式 |
|
||
| `exclude_domains` | 字符串 | 否 | 排除域的逗号分隔正则表达式模式 |
|
||
| `allow_external` | 布尔值 | 否 | 在结果中包含外部域链接 \(默认值:true\) |
|
||
| `apiKey` | 字符串 | 是 | Tavily API 密钥 |
|
||
|
||
#### 输出
|
||
|
||
| 参数 | 类型 | 描述 |
|
||
| --------- | ---- | ----------- |
|
||
| `base_url` | 字符串 | 被映射的基础 URL |
|
||
| `results` | 数组 | 发现的 URL |
|
||
|
||
## 注意事项
|
||
|
||
- 类别:`tools`
|
||
- 类型:`tavily`
|