工具配置#

WideSeek-R1 提供两种搜索后端：

在标准工作流中，离线工具通常用于训练和标准 QA 评测，而在线工具用于 WideSearch 评测。

概述#

启动 WideSeek-R1 训练或评测前，先配置一个工具后端。

在线

Serper 搜索与 Jina 网页访问

离线

基于 Wiki-2018 的本地 Qdrant 检索

配置

tools.online、use_jina 与 cache 设置

测试

rlinf/agents/wideseek_r1/tools.py

在线模式使用 Serper 进行网页搜索，并使用 Jina AI 进行网页访问。

在运行训练或评测之前，请先导出所需的 API 密钥：

export SERPER_API_KEY=your_serper_api_key
export JINA_API_KEY=your_jina_api_key

在 examples/agent/wideseek_r1/config 下的 YAML 配置中设置：

tools:
  online: True
  use_jina: True
  enable_cache: True
  cache_file: "./webpage_cache.json"

离线模式使用本地 Qdrant 检索服务，并配合本地语料库与网页存储。

完成安装指南中的基础环境配置后，安装 Qdrant 客户端：

uv pip install qdrant-client==1.16.2

准备以下资源：

语料包包含：

启动检索服务：

bash examples/agent/tools/search_local_server_qdrant/launch_local_server.sh

我们建议将该检索服务部署在与训练或评测相同的机器上，以避免不必要的网络延迟。如果部署在其他机器上，请相应配置 tools.search.server_addr。默认地址为 localhost:8000。

检索服务默认监听 8000 端口，并暴露以下接口：

由于 Qdrant 检索运行在 CPU 上，服务启动后只有 E5 检索模型会占用 GPU 显存。

在 YAML 配置中设置：

tools:
  online: False

如果检索服务不运行在本机上，还需要设置：

tools:
  search:
    server_addr: "HOST:8000"

你可以直接测试 WideSeek-R1 的工具 worker。

在线模式：

python rlinf/agents/wideseek_r1/tools.py --is_online true

离线模式：

python rlinf/agents/wideseek_r1/tools.py --is_online false

在线测试需要 SERPER_API_KEY 和 JINA_API_KEY。

离线测试要求本地检索服务能够通过已配置的 server_addr 访问。