Deep Research 概述
Deep Research: AI驱动的研究助手
什么是Deep Research?Deep Research是一款开源的AI驱动研究助手,旨在对任何主题进行迭代式的深度研究。它结合了搜索引擎、网络抓取和大型语言模型(LLMs)的力量,为用户提供对其所选主题的全面理解。
该项目旨在提供一个最简单的深度研究代理的实现,使其能够随着时间的推移完善其研究方向,并深入研究一个主题。目标是保持一个紧凑的代码库,使其易于理解和构建。
Deep Research如何工作?
Deep Research利用几个关键组件来实现其研究能力:
- 搜索引擎: 利用搜索引擎收集初始信息并识别相关来源。
- 网络抓取: 从网页中提取内容,以收集详细的信息和数据。
- 大型语言模型(LLMs): 使用LLMs生成有针对性的搜索查询,处理结果并确定新的研究方向。
Deep Research的主要特点
- 迭代研究: 通过迭代生成搜索查询、处理结果并根据发现深入挖掘来进行深入研究。
- 智能查询生成: 使用LLMs根据研究目标和之前的发现生成有针对性的搜索查询。
- 深度与广度控制: 提供可配置的参数来控制研究的范围(广度)和深度。
- 智能跟进: 生成跟进问题以完善研究需求并发现新的见解。
- 综合报告: 生成包含发现和来源的详细markdown报告,提供清晰且有组织的research概述。
- 并发处理: 并行处理多个搜索和结果处理以提高效率,从而减少研究时间。
如何使用Deep Research?
要开始使用Deep Research,请按照以下步骤操作:
- 要求
- Node.js 环境
- 以下API密钥:
- Firecrawl API(用于网络搜索和内容提取)
- OpenAI API(用于 o3 mini 模型)
- 设置
- 克隆存储库:
git clone [repository_url] - 安装依赖项:
npm install - 在
.env.local文件中设置环境变量:FIRECRAWL_KEY="your_firecrawl_key" # 如果你想使用你自己的 Firecrawl,请在下面添加: # FIRECRAWL_BASE_URL="http://localhost:3002" OPENAI_KEY="your_openai_key" - 要使用本地LLM,请注释掉
OPENAI_KEY,而是取消注释OPENAI_ENDPOINT和OPENAI_MODEL:- 将
OPENAI_ENDPOINT设置为本地服务器的地址(例如,“http://localhost:1234/v1”) - 将
OPENAI_MODEL设置为本地服务器中加载的模型的名称。
- 将
- 克隆存储库:
- 用法
- 运行研究助手:
npm start - 系统会提示您:
- 输入您的研究查询
- 指定研究广度(推荐:3-10,默认:4)
- 指定研究深度(推荐:1-5,默认:2)
- 回答后续问题以完善研究方向
- 然后,系统将:
- 生成并执行搜索查询
- 处理和分析搜索结果
- 根据发现递归地进行更深入的探索
- 生成一份全面的markdown报告
- 最终报告将以
report.md或answer.md保存在您的工作目录中,具体取决于所选模式。
- 运行研究助手:
并发
如果您拥有Firecrawl的付费版本或本地版本,请通过设置CONCURRENCY_LIMIT环境变量来增加ConcurrencyLimit以提高速度。免费用户可能会遇到速率限制错误,应将限制降低到1。
DeepSeek R1
Deep Research与R1模型配合良好。要使用R1,请设置一个Fireworks API密钥:
FIREWORKS_KEY="api_key"
当检测到密钥时,系统将自动切换到R1而不是o3-mini。
自定义端点和模型
您还可以使用这些环境变量调整端点(对于其他与OpenAI兼容的API,如OpenRouter或Gemini)以及模型字符串:
OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"
Deep Research适合谁?
Deep Research适合:
- 需要收集有关特定主题的深入信息的的研究人员。
- 需要为学术项目进行研究的学生。
- 需要及时了解行业趋势和发展的专业人士。
- 任何想要快速有效地详细探索某个主题的人。
为什么选择Deep Research?
- 简化复杂的研究: 自动化收集和分析信息的过程,从而节省时间和精力。
- 揭示隐藏的见解: 深入探索一个主题,揭示传统研究方法可能错过的见解。
- 提供全面的报告: 生成详细的报告,总结研究结果并提供清晰的研究概述。
- 可定制和灵活: 提供可配置的参数,以根据特定需求定制研究过程。
许可证
Deep Research根据MIT许可证发布,允许用户根据需要自由使用和修改代码。
Deep Research简化了深入的主题分析。通过自动化搜索、网络抓取以及利用LLMs进行智能查询生成,它简化了复杂的研究流程。研究人员、学生和专业人士可以使用此工具快速收集全面的信息、揭示见解并生成详细的报告,同时保持清晰、易读的格式。Deep Research的独特之处在于它能够迭代地完善其研究方向,并在每次迭代中更深入地研究一个主题。
"Deep Research"的最佳替代工具
Firecrawl 是专为 AI 应用设计的领先网页爬取、抓取和搜索 API。它将网站转化为干净、结构化的 LLM 就绪数据,支持大规模 AI 代理使用可靠的网页提取,无需代理或复杂问题。
Hunch 是一个 AI 优先的工作区,使团队能够使用顶级 AI 模型,管理复杂的项目并提高生产力。功能包括模板、批量处理、网络抓取和代码执行。
使用 Firecrawl 自动执行网络抓取、WordPress 数据迁移、电子商务产品导入和预订自动化。使用人工智能驱动的解决方案来节省时间、减少错误并毫不费力地扩展您的业务!
InfraNodus 是一款 AI 文本分析工具,利用知识图谱可视化文本、揭示内容空白,并为研究、创意生成和 SEO 优化生成新洞察。
Scrapingdog 提供网页抓取 API 以及用于提取搜索、社交和电子商务数据的专用 API。它管理复杂性,通过真实浏览器渲染和旋转代理提供无阻塞数据。
使用 AISmartCube 在数小时内构建 AI 工具,这是一个低代码平台。 通过拖放、AI 助手和即用型模板实现任务自动化。 访问 ChatGPT、Claude、Gemini 等。
smolagents 是一个简约的 Python 库,用于创建通过代码推理和行动的 AI 代理。它支持模型无关的 LLM、安全沙箱以及与 Hugging Face Hub 的无缝集成,实现高效的基于代码的代理工作流。
HARPA AI 是一款 AI 驱动的 Chrome 扩展,它结合了 ChatGPT、Claude、Gemini 等,可自动执行在线任务,节省搜索、写作、编码和总结的时间。
Olostep 是一款面向 AI 和研究代理的 Web 数据 API。 它允许您实时从任何网站提取结构化 Web 数据,并自动执行 Web 研究工作流程。 用例包括 AI 数据、电子表格扩充、潜在客户生成等。
BrowserAct是一款AI驱动的网页抓取和自动化工具,无需编码即可从任何网站提取数据。自动化工作流程并与n8n和Make等工具集成。