📌 背景与起源:打破研究壁垒的开源力量
- 核心目标:提供对标 OpenAI DeepResearch 的免费替代方案(后者需每月 200 美元 订阅费)。
- 开发者:由 GitHub 用户 jolovicdev 于 2025 年初开源发布,迅速成为技术社区热议焦点。
-
核心理念:通过去中心化设计,将AI 深度研究能力从高价订阅模式解放,赋予普通用户民主化访问权。
🛠️ 核心功能:四大技术亮点
-
多引擎搜索支持
- 整合 Google、DuckDuckGo 等引擎,支持自定义搜索范围。
- 采用并行处理技术,显著提升数据采集效率。
-
智能迭代研究
- 基于 LLM(大型语言模型) 动态生成迭代问题链。
- 示例:输入「美国总统是谁」→ 自动扩展至「任期政策」「国际关系影响」等维度。
-
结构化报告生成
- 输出Markdown 格式报告,含结论、引用来源与 AI 分析总结。
- 支持学术场景的可信度验证需求。
-
AI 驱动快速响应
⚙️ 技术架构:模块化设计
- 语言模型层:灵活接入多厂商 LLM API(代码示例展示 OpenAI GPT-4 调用)。
- 动态爬虫引擎:自主开发轻量级爬虫,突破 JavaScript 渲染网页 抓取瓶颈。
- 研究代理(ResearchAgent):
- 通过
max_depth
控制研究深度(如 3 层迭代)。 - 通过
breadth
调节每层探索分支数(默认 4 方向)。
- 通过
📊 对比 OpenAI DeepResearch:开源 vs 闭源
特性 | Shandu | OpenAI DeepResearch |
---|---|---|
许可模式 | 完全开源 (MIT 许可) | 闭源,仅限付费用户 |
成本 | 仅需 LLM API 费用(如 GPT-4) | 每月 200 美元 固定支出 |
性能基准 | 依赖所选模型(未达 o3 模型 67.36%) | 行业顶级 (GAIA 基准测试领先) |
定制性 | 支持代码级修改与参数调优 | 功能锁定,无扩展接口 |
🌍 意义与社区反馈
-
行业影响:
- 为学生、独立开发者、初创团队提供低成本研究工具。
- 推动 AI 技术透明化,减少企业对闭源方案的依赖。
-
用户评价:
- 开发者 @aigclink 在 X 平台称赞其「结构清晰、引用规范」的报告生成能力。
- GitHub 仓库 (jolovicdev/shandu) 获数百星标,社区呼吁增加图形化界面与PDF 解析功能。
🔮 局限与未来展望
-
当前短板:
- 动态网页抓取准确率待提升,复杂交互场景存在漏检。
- 缺乏预训练专属模型,完全依赖外部 LLM。
-
发展路线图:
- 2025 年 Q2 计划支持多模态数据(图片/PDF)。
- 社区贡献者正开发 Docker 镜像与 Web UI 简化部署。
🚀 快速上手指南
# 1. 克隆项目
git clone https://github.com/jolovicdev/shandu.git
# 2. 安装依赖
pip install -r requirements.txt
# 3. 配置 API 密钥(示例:OpenAI)
shandu configure
# 4. 生成深度报告
shandu research "量子计算突破性进展" --depth 3 --output quantum.md
快速开始
# Configure API settings (supports various LLM providers)
shandu configure
# Run comprehensive research
shandu research "Your research query" --depth 2 --breadth 4 --output report.md
# Quick AI-powered search with web scraping (You dont need Perplexity!)
shandu aisearch "Who is the current sitting president of United States?" --detailed
# Basic multi-engine search
shandu search "Your search query"
###💻 Python 接口
from shandu.agents import ResearchGraph
from langchain_openai import ChatOpenAI
# Initialize with custom LLM if desired
llm = ChatOpenAI(model="gpt-4")
# Initialize the research graph
researcher = ResearchGraph(
llm=llm,
temperature=0.5
)
# Perform deep research
results = researcher.research_sync(
query="Your research query",
depth=3, # How deep to go with recursive research
breadth=4, # How many parallel queries to explore
detail_level="high"
)
# Print or save results
print(results.to_markdown())
✨ 总结
Shandu 作为 OpenAI DeepResearch 的开源替代品,以零成本、高定制性为核心竞争力。尽管性能暂未超越商业方案,但其模块化架构与社区共建模式,为 AI 研究工具生态注入全新活力。适合追求技术自主性与预算敏感型用户优先尝试。
文章评论