بنقرة واحدة
ultra-research
// 多AI并行深度研究。当用户需要对某个主题进行全面调研、深度研究、多方对比、或需要覆盖多个维度和来源的综合分析时触发。适合复杂主题(技术选型、竞品分析、行业趋势、争议性话题等),不适合简单事实查询。通过多个AI服务并行研究,交叉验证,输出带引用的综合报告。
// 多AI并行深度研究。当用户需要对某个主题进行全面调研、深度研究、多方对比、或需要覆盖多个维度和来源的综合分析时触发。适合复杂主题(技术选型、竞品分析、行业趋势、争议性话题等),不适合简单事实查询。通过多个AI服务并行研究,交叉验证,输出带引用的综合报告。
Alignment conversation starting from a user's rough idea. Co-decides with the user whether the idea should be acted on directly in the current session, or fixed into a formal Task by producing four documents in `.task/` for independent dispatch. Handles lightweight 'do it now while we talk', heavyweight 'define precisely, run later', and 'just help me think about this' — all on the same skill. Use when the user describes a task or intent they want to align on. Trigger phrases include 'help me plan this', 'let's think this through', 'I want to explore X', 'I have an idea', '/task-alignment'. Also use proactively when a user jumps into a complex task without defining scope or success criteria — pause, align, and help them pick the right vessel (this session vs. a task).
Autonomous task execution driven by documents under `.task/<MMDD_slug>/` (produced by /task-alignment). Reads task.md as the goal, decomposes work, delegates to subagents when appropriate, runs independent verification, and delivers results. Acts as a UserProxy Agent — the human's representative during autonomous execution. Use when a task subdirectory exists in `.task/` and the user wants to start execution, or right after completing /task-alignment. Trigger phrases include '/task-implement', '/task-implement <slug>', 'start the task', 'go ahead and implement', 'execute the plan', or when the user confirms alignment documents and says something like 'looks good, go'.
Find and download virtually any digital resource from the internet — ebooks, academic papers, movies, TV shows, music, software, images, fonts, courses, and more. Covers both English and Chinese internet ecosystems. Includes CLI tool workflows (yt-dlp, aria2, gallery-dl, spotdl), resource site directories, cloud drive search engines (百度/阿里/夸克网盘搜索), and search techniques (Google dorks). Use when the user wants to: (1) download a video, audio, or media from a URL, (2) find and download an ebook or academic paper, (3) find and download software, (4) search for any digital resource, (5) batch download images or media from a gallery/site, (6) download torrents or magnet links, (7) find free stock assets (images, video, audio, fonts), (8) search Chinese cloud drives for resources, or (9) any task involving finding or downloading digital content from the internet.
| name | ultra-research |
| description | 多AI并行深度研究。当用户需要对某个主题进行全面调研、深度研究、多方对比、或需要覆盖多个维度和来源的综合分析时触发。适合复杂主题(技术选型、竞品分析、行业趋势、争议性话题等),不适合简单事实查询。通过多个AI服务并行研究,交叉验证,输出带引用的综合报告。 |
| allowed-tools | ["mcp__playwright__browser_navigate","mcp__playwright__browser_click","mcp__playwright__browser_type","mcp__playwright__browser_snapshot","mcp__playwright__browser_take_screenshot","mcp__playwright__browser_evaluate","mcp__playwright__browser_run_code","mcp__playwright__browser_wait_for","mcp__playwright__browser_press_key","mcp__playwright__browser_tabs","mcp__playwright__browser_close","Bash(mkdir *)","Bash(ls *)","Bash(mv *)","Bash(cp *)","Bash(pkill *)","Bash(sleep *)","Bash(date *)","Read","Write","Edit","WebSearch","WebFetch","Grep","Glob"] |
三段式:理解需求 → 迭代探索 → 整合报告。
通过 Playwright MCP 控制多个 AI 服务进行并行研究。各服务交互细节见 reference 文件。
--user-data-dir),这样各 AI 服务的登录态才会保留browser_snapshot 实时探测| 服务 | 模式 | 耗时 | 特点 |
|---|---|---|---|
| Gemini Pro | 快速 | 10-60s | 快速问答、事实查证(有搜索能力) |
| Gemini Deep Research | 深度 | 5-10min | 多源综合、广度覆盖 |
| ChatGPT Thinking | 快速 | 10-120s | 深度推理、结构化分析 |
| ChatGPT Deep Research | 深度 | 5-30min | 多源综合、广度覆盖 |
| Claude Opus Extended | 快速 | 10-120s | 深度推理、方案设计 |
| Grok 快速/专家 | 快速 | 10-60s | X/Twitter 内容搜索、时效性讨论和趋势 |
| Grok DeepSearch | 深度 | 数分钟 | 深度搜索、社交媒体观点汇集 |
这些是工具箱,不是流水线。 根据研究需要灵活选用和组合。
交互参考:
目标:搞清楚用户要什么,然后开始。
收到用户 query 后,先判断你是否能理解研究的对象、范围、目的:
澄清不是走流程——如果用户的意图一目了然,直接干活比问一堆问题有用。
为选定的 AI 模式各准备一条查询。不同 AI 给不同角度比给同一个 prompt 更有效。见 prompt-guide.md。
在合适位置创建研究目录(如 research-主题/),创建 todo.md 记录状态。
目标:多路并发搜索,逐步深入,直到信息充分。
不要预设研究深度,让研究过程自己说话:
简单问题不要大炮打蚊子。复杂问题不要浅尝辄止。让信息本身告诉你该挖多深。
每个 AI 服务的具体操作步骤见各自 reference 文件。通用流程:
登录处理:这些服务使用的是用户的账号。如果发现某个服务未登录,立即暂停并告知用户,让用户选择:
不要自动跳过——用户可能想登录。
先到先提取,不等所有流完成。
提取技术见 extraction.md。每份结果保存为独立 md(01-gemini-pro.md、02-chatgpt-thinking.md...)。
每提取一份结果,立即评估:
如果有 → 追加查询。选择最合适的工具:
browser_close → pkill -f "mcp-chrome" → sleep 2 → 重新 navigate目标:按主题维度重组内容,交叉验证,输出一份深度报告。
[Gemini DR]、[Grok]、[ChatGPT Thinking] 等),让读者知道可信度报告有两层引用,都要做好:
1. 网络来源引用(报告 → 原始网页)
正文中关键事实、数据、观点旁标注原始网络来源。格式灵活——脚注、行内链接、段落末尾引用块都行,根据报告风格选择最可读的方式。核心原则:读者看到一个关键论断,能直接找到原始网页验证。
各 AI 的引用链接已在原始结果文件的 ## 参考链接 章节。整合时从那里挑选最相关的链接嵌入报告正文。不需要全部搬过来——只保留支撑关键论点的。
2. AI 来源标注(报告 → 哪个 AI 说的)
用行内标签 [Gemini DR]、[Grok]、[ChatGPT Thinking] 等标注信息来自哪个 AI 模式。这帮助读者判断可信度(DR 多源交叉 vs 快速模式单次推理)。多路一致的可以标 [多路共识]。
3. 原始结果索引(报告 → 原始文件)
报告末尾附 ## 原始结果索引,列出所有原始结果文件和对应的查询内容:
## 原始结果索引
| 文件 | 服务 | 模式 | 查询摘要 |
|------|------|------|----------|
| 01-gemini-pro.md | Gemini | Pro | ... |
| 02-chatgpt-dr.md | ChatGPT | Deep Research | ... |
这让读者能回溯到完整的原始结果(含全部参考链接)。
报告保存为 00-final-report.md。
研究可能跨会话。todo.md 是恢复点。
# 研究:[主题]
## 状态:[进行中/已完成]
## 搜索流
| # | 服务 | 模式 | Tab | 查询摘要 | 状态 |
|---|------|------|-----|----------|------|
| 01 | Gemini | Pro | 2 | ... | 已提取 |
| 02 | ChatGPT | DR | 3 | ... | 等待中 |
| 03 | Grok | 专家 | 4 | ... | 进行中 |
## 发现的子问题
- [ ] ...
## 整合进度
- [ ] 初稿
- [ ] 缺口填补
- [ ] 最终审校
跨会话恢复:读 todo.md → browser_tabs list 检查现有 Tab → 对照恢复。
| 情况 | 建议 |
|---|---|
| 未登录 | 暂停,告知用户——让用户选择登录还是跳过该服务 |
| 浏览器断连 | browser_close → pkill -f "mcp-chrome" → sleep 2 → 重新 navigate |
| Cloudflare 拦截 | 重试 1-2 次 navigate,通常第二次就通过 |
| 单 Tab 超时(>40min) | 标记超时,继续其他流 |
| 提取返回空 | 见 extraction.md 的降级策略 |
| snapshot 返回空 | 等 2-3 秒重试,ChatGPT/Grok 有时会进入瞬时空状态 |
| DR 未启动 | ChatGPT DR 可能先回澄清问题,检测后回复让它直接开始 |
| DR/DeepSearch 配额用尽 | 跳过,改用快速模式或 WebSearch 补充 |
部分失败不影响产出:≥2 路成功仍出报告(注明来源范围)。