ワンクリックで
AI Agent 专属无头浏览器 CLI(省 token 80%)。触发:网页自动化、打开网页、点击填表、截图抓快照、agent-browser。
npx skills add https://github.com/Yaron9/MetaMe --skill agent-browserこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストール
AI Agent 专属无头浏览器 CLI(省 token 80%)。触发:网页自动化、打开网页、点击填表、截图抓快照、agent-browser。
npx skills add https://github.com/Yaron9/MetaMe --skill agent-browserこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストール
MetaMe Agent lifecycle management — create, bind, list, edit, unbind agents. TRIGGER when: user explicitly requests creating a new agent, binding/unbinding an agent to a chat, listing agents, editing agent roles, resetting agents, or managing agent soul/identity. Keywords: "新建agent", "创建智能体", "绑定agent", "解绑", "agent列表", "/agent", "创建工作区". DO NOT TRIGGER when: user is DISCUSSING agents conceptually, talking ABOUT the agent system, reporting bugs about agents, or mentioning "agent" in passing without an actionable request. If the message is about agent architecture, design, code, or features — that is NOT a trigger.
把本地文件直接发到用户手机(飞书 / Telegram / iMessage),而不是只在群里报路径。 触发:用户说「把 X 文件发我 / 给我下载 / 发到手机 / 发文件」、要 PDF/CSV/PNG/log 下载、要查看文件内容(超过聊天可读长度)。
免费多平台信息采集CLI(Twitter/YouTube/B站/小红书/抖音/Reddit/LinkedIn/GitHub/RSS/网页)。触发:agent reach、爬取、读网页、搜推特、搜B站。**WebFetch 失败时优先用此 skill**:凡遇到 JS 渲染页面(Twitter/X、Instagram、LinkedIn 等)或 WebFetch 返回空内容/JavaScript错误,无需重试 WebFetch,直接调用此 skill。
Create, iterate, evolve, and package skills that extend Claude's capabilities. Use when: (1) Creating a new skill from scratch, (2) Updating or improving an existing skill's instructions or bundled resources, (3) Evolving a skill based on session experience (bugs, preferences, workarounds) — triggers: "进化技能", "更新 skill", "/evolve", "记录这个经验", "skill evolution", (4) Packaging a skill for distribution to other Claude Code (Codex) users. Do NOT trigger for general programming tasks unrelated to skill authoring.
MetaMe npm 发布流程(版本 bump、pre-publish 审计、OTP publish)。触发:发布/打包/出包/bump/release + MetaMe 代码上下文。勿触发:自媒体/内容发布。
技能系统总管。AI 遇到任何能力不足、工具缺失、任务失败时,第一时间查阅此 skill。它掌握全部已安装技能的清单,决定是调用现有技能还是获取新技能,并在任务完成后自动进化技能库。触发条件:(1)任务执行失败或结果不理想,(2)需要的工具/能力不存在,(3)用户说"找技能"、"管理技能"、"更新技能"。本协议应自动触发,无需用户指令。
| name | agent-browser |
| description | AI Agent 专属无头浏览器 CLI(省 token 80%)。触发:网页自动化、打开网页、点击填表、截图抓快照、agent-browser。 |
| version | 1.0.0 |
| tool | agent-browser |
| install | npm install -g agent-browser && agent-browser install |
| 特性 | agent-browser | MCP playwright |
|---|---|---|
| 快照 token 消耗 | ~80% 更少 | 较多 |
| 安装方式 | 全局 CLI | MCP Server |
| 调用方式 | Bash 工具 | 专用 MCP 工具 |
| 底层引擎 | Playwright | Playwright |
| 状态持久化 | session 文件 | MCP 进程生命周期 |
| Electron 桌面 App | ✅ 支持 | ❌ 不支持 |
agent-browser --version # 应输出版本号(当前 0.15.2)
若未安装:
npm install -g agent-browser
agent-browser install # 安装 Chromium
agent-browser open <url>
agent-browser snapshot # 输出带 @ref 的可交互元素树
快照格式示例:
- heading "Example Domain" [ref=e1] [level=1]
- link "Learn more" [ref=e2]
AI 直接用 @e1、@e2 引用元素,无需 CSS/XPath 选择器。
# 导航
agent-browser open <url>
agent-browser back / forward / reload
# 交互
agent-browser click @e3
agent-browser fill @e5 "搜索内容"
agent-browser press Enter
agent-browser hover @e7
agent-browser select @e4 "选项值"
agent-browser upload @e6 /path/to/file
# 信息获取
agent-browser get text @e2
agent-browser get title
agent-browser get url
agent-browser is visible @e1
agent-browser is enabled @e2
# 视觉工具
agent-browser screenshot /tmp/debug.png
agent-browser screenshot --annotate /tmp/annotated.png # 带元素标注
# 等待
agent-browser wait @e1 # 等元素出现
agent-browser wait 2000 # 等 2 秒
# 执行 JS
agent-browser eval "document.title"
agent-browser find role button "提交" # 按 ARIA role 找
agent-browser find text "登录" # 按文本找
agent-browser find label "用户名" # 按 label 找
agent-browser find placeholder "请输入" # 按 placeholder 找
# 保存登录状态
agent-browser set session ~/.agent-sessions/github.json
# 后续会话复用
agent-browser open github.com --session ~/.agent-sessions/github.json
# Step 1: 打开目标页面
agent-browser open <url>
# Step 2: 抓快照,识别元素
agent-browser snapshot
# AI 分析快照,找到目标 @ref
# Step 3: 执行操作
agent-browser click @eN
agent-browser fill @eM "内容"
agent-browser press Enter
# Step 4: 等待并验证结果
agent-browser wait ".success-msg"
agent-browser get text ".result"
# Step 5: 截图留档(可选)
agent-browser screenshot /tmp/result.png
用 agent-browser 的场景:
继续用 MCP playwright 的场景:
| 错误 | 处理 |
|---|---|
command not found | 运行 npm install -g agent-browser |
| 浏览器未安装 | 运行 agent-browser install |
| 元素点击失败 | 先 snapshot 确认 @ref,改用 find 语义查找 |
| 页面未加载完 | 在操作前加 agent-browser wait 1500 或等待特定元素 |
# 连接 CDP 调试端口(可复用已登录的 Chrome)
agent-browser connect 9222