Execute qualquer Skill no Manus
com um clique

Execute qualquer Skill no Manus com um clique

$pwd:

browser-bridge

Name: Browser Bridge
Author: liuzhengdongfortest

// 通过 Chrome 扩展控制真实浏览器。需要访问网页、抽取网页数据、点击按钮、填写表单、执行浏览器自动化、提取渲染后的组件证据，或以程序方式操作页面时使用。通过 DOM diff、简化 HTML 和 component evidence pack 返回节省 token 的结构化结果。适用于 browser control、web automation、page scraping、web data extraction、execute JS in browser、web_scan、web_execute_js、open browser、navigate to URL、get page content、fill form、click button、extract component、rendered DOM、computed styles、component evidence。

Executar no Manus

$ git log --oneline --stat

stars:0

forks:0

updated:7 de maio de 2026 às 16:03

Explorador de arquivos

15 arquivos

SKILL.md

readonly

related-skills.json

mesmo repositório

clear-discuss.md

from "liuzhengdongfortest/skills"

讨论清楚。用于用户想聊任何还没定型的主题时：需求、想法、技术方案、产品方向、架构疑问、写作、流程、工具、判断题都可以讨论。只做讨论、澄清、发散、收敛和必要的小实验；不真正改项目、不落需求或架构、不动代码。每次讨论单独落一份讨论记录文件。

2026-05-120

continuous-work.md

from "liuzhengdongfortest/skills"

持续工作模式——stop hook 触发或客户提到时启用。入口动作是先做一次大抬头（按 .boss/principles/lookup-beats.md 大抬头扫描），然后按 9 条硬约束（代码质量、工程质量、渐进式披露、遇阻深挖、不确定求证、单点不停摆、先抄后造、精益求精、task 最低规划深度）和「看得更多 / 做得更多」选下一步。配套 .ai/continuous.yaml 配置和三家 CLI（Codex/Claude/OpenCode）stop hook 安装器。

2026-05-120

owner-execute.md

from "liuzhengdongfortest/skills"

主理人交付执行场景——拿到目标按粒度选 Task（小目标可独立验证）或 Roadmap（大目标跨阶段需要状态地图）。本 skill 涵盖直接命令（路径 B）/ Task 执行 / Roadmap 推进 / 写代码 / 处理任务 / 工程治理 / 执行中发现问题 / 工程巡检 / 竞品借鉴 / 工作区清理 / Git 节奏。Task/Roadmap 文档落 .boss/{tasks,roadmaps}/。

2026-05-120

owner-meeting.md

from "liuzhengdongfortest/skills"

主理人和客户对齐场景——讨论需求、聊架构方向、技术求知。会议是讨论不是执行，结论落到 .boss/{requirements,architecture,meetings,wiki}/，不动代码、不建 task、不拆 Roadmap。涵盖记重点（落 meetings）/ 落需求（落 requirements）/ 落架构（落 architecture）/ 传导链（决策在会中不在执行时）/ 求知场景。客户明确"做吧""开工"时切到 owner-execute。

2026-05-120

owner-onboard.md

from "liuzhengdongfortest/skills"

主理人首次接入客户项目——客户项目根目录没有 .boss/ 时启用。建 .boss/ 骨架，复制横切原则到 .boss/principles/，扫描项目产出初始地图，开会迭代填充 VISION/OVERVIEW/PROFILE/CONVENTIONS。骨架立好后切回 owner 主入口，按场景路由到 owner-meeting / owner-execute。

2026-05-120

owner.md

from "liuzhengdongfortest/skills"

主理人姿态 + 路由入口。客户给模糊目标，主理人自己搞清楚、补缺口、规划执行、交付结果。本 skill 定姿态（主动性、自主规划、三视角、信息架构、实践出真知、抬头节拍）、读 .boss/{PROFILE,CONVENTIONS,principles}/、按场景路由到 owner-onboard（项目接入）/ owner-meeting（讨论对齐）/ owner-execute（执行交付）/ continuous-work（持续工作模式）。所有主理人式协作的首入口。

2026-05-120

package.json

"author": "liuzhengdongfortest"

"repository": "liuzhengdongfortest/skills"

Abrir repositório GitHub Ver repositórios do creator

$ install --global

$ download --local

Executar no Manus

$ useful --forSOC

Desenvolvedores de softwareInformática e Matemática15-1252L4

name

browser-bridge

description

通过 Chrome 扩展控制真实浏览器。需要访问网页、抽取网页数据、点击按钮、填写表单、执行浏览器自动化、提取渲染后的组件证据，或以程序方式操作页面时使用。通过 DOM diff、简化 HTML 和 component evidence pack 返回节省 token 的结构化结果。适用于 browser control、web automation、page scraping、web data extraction、execute JS in browser、web_scan、web_execute_js、open browser、navigate to URL、get page content、fill form、click button、extract component、rendered DOM、computed styles、component evidence。

Browser Bridge

Browser Bridge 通过 Chrome 扩展连接真实浏览器，提供结构化的网页操作和抽取能力。它不把整页原始 HTML 直接塞给模型，而是在浏览器里执行 JavaScript，再返回结构化结果、DOM 变化摘要和短暂出现的提示文本。

使用定位

Browser Bridge 是一个独立技能。它只说明自己的安装方式、命令接口和使用模式。

使用前确认三件事：

Python 依赖和 Chrome 扩展已经安装。
python <skill-dir>/scripts/browser.py tabs 能看到浏览器 tab。
频繁执行命令时，先启动常驻 master，避免每次 CLI 调用都等待扩展重连。

架构

CLI (browser.py)  ->  Python (TMWebDriver)  <-WebSocket->  Chrome 扩展  <-CDP/scripting->  浏览器 Tab

Python WebSocket server 运行在 ws://127.0.0.1:18765。
Chrome 扩展连接到 server，并把命令转发给浏览器 tab。
JavaScript 在页面上下文中执行；如果 CSP 阻止执行，会回退到 CDP。
navigate / back / forward / reload 使用 Chrome extension tab API，不通过页面内 window.location 注入实现。
返回结果是结构化 JSON，不是原始 HTML。

一次性安装

首次使用前安装依赖：

pip install bs4 simple-websocket-server bottle requests

然后安装 Chrome 扩展：

打开 Chrome 的 chrome://extensions/。
启用 "Developer mode / 开发者模式"。
点击 "Load unpacked / 加载已解压的扩展程序"，选择 <skill-dir>/assets/extension/。
打开任意网页验证：python <skill-dir>/scripts/browser.py tabs 能看到 tab。

连接标记默认不显示，避免污染截图和页面布局。需要临时显示时，在页面控制台执行：

localStorage.setItem('BROWSER_BRIDGE_BADGE', '1'); location.reload()

关闭标记：

localStorage.removeItem('BROWSER_BRIDGE_BADGE'); location.reload()

CLI 参考

所有命令第一次调用时都会自动启动 bridge server。CLI 位于：

<skill-dir>/scripts/browser.py

下面的 <skill-dir> 指包含本 SKILL.md 的目录。

推荐：启动常驻 master

如果直接反复调用 browser.py exec ...，每个短命 CLI 进程都可能重新启动 bridge server，并等待 Chrome 扩展重连，通常会多出数秒冷启动时间。频繁操作浏览器时，先单独启动：

python <skill-dir>/scripts/browser_master.py

保持这个进程运行。之后正常使用 browser.py exec、scan、tabs 等命令，它们会自动通过 http://127.0.0.1:18766/link 转发到常驻 master。

只需要 JS 返回值、不需要 DOM diff 和 toast 捕获时，给 exec 加 --no-monitor：

python <skill-dir>/scripts/browser.py exec --no-monitor "document.title"

默认情况下 CLI 只在 stdout 输出一行 JSON，不输出连接、tab 更新或执行片段等诊断日志。排障时可以加全局参数 --verbose，或设置环境变量 BROWSER_BRIDGE_DEBUG=1：

python <skill-dir>/scripts/browser.py --verbose exec --no-monitor "document.title"

exec: 在浏览器里执行 JavaScript

这是最常用的主命令。直接写 JavaScript 查询或操作 DOM。系统会捕获返回值、DOM 变化和执行期间出现的短暂文本，例如 toast、通知、loading 文案。

python <skill-dir>/scripts/browser.py exec "<javascript>"

参数：

--tab <id>：指定 tab。
--no-monitor：跳过 DOM diff，更快。
--wait <selector>：执行前等待 CSS selector 出现，适合 SPA。
--wait-ms <ms>：--wait 的最长等待时间，默认 10000。
--timeout <s>：执行超时秒数，默认 15。

示例：

# 获取页面标题
python <skill-dir>/scripts/browser.py exec "document.title"

# 点击元素并查看页面变化
python <skill-dir>/scripts/browser.py exec "document.querySelector('.submit-btn').click()"

# 抽取结构化数据
python <skill-dir>/scripts/browser.py exec "Array.from(document.querySelectorAll('.item')).map(e=>({name:e.querySelector('.name')?.textContent,price:e.querySelector('.price')?.textContent}))"

# 填写表单字段，并触发 React/Vue 绑定
python <skill-dir>/scripts/browser.py exec "const e=document.querySelector('#email');e.value='u@x.com';e.dispatchEvent(new Event('input',{bubbles:true}))"

# 向下滚动
python <skill-dir>/scripts/browser.py exec "window.scrollBy(0,800)"

# 等待元素出现后再交互
python <skill-dir>/scripts/browser.py exec --wait ".loaded" "return document.querySelector('.loaded').textContent"

# 长时间操作
python <skill-dir>/scripts/browser.py exec --timeout 30 "await fetch('/api/slow'); return 'done'"

返回字段：

status：success 或 error。
js_return：JavaScript 返回值；DOM 元素会被智能处理成 outerHTML。
diff：DOM 变化摘要，说明哪些元素出现或改变。
transients：执行期间短暂出现的文本，例如 toast 或 loading。
newTabs：执行期间打开的新 tab。
tab_id：执行所在 tab ID。
error：失败时的错误信息。
reloaded：执行期间页面是否发生 reload。
suggestion：页面无明显变化时给出的提示。

失败时统一返回：

{"status":"error","error":{"code":"execute_error","message":"..."}}

scan: 获取简化后的页面内容

需要页面概览时使用。HTML 会经过空间和语义简化：移除 sidebar、浮动广告、被遮挡元素、不可见内容；重复列表截断到 3 项；删除非语义属性。

python <skill-dir>/scripts/browser.py scan              # 简化 HTML + tab 列表
python <skill-dir>/scripts/browser.py scan --tabs-only  # 只返回 tab 列表，不返回 HTML
python <skill-dir>/scripts/browser.py scan --text-only  # 只返回文本，token 最少
python <skill-dir>/scripts/browser.py scan --size-only  # 只返回内容大小，用于确认页面是否渲染
python <skill-dir>/scripts/browser.py scan --tab <id>   # 扫描指定 tab
python <skill-dir>/scripts/browser.py scan --wait ".result-card"  # 等待 SPA 内容出现

返回字段：

status：success 或 error。
html：简化 HTML；tabs-only 或 size-only 时不会返回。
url / tab_id：当前 tab 信息。
sessions：所有 tab 的 id、url、title 列表。
size：内容字符数，仅 size-only 返回。
scan.truncated：返回内容是否经过预算截断。
scan.original_size / scan.final_size：截断前后字符数。
error：失败时的 {code,message}。

tabs: 列出所有浏览器 tab

python <skill-dir>/scripts/browser.py tabs
# -> {"status":"success","sessions":[{"id":"123","url":"https://...","title":"..."},...]}

tabs 只返回可操作的 tab 信息，不返回 connected_at、内部连接类型等调试字段。

navigate: 打开 URL

导航当前 tab，并等待页面加载完成，最长 30 秒。

python <skill-dir>/scripts/browser.py navigate "https://example.com"
python <skill-dir>/scripts/browser.py navigate "https://example.com" --no-wait  # 跳过加载等待

{"status":"success","navigated_to":"https://...","loaded":true}

back: 后退

python <skill-dir>/scripts/browser.py back

forward: 前进

python <skill-dir>/scripts/browser.py forward

reload: 重新加载当前页

python <skill-dir>/scripts/browser.py reload

newtab: 打开新 tab

python <skill-dir>/scripts/browser.py newtab
python <skill-dir>/scripts/browser.py newtab "https://example.com"

返回里会尽量包含 tab_id 和 tab，后续可以直接传给 --tab。

close: 关闭 tab

python <skill-dir>/scripts/browser.py close
python <skill-dir>/scripts/browser.py close <tab_id>

switch: 按 URL 片段切换 tab

python <skill-dir>/scripts/browser.py switch "github"
# -> {"status":"success","session_id":"456"}

多个 tab 同时匹配时，默认选择第一个。需要精确选择时，先用 tabs 查看所有 tab 的 ID。

screenshot: 截图

通过 Chrome DevTools Protocol 截取当前 tab 的 PNG 图。

python <skill-dir>/scripts/browser.py screenshot
python <skill-dir>/scripts/browser.py screenshot page.png

{"status":"success","filepath":"/tmp/screenshot_1714650000.png"}

evidence: 导出渲染后的组件证据

用于设计系统抽取和组件还原。对于 switch、slider、tabs、select、menu、dialog、command input、date picker、chart 等小而细节敏感的组件，仅靠截图不可靠。evidence 会从真实浏览器 tab 中捕获渲染后的组件结构。

python <skill-dir>/scripts/browser.py evidence 'button[role="switch"]' --name Switch --out component-evidence/switch
python <skill-dir>/scripts/browser.py evidence '[data-slot="switch"]' --name Switch --index 0 --depth 4
python <skill-dir>/scripts/browser.py evidence '.tabs-root' --name Tabs --wait '.tabs-root' --wait-ms 8000

参数：

--name <name>：组件名，用于 metadata 和输出目录。
--out <dir>：输出目录，默认 component-evidence/<name>。
--index <n>：selector 匹配序号，默认 0。
--depth <n>：后代结构深度，默认 4。
--tab <id>：指定 tab。
--wait <selector> / --wait-ms <ms>：等待 SPA 渲染组件。
--all-styles：捕获全部 computed styles，而不是精简后的 UI 样式集合。

输出文件：

component-evidence/<name>/
  README.md
  metadata.json
  dom.html
  attributes.json
  class-list.txt
  box-model.json
  computed-styles.json
  anatomy.json
  screenshot.png
  page.png

把这些证据当作组件结构的权威来源。把组件翻译成源码时，保留有意义的 role、aria-*、data-state、data-size、data-slot、尺寸、transform 和状态类名。evidence 不可用时，先向调用方索取复制出来的 rendered DOM、class list 或源码，再把细节敏感组件标为已验证。

进一步参考

使用模式、SPA 抽取示例、调研速查表和排障说明在 reference.md。操作 Grok 时读取 grok.md。只有命令说明不够用时再读取这些参考。

browser-bridge

Mais deste repositório

Mais deste repositório

Browser Bridge

使用定位

架构

一次性安装

CLI 参考

推荐：启动常驻 master

exec: 在浏览器里执行 JavaScript

scan: 获取简化后的页面内容

tabs: 列出所有浏览器 tab

navigate: 打开 URL

back: 后退

forward: 前进

reload: 重新加载当前页

newtab: 打开新 tab

close: 关闭 tab

switch: 按 URL 片段切换 tab

screenshot: 截图

evidence: 导出渲染后的组件证据

进一步参考

Browser Bridge

使用定位

架构

一次性安装

CLI 参考

推荐：启动常驻 master

exec: 在浏览器里执行 JavaScript

scan: 获取简化后的页面内容

tabs: 列出所有浏览器 tab

navigate: 打开 URL

back: 后退

forward: 前进

reload: 重新加载当前页

newtab: 打开新 tab

close: 关闭 tab

switch: 按 URL 片段切换 tab

screenshot: 截图

evidence: 导出渲染后的组件证据

进一步参考