ワンクリックで
cron-system-maintenance
Cron任务运维:诊断error状态、修复脚本缺陷、验证连接性。覆盖cron job list分析、错误分类、脚本语法验证、prompt更新、vLLM多节点负载均衡。
Codex または Claude でインストール この Prompt をコピーして Codex、Claude、または他のアシスタントに貼り付けると、Skill ページを確認してインストールできます。
メニュー
Cron任务运维:诊断error状态、修复脚本缺陷、验证连接性。覆盖cron job list分析、错误分类、脚本语法验证、prompt更新、vLLM多节点负载均衡。
Codex または Claude でインストール この Prompt をコピーして Codex、Claude、または他のアシスタントに貼り付けると、Skill ページを確認してインストールできます。
引用三验 — 参考文献是否存在(L1) + 引用是否得当(L2) + 引用是否全面(L3)。三位一体验证管线,从DOI验真到语义审查到遗漏检测。
**触发条件**: 对一批论文(10-34 篇)批量处理 `step_quality_check.md` 中的 quality_score 并写入 `state.json`。
子skill | NotebookLM CLI全功能指南 — Q&A知识提取、内容生成(报告/视频/音频/信息图/幻灯片)、文献检索。响应paper-pipeline的P1阶段调用。
生产力工具 — Airtable、Google Workspace、Linear、Notion、Jupyter等。
Complete paper pipeline: retrieval, extraction, quality review, analysis, and publication.
双循环进化:内部反思(P0) + 外部吸收(P1)。Cross-project absorption methodology — multi-round cross-project comparison, active project tracking, self-expanding keyword discovery. 动灵驱动吸收(Entelechy-Driven Absorption v4.3).
| name | cron-system-maintenance |
| related_skills | [] |
| description | Cron任务运维:诊断error状态、修复脚本缺陷、验证连接性。覆盖cron job list分析、错误分类、脚本语法验证、prompt更新、vLLM多节点负载均衡。 |
| version | 1.0.0 |
| license | MIT |
| author | Synthos |
| allowed-tools | ["cronjob","terminal","read_file","write_file","skill_manage"] |
| metadata | {"synthos":{"version":"1.2.0","priority":"P1","atom_type":"pipeline","author":"Synthos","signature":"job_list -> diagnose -> fix -> verify"}} |
cron_job: str, action: str — 用户请求描述、上下文信息result: dict — cron任务执行结果对应原则:P2(机械原子暴露输入输出规范)
Cron任务运维:诊断error状态、修复脚本缺陷、验证连接性。覆盖cron job list分析、错误分类、脚本语法验证、prompt更新、vLLM多节点负载均衡。
last_status == "error"cronjob(action='list')last_status == "error"的job列表~/.hermes/cron/output/<job_id>/*.md(取最新的)timed out、Request timed out、Script timed out after 120scronjob(action='list')输出中查看skill字段,然后用ls ~/.hermes/skills/<skill_name>/SKILL.md验证存在性。如果技能缺失,从备份或Synthos/skills/恢复。--quiet)、增加间隔(--stats)、限速(--bwlimit)python3 -m py_compile / bash -n当存在多个vLLM节点时(如amax + amax-fallback),按以下原则分配cron任务:
curl -s http://<host>:8000/v1/models → HTTP 200 + 返回模型列表curl -s http://<host>:8000/v1/chat/completions -d '{"model":"...","messages":[...], "max_tokens":10}'grep "FAILED\|timed out"精确匹配,而非grep "Error"~/.hermes/cron/output/<job_id>/<date>_time.md,job_id是UUIDcustom:amax(100.100.252.99:8000)和amax-fallback(100.82.27.51:8000)的可达性\n和中文字符(✓/✗等)会导致SyntaxError: unterminated string literal。修复:将CJK字符替换为ASCII('pass'/'fail'),提取变量后拼接,避免f-string内嵌多行字符串。示例:
# 错误
report += f"| {name} | {'✓' if ok else '✗'} |\n"
# 正确
status = 'pass' if ok else 'fail'
report += f"| {name} | {status} |\n"
--stats 1s输出频繁 + 全量扫描导致120s超时。修复:先用rclone check估计大小,sync时改用--quiet+--stats 5s+--bwlimit 10M限速paper-pipeline在2026-05-31后从~/.hermes/skills/消失),该任务会持续报错。错误日志显示为RuntimeError: Request timed out或skill not found,但根因是技能缺失而非网络超时。诊断方法:在cronjob(action='list')输出中查看skill字段,然后用ls <skill_path>/SKILL.md验证存在性。如果技能缺失,从备份或Synthos/skills/恢复。这种失败会伪装成网络问题,导致误诊。skill字段值在~/.hermes/skills/下无对应目录)。这是持续失败的根因之一,需要优先检查。no_agent=true + script 模式,脚本内调用 codex exec。优势:获得 Codex 的自主规划能力。迁移步骤:1) 提取原 prompt 为 shell 脚本中的 codex exec 参数;2) 设置 script 字段;3) 选择合适 profile(hermes 用于代码任务,amax 用于进化相关);4) 验证无 PTY 环境可运行。references/cron-error-diagnosis-pattern.md — 错误分类与诊断模式references/cron-health-check-2026-06-12.md — 完整诊断记录:3个error修复 + vLLM双活验证 + provider负载均衡 + 技能缺失根因发现references/cron-failure-root-cause-diagnosis.md — 技能缺失诊断流程(Step 4),最常见误诊的修复方案references/codex-process-diagnosis-2026-06-21.md — 诊断运行中 Codex 进程在做什么:进程→会话→用户任务→报告