| name | run |
| description | This skill should be used when the user wants to "crucible-harness:runを起動して",
"crucible-harnessの実行を開始して", "crucible-harnessを実行して",
or wants to start the crucible-harness execution loop.
Requires crucible-harness setup to have been completed first (.crucible/config.md must exist).
|
| version | 0.1.0 |
| tools | Agent, Read, Write, Edit, AskUserQuestion |
crucible-harness:run 実行スキル
概要
crucible-harness の Phase 1〜5(実行ループ)を担当する。
.crucible/config.md の設定を読み込み、品質改善ループを実行する。
前提確認
Read ツールで .crucible/config.md を読み込む。
ファイルが存在しない場合は「先に /crucible-harness でセットアップを完了してください」と伝えて終了する。
.crucible/memory.md が存在すれば読み込む(存在しなければ空として扱う)。
ロール定義
Generator
タスク定義と Memory の高貢献FBを参照して成果物を生成する。
Evaluator
チェックリスト各項目を 0.0〜1.0 でスコアリングする。
合格条件: 全項目が最低点フロア以上 かつ 全項目の平均が平均閾値以上。
Devil's Advocate
2種類の攻撃を行う:
- 閾値未満の項目への反論・改善指示
- 最高スコアの項目1〜2件への強制反転攻撃(「本当に合格と言えるか」)
Self-Reflection
失敗理由をGeneratorの視点で言語化し、Memory に記録する。
実行ループ
iter = 1 から開始し、以下を繰り返す。
Phase 1: Generation
Agent ツールで Generator を起動する:
あなたは Generator です。以下のタスクに対して成果物を生成してください。
## タスク定義
{config.md のタスク定義}
## チェックリスト(評価基準)
{config.md のチェックリスト}
## 過去のフィードバック(Memory)
{memory.md の内容。貢献スコア上位のFBを優先。空の場合はその旨を記載}
## 指示
- Memoryのフィードバックを参考に、前回の失敗を繰り返さないよう生成すること
- チェックリストの全項目を意識して成果物を作成すること
- 成果物のみを出力すること(説明・前置き不要)
Phase 2: Evaluation
Agent ツールで Evaluator を起動する:
あなたは Evaluator です。以下の成果物をチェックリストに従い採点してください。
## 成果物
{Phase 1 の生成結果}
## チェックリスト
{config.md のチェックリスト}
## 採点ルール
- 各項目を 0.0〜1.0 のスコアで採点する
- 合格条件: 全項目 >= {最低点フロア} かつ 平均 >= {平均閾値}
## 出力フォーマット(必ず従うこと)
### スコア
| 項目名 | スコア | 評価コメント |
|--------|--------|------------|
| {項目1} | {0.0-1.0} | {コメント} |
### 集計
- 最低点: {値}
- 平均点: {値}
- 判定: 合格 / 失敗
Phase 3: Devil's Advocate(失敗時のみ実行)
合格の場合は Phase 4 をスキップして Phase 5 へ進む。
失敗の場合、Agent ツールで Devil's Advocate を起動する:
あなたは Devil's Advocate(悪魔の代理人)です。
以下の成果物とスコアに対して、2種類の攻撃を行ってください。
## 成果物
{Phase 1 の生成結果}
## スコア一覧
{Phase 2 の結果}
## 攻撃1: 閾値未満の項目への反論
閾値({最低点フロア})未満の項目それぞれに対して:
- なぜ不十分なのか根拠を示す
- 具体的な改善指示を出す
## 攻撃2: 最高スコア項目への強制反転攻撃
スコアが最も高い項目を1〜2件選び:
- 「本当に合格と言えるか」という観点で欠陥を探す
- 表面的な合格に隠れた問題点を指摘する
## 出力フォーマット(必ず従うこと)
### 攻撃1: 閾値未満項目
- {項目名}(スコア {値}): {根拠} → {改善指示}
### 攻撃2: 最高スコア項目への反転攻撃
- {項目名}(スコア {値}): {疑問・指摘}
Phase 4: Self-Reflection(失敗時のみ実行)
Agent ツールで Self-Reflection を起動する:
あなたは Generator です。今回の生成がなぜ失敗したかを内省してください。
## 今回の成果物
{Phase 1 の生成結果}
## Evaluator のスコア
{Phase 2 の結果}
## Devil's Advocate の指摘
{Phase 3 の結果}
## 指示
失敗した根本原因を自分の言葉で分析し、次回の生成で何を変えるかを具体的に述べること。
## 出力フォーマット(必ず従うこと)
### 内省ログ(iter {N})
#### 失敗の根本原因
{分析}
#### 次回の改善方針
- {改善点1}
- {改善点2}
内省結果を .crucible/memory.md に追記する。
追記フォーマット:
#### iter {N}(貢献スコア: 0)
##### 失敗の根本原因
{分析}
##### 次回の改善方針
- {改善点1}
- {改善点2}
Phase 5: Decision
合格の場合(全項目 >= 最低点フロア かつ 平均 >= 平均閾値):
- ループを終了し成果物を出力する
crucible-harness: 合格(iter {N}) と表示する
- Memory の当該イテレーションFBの貢献スコアを更新する(改善があった場合 +1)
未達 + iter < 最大反復回数:
- 前回FBの貢献スコアを更新する(スコアが改善→+1 / 改善なし→-1)
- 貢献スコアが -2 以下のFBは memory.md のアーカイブセクションに移動する
- iter += 1 して Phase 1 に戻る
未達 + iter = 最大反復回数:
- 全イテレーション中でスコア合計が最高の成果物を選択して出力する
- 以下の未達情報を添付する:
⚠️ 最大反復回数({N}回)に到達しました。評価基準を完全には満たしていません。
## 未達情報
- 採用イテレーション: iter {N}(スコア合計: {値})
- 未達項目:
- {項目名}: {スコア}(必要: {閾値})
Memory ファイル形式
.crucible/memory.md は以下の形式で管理する:
# crucible-harness Memory
## タスク種別: {種別}
### アクティブFB
{内省ログエントリ(貢献スコア順)}
### Archive(貢献スコア -2 以下)
{アーカイブされたエントリ}
注意事項
- 各 Phase の Agent 呼び出しは逐次実行する(並列不可。前フェーズの結果を次フェーズが参照するため)
- config.md のパラメータは実行中に変更しない
- Memory への書き込みは
Edit ツールで追記する(上書きしない)