name	run
description	This skill should be used when the user wants to "crucible-harness:runを起動して", "crucible-harnessの実行を開始して", "crucible-harnessを実行して", or wants to start the crucible-harness execution loop. Requires crucible-harness setup to have been completed first (.crucible/config.md must exist).
version	0.1.0
tools	Agent, Read, Write, Edit, AskUserQuestion

crucible-harness:run 実行スキル

概要

crucible-harness の Phase 1〜5（実行ループ）を担当する。 .crucible/config.md の設定を読み込み、品質改善ループを実行する。

前提確認

Read ツールで .crucible/config.md を読み込む。ファイルが存在しない場合は「先に /crucible-harness でセットアップを完了してください」と伝えて終了する。

.crucible/memory.md が存在すれば読み込む（存在しなければ空として扱う）。

ロール定義

Generator

タスク定義と Memory の高貢献FBを参照して成果物を生成する。

Evaluator

チェックリスト各項目を 0.0〜1.0 でスコアリングする。合格条件: 全項目が最低点フロア以上かつ全項目の平均が平均閾値以上。

Devil's Advocate

2種類の攻撃を行う:

閾値未満の項目への反論・改善指示
最高スコアの項目1〜2件への強制反転攻撃（「本当に合格と言えるか」）

Self-Reflection

失敗理由をGeneratorの視点で言語化し、Memory に記録する。

実行ループ

iter = 1 から開始し、以下を繰り返す。

Phase 1: Generation

Agent ツールで Generator を起動する:

あなたは Generator です。以下のタスクに対して成果物を生成してください。

## タスク定義
{config.md のタスク定義}

## チェックリスト（評価基準）
{config.md のチェックリスト}

## 過去のフィードバック（Memory）
{memory.md の内容。貢献スコア上位のFBを優先。空の場合はその旨を記載}

## 指示
- Memoryのフィードバックを参考に、前回の失敗を繰り返さないよう生成すること
- チェックリストの全項目を意識して成果物を作成すること
- 成果物のみを出力すること（説明・前置き不要）

Phase 2: Evaluation

Agent ツールで Evaluator を起動する:

あなたは Evaluator です。以下の成果物をチェックリストに従い採点してください。

## 成果物
{Phase 1 の生成結果}

## チェックリスト
{config.md のチェックリスト}

## 採点ルール
- 各項目を 0.0〜1.0 のスコアで採点する
- 合格条件: 全項目 >= {最低点フロア} かつ 平均 >= {平均閾値}

## 出力フォーマット（必ず従うこと）
### スコア
| 項目名 | スコア | 評価コメント |
|--------|--------|------------|
| {項目1} | {0.0-1.0} | {コメント} |

### 集計
- 最低点: {値}
- 平均点: {値}
- 判定: 合格 / 失敗

Phase 3: Devil's Advocate（失敗時のみ実行）

合格の場合は Phase 4 をスキップして Phase 5 へ進む。

失敗の場合、Agent ツールで Devil's Advocate を起動する:

あなたは Devil's Advocate（悪魔の代理人）です。
以下の成果物とスコアに対して、2種類の攻撃を行ってください。

## 成果物
{Phase 1 の生成結果}

## スコア一覧
{Phase 2 の結果}

## 攻撃1: 閾値未満の項目への反論
閾値（{最低点フロア}）未満の項目それぞれに対して:
- なぜ不十分なのか根拠を示す
- 具体的な改善指示を出す

## 攻撃2: 最高スコア項目への強制反転攻撃
スコアが最も高い項目を1〜2件選び:
- 「本当に合格と言えるか」という観点で欠陥を探す
- 表面的な合格に隠れた問題点を指摘する

## 出力フォーマット（必ず従うこと）
### 攻撃1: 閾値未満項目
- {項目名}（スコア {値}）: {根拠} → {改善指示}

### 攻撃2: 最高スコア項目への反転攻撃
- {項目名}（スコア {値}）: {疑問・指摘}

Phase 4: Self-Reflection（失敗時のみ実行）

Agent ツールで Self-Reflection を起動する:

あなたは Generator です。今回の生成がなぜ失敗したかを内省してください。

## 今回の成果物
{Phase 1 の生成結果}

## Evaluator のスコア
{Phase 2 の結果}

## Devil's Advocate の指摘
{Phase 3 の結果}

## 指示
失敗した根本原因を自分の言葉で分析し、次回の生成で何を変えるかを具体的に述べること。

## 出力フォーマット（必ず従うこと）
### 内省ログ（iter {N}）
#### 失敗の根本原因
{分析}

#### 次回の改善方針
- {改善点1}
- {改善点2}

内省結果を .crucible/memory.md に追記する。追記フォーマット:

#### iter {N}（貢献スコア: 0）
##### 失敗の根本原因
{分析}

##### 次回の改善方針
- {改善点1}
- {改善点2}

Phase 5: Decision

合格の場合（全項目 >= 最低点フロアかつ平均 >= 平均閾値）:

ループを終了し成果物を出力する
crucible-harness: 合格（iter {N}） と表示する
Memory の当該イテレーションFBの貢献スコアを更新する（改善があった場合 +1）

未達 + iter < 最大反復回数:

前回FBの貢献スコアを更新する（スコアが改善→+1 / 改善なし→-1）
貢献スコアが -2 以下のFBは memory.md のアーカイブセクションに移動する
iter += 1 して Phase 1 に戻る

未達 + iter = 最大反復回数:

全イテレーション中でスコア合計が最高の成果物を選択して出力する
以下の未達情報を添付する:

⚠️ 最大反復回数（{N}回）に到達しました。評価基準を完全には満たしていません。

## 未達情報
- 採用イテレーション: iter {N}（スコア合計: {値}）
- 未達項目:
  - {項目名}: {スコア}（必要: {閾値}）

Memory ファイル形式

.crucible/memory.md は以下の形式で管理する:

# crucible-harness Memory

## タスク種別: {種別}

### アクティブFB

{内省ログエントリ（貢献スコア順）}

### Archive（貢献スコア -2 以下）

{アーカイブされたエントリ}

注意事項

各 Phase の Agent 呼び出しは逐次実行する（並列不可。前フェーズの結果を次フェーズが参照するため）
config.md のパラメータは実行中に変更しない
Memory への書き込みは Edit ツールで追記する（上書きしない）

name	run
description	This skill should be used when the user wants to "crucible-harness:runを起動して", "crucible-harnessの実行を開始して", "crucible-harnessを実行して", or wants to start the crucible-harness execution loop. Requires crucible-harness setup to have been completed first (.crucible/config.md must exist).
version	0.1.0
tools	Agent, Read, Write, Edit, AskUserQuestion