一键导入
scientific-eda-correlation
探索的データ解析(EDA)と相関分析のスキル。データの分布可視化、相関ヒートマップ、 散布図行列の作成を行う際に使用。Scientific Skills Exp-02, 12, 13 で確立したパターン。
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
菜单
探索的データ解析(EDA)と相関分析のスキル。データの分布可視化、相関ヒートマップ、 散布図行列の作成を行う際に使用。Scientific Skills Exp-02, 12, 13 で確立したパターン。
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
基于 SOC 职业分类
実験の監査レポート・データ来歴(プロベナンス)生成スキル。 データ変換履歴・使用ツールのバージョン・データ整合性チェックを 含むトレーサビリティレポートを自動生成する。 「監査レポート作成」「データ来歴を記録」「トレーサビリティ」で発火。
派生実験設計スキル。既存の実験をベースに条件を変更した派生実験を 設計する。実験計画法(DOE)に基づくパラメータ探索を支援。 「派生実験を設計して」「条件を変えて実験」「パラメータ探索」で発火。
実験テンプレート生成スキル。研究目的・仮説・手法・実験条件・評価基準・ スケジュールを構造化した実験計画書を自動作成する。 「実験テンプレート作成して」「実験計画を立てて」「実験プロトコルを作成」で発火。
実験結果を論文形式(LaTeX / IMRaD)にエクスポートするスキル。 Introduction・Materials & Methods・Results・Discussion の構造で 出版準備用の原稿を自動生成する。 「論文にして」「LaTeX出力」「出版準備」で発火。
実験結果の査読・レビュースキル。再現性・統計的妥当性・方法論の 健全性を体系的に評価し、構造化されたレビューレポートを生成する。 「レビューして」「査読して」「実験結果を評価して」で発火。
科学技術・学術論文の執筆スキル。IMRaD 標準、Nature/Science 系、ACS 系、IEEE 系、 Elsevier 系のジャーナル形式に対応した論文構成・セクション設計・文章パターンを提供。 「論文を書いて」「Abstract を作成して」「Methods セクションを書いて」で発火。 assets/ に主要ジャーナル形式の Markdown テンプレートを同梱。
| name | scientific-eda-correlation |
| description | 探索的データ解析(EDA)と相関分析のスキル。データの分布可視化、相関ヒートマップ、 散布図行列の作成を行う際に使用。Scientific Skills Exp-02, 12, 13 で確立したパターン。 |
| tu_tools | [{"key":"biotools","name":"bio.tools","description":"統計解析ツール検索"}] |
探索的データ解析(Exploratory Data Analysis)のパイプラインスキル。 データ理解の初期段階で使用し、分布・外れ値・変数間相関を把握する。
import pandas as pd
import numpy as np
def descriptive_statistics(df, numeric_cols, group_col=None):
"""記述統計量を算出して CSV に保存する。"""
if group_col:
stats = df.groupby(group_col)[numeric_cols].describe()
else:
stats = df[numeric_cols].describe()
stats.to_csv("results/descriptive_statistics.csv")
return stats
import matplotlib.pyplot as plt
import seaborn as sns
def plot_distributions(df, variables, group_col, figsize=(20, 16), ncols=3):
"""群別のボックスプロットを変数ごとに描画する。"""
nrows = (len(variables) + ncols - 1) // ncols
fig, axes = plt.subplots(nrows, ncols, figsize=figsize)
axes = axes.flatten()
for i, var in enumerate(variables):
sns.boxplot(data=df, x=group_col, y=var, ax=axes[i],
palette="Set2", showfliers=True)
axes[i].set_title(var, fontsize=12, fontweight="bold")
axes[i].tick_params(axis="x", rotation=45)
for j in range(i + 1, len(axes)):
axes[j].set_visible(False)
plt.tight_layout()
plt.savefig("figures/distribution_boxplots.png", dpi=300, bbox_inches="tight")
plt.close()
def plot_correlation_heatmap(df, numeric_cols, block_boundaries=None,
figsize=(14, 12), method="pearson"):
"""
相関ヒートマップを描画する。
block_boundaries: PSP などの階層境界を示す線の位置リスト(オプション)。
"""
corr = df[numeric_cols].corr(method=method)
fig, ax = plt.subplots(figsize=figsize)
mask = np.triu(np.ones_like(corr, dtype=bool), k=1)
sns.heatmap(corr, mask=mask, annot=True, fmt=".2f",
cmap="RdBu_r", center=0, vmin=-1, vmax=1,
square=True, linewidths=0.5, ax=ax,
annot_kws={"size": 8})
# 階層境界線(PSP ブロック分離)
if block_boundaries:
for b in block_boundaries:
ax.axhline(y=b, color="black", linewidth=2)
ax.axvline(x=b, color="black", linewidth=2)
ax.set_title("Correlation Heatmap", fontsize=14, fontweight="bold")
plt.tight_layout()
plt.savefig("figures/correlation_heatmap.png", dpi=300, bbox_inches="tight")
plt.close()
return corr
def plot_scatter_matrix(df, variables, hue_col, figsize=(16, 14)):
"""主要変数の散布図行列を描画する。"""
g = sns.pairplot(df[variables + [hue_col]], hue=hue_col,
diag_kind="kde", palette="Set2",
plot_kws={"alpha": 0.6, "s": 30})
g.fig.suptitle("Scatter Matrix", y=1.02, fontsize=14, fontweight="bold")
plt.savefig("figures/scatter_matrix.png", dpi=300, bbox_inches="tight")
plt.close()
def psp_block_correlation(df, process_cols, structure_cols, property_cols):
"""Process→Structure→Property の 3 ブロック相関を個別に算出する。"""
ps_corr = df[process_cols + structure_cols].corr().loc[process_cols, structure_cols]
sp_corr = df[structure_cols + property_cols].corr().loc[structure_cols, property_cols]
pp_corr = df[process_cols + property_cols].corr().loc[process_cols, property_cols]
ps_corr.to_csv("results/PSP_process_structure_corr.csv")
sp_corr.to_csv("results/PSP_structure_property_corr.csv")
pp_corr.to_csv("results/PSP_process_property_corr.csv")
return ps_corr, sp_corr, pp_corr
| TU Key | ツール名 | 連携内容 |
|---|---|---|
biotools | bio.tools | 統計解析ツール検索 |
| ファイル | 形式 |
|---|---|
results/descriptive_statistics.csv | CSV |
figures/distribution_boxplots.png | PNG (300 DPI) |
figures/correlation_heatmap.png | PNG (300 DPI) |
figures/scatter_matrix.png | PNG (300 DPI) |
sns.heatmap 相関ヒートマップの基本パターン