Run any Skill in Manus with one click

Get Started

eeg-fm-audit-systematic-evaluation

EEG基础模型系统评估和分析管道。提出ASHA基准测试、范式级消融研究、神经生理学探测(NPP)框架，确保EEG基础模型的公平评估和可解释性。

Run Skill in Manus

Overview

EEG基础模型系统评估和分析管道。提出ASHA基准测试、范式级消融研究、神经生理学探测(NPP)框架，确保EEG基础模型的公平评估和可解释性。

Install command

npx skills add https://github.com/hiyenwong/ai_collection --skill eeg-fm-audit-systematic-evaluation

Copy and paste this command into Claude Code to install the skill

Source

hiyenwong/ai_collection

Stars1

Forks0

UpdatedJune 4, 2026 at 02:00

File Explorer

4 files

SKILL.md

readonly

name	eeg-fm-audit-systematic-evaluation
description	EEG基础模型系统评估和分析管道。提出ASHA基准测试、范式级消融研究、神经生理学探测(NPP)框架，确保EEG基础模型的公平评估和可解释性。
tags	["neuroscience","eeg","foundation-model","evaluation","benchmarking","neural-decoding","interpretability","machine-learning"]
version	2.0.0
arxiv_id	2605.2691
authors	["Xianheng Wang","Yige Yang","Damien Coyle"]
published	"2026-05-26T00:00:00.000Z"
activation_keywords	["EEG基础模型","EEG foundation model","系统评估","systematic evaluation","ASHA基准","benchmarking","神经生理学探测","neurophysiological probing","NPP","消融研究","ablation study"]
updated	"2026-05-28T00:00:00.000Z"

EEG-FM-Audit: A Systematic Evaluation and Analysis Pipeline for EEG Foundation Models

研究背景

核心问题: 大型 EEG 基础模型在跨任务解码中展现出巨大潜力，但现有研究存在三个关键局限：

三大局限

不透明的监督基线调优: 基线模型的调优过程不透明，难以公平比较
复杂学习范式贡献未验证: 复杂范式（如预训练、迁移学习）的有效性未经验证
模型决策缺乏透明性: 缺乏解释模型如何利用 EEG 特征的框架

EEG-FM-Audit 框架

三大核心组件

1. ASHA驱动的基准测试协议

目的: 确保监督基线的公平比较

方法:

使用 ASHA（Asynchronous Successive Halving Algorithm）优化超参数
透明化基线模型调优过程
系统化参数搜索和评估

优势:

自动化超参数优化
确保公平比较
减少人工调优偏差

2. 范式级消融研究

目的: 评估 FM 学习范式的有效性

消融维度:

预训练方法: 自监督 vs 监督预训练
迁移学习: 任务间迁移的有效性
架构设计: 不同架构的贡献
学习范式: 不同范式组合的效果

发现:

学习范式的有效性高度依赖：
- 数据集规模
- 模型架构
- 任务类型

3. 神经生理学探测框架 (NPP)

目的: 探索 FM 是否利用有效的 EEG 特征

探测维度:

时间特征 (Temporal): EEG 时间序列特性
空间特征 (Spatial): 脑区空间分布
频谱特征 (Spectral): EEG 频段特性

框架价值:

建立可解释神经解码框架
验证模型利用生理学有效特征
揭示模型决策机制

实验设计

数据集

数量: 3个公共数据集
类型: 跨认知任务 EEG 数据
规模: 大规模多任务数据

模型对比

EEG-FMs: 4个前沿基础模型
监督模型: 5个代表性监督基线

评估指标

准确性（Accuracy）
跨任务性能（Cross-task performance）
参数效率（Parameter efficiency）
神经生理学特征利用（NPP scores）

核心发现

1. 监督基线性能

惊喜发现:

✅ 适当调优的监督基线可以匹配或超越先进的 FM
✅ 尽管参数显著更少
💡 挑战: FM 的复杂范式可能被简单方法超越

2. 学习范式有效性

关键洞察:

📊 FM 学习范式的有效性高度依赖：
- 数据规模: 大数据集效果更好
- 架构: 不同架构响应不同
🎯 启示: 不能盲目应用范式，需根据场景优化

3. 神经生理学特征利用

NPP 分析结果:

🔍 FM 利用特定的生理学特征：
- 时间特征（时序动态）
- 空间特征（脑区分布）
- 频谱特征（频段信息）
📈 建立了更可解释的神经解码框架

技术创新

ASHA 基准测试协议

传统方法:
手动调优 → 偏差结果 → 不公平比较

EEG-FM-Audit:
ASHA自动优化 → 透明流程 → 公平基线

优势:

系统化超参数搜索
透明化调优过程
可复现的基线性能

范式级消融策略

完整FM → 逐层消融 → 验证各组件贡献

消融步骤:
1. 移除预训练 → 评估贡献
2. 移除迁移 → 评估必要性
3. 简化架构 → 评估设计
4. 组合消融 → 系统验证

NPP 探测框架

模型 → 特征提取 → 生理学验证

探测维度:
Temporal: 时间序列模式 → 脑时间动态
Spatial: 脑区激活 → 空间分布特征
Spectral: 频段功率 → 频谱特性

应用价值

1. EEG 基础模型研究

提供标准化评估框架
确保公平比较
促进可复现研究

2. 神经解码应用

建立可解释解码框架
验证生理学特征利用
提高 BCI 可靠性

3. 临床应用

EEG 诊断辅助系统
可解释的神经疾病检测
跨患者 EEG 分析

关键方法论要点

⚠️ 实施陷阱

不公平基线: 未优化的基线导致 FM 看似更好
盲目范式应用: 不考虑数据规模和架构
缺乏解释性: 只关注性能忽略特征利用

✅ 最佳实践

ASHA优化: 系统化基线调优
消融验证: 验证每个范式贡献
NPP探测: 确保生理学有效性
多数据集: 跨数据集验证稳定性

实验验证

模型对比

模型类型	数量	参数量	性能
EEG-FMs	4	大	多样
监督基线	5	小	可匹配

关键发现: 小参数监督模型可匹配大参数 FM

数据集覆盖

3个公共数据集
多认知任务
大规模验证

NPP 探测结果

时间: 时序特征有效利用
空间: 脑区分布特征激活
频谱: 频段信息提取

理论贡献

1. 挑战 FM 假设

简单方法可能更有效
复杂范式需谨慎应用
参数规模不是决定因素

2. 建立评估标准

ASHA 基准测试成为标准
范式消融成为必要步骤
NPP 探测成为解释工具

3. 促进可解释神经科学

生理学特征验证
模型决策透明化
跨任务可解释解码

未来研究方向

扩展 NPP: 更多生理学特征探测
跨模态应用: EEG + MEG + fMRI
临床验证: 神经疾病诊断应用
自动化评估: 全自动化评估管道

参考文献

Wang et al. (2026) - 本论文
Li et al. (2025) - ASHA 算法
EEG 基础模型相关工作

Metadata

arXiv: 2605.26910
DOI: https://doi.org/10.48550/arXiv.2605.26910
Category: cs.LG, cs.AI, q-bio.NC
MSC Class: 68T07
Pages: 26
Submitted: 2026-05-26
Updated: 2026-05-28 (Cron Job Auto-Update)

More from this repository

same repository

attachment-representations-interbrain-synchrony

hiyenwong/ai_collection

Attachment representations in early childhood as independent endogenous driver of interbrain synchrony during remote cooperation. Novel Remote Partner-Belief Manipulation paradigm isolates attachment representations by manipulating partner-belief. EEG synchrony concentrated at P4 channel (right TPJ). Activation: attachment, interbrain synchrony, EEG hyperscanning, child-adult interaction, attachment representations, social neuroscience, partner-belief manipulation, early childhood, mother-child interaction, brain synchronization, attachment security, social-emotional development.

2026-06-041

sleep-replay-acceleration-sharp

hiyenwong/ai_collection

SHARP (Sleep-based Hierarchical Accelerated Replay) 方法论 — 睡眠启发的分层加速回放框架用于长程非平稳时序模式识别。受啮齿动物慢波睡眠中加速回放启发，通过分离记忆模块和模式识别模块实现无反向传播的长程信用分配。适用于流式时序学习、长程依赖建模、神经科学启发的 AI 架构。触发词：睡眠回放、加速回放、SHARP、时序学习、长程依赖、流式学习、慢波睡眠、hierarchical replay

2026-06-041

piston-control-two-ion-quantum

hiyenwong/ai_collection

Inverse-engineering methodology for piston operations in trapped-ion quantum devices. One ion serves as classical piston driven by Coulomb interaction with quantum-controlled ion. Stationary state determined self-consistently. Inverse-engineering protocols enable precise control of classical ion motion. Provides route toward controlled piston dynamics in microscopic quantum devices.

2026-06-041

quantum-fault-trees-minimal-cut

hiyenwong/ai_collection

Quantum fault tree analysis methodology using quantum computing. Extends classical reliability engineering fault trees to quantum domain. Identifies minimal cut sets in system reliability analysis using quantum algorithms. Applicable to safety-critical systems, cyber-physical systems, and quantum system reliability engineering.

2026-06-041

adaptive-hybrid-feature-fusion-medical

hiyenwong/ai_collection

Adaptive Hybrid Quantum-Classical Feature Fusion methodology for medical image classification. Addresses optimization asymmetries between quantum and classical paradigms using Temperature-Scaled Hybrid Fusion (TSHF), Dynamic Hybrid Fusion (DHF), and Static Hybrid Fusion (SHF) strategies. Use when designing hybrid quantum-classical ML pipelines for healthcare/medical imaging, especially when combining ResNet backbones with variational quantum circuits for diagnostic tasks.

2026-06-041

adaptive-spiking-neuron-asn

hiyenwong/ai_collection

Adaptive Spiking Neuron (ASN) methodology for vision and language modeling. Implements trainable membrane potential dynamics with adaptive firing mechanisms for efficient Spiking Neural Networks (SNNs). Activation: adaptive spiking neuron, ASN, spiking neural network vision language, SNN adaptive neuron, neuromorphic vision language model.

2026-06-041

Source

hiyenwong

hiyenwong/ai_collection

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

Useful forSOC

Biological Scientists, All OtherLife, Physical, and Social Science Occupations19-1029L4

name	eeg-fm-audit-systematic-evaluation
description	EEG基础模型系统评估和分析管道。提出ASHA基准测试、范式级消融研究、神经生理学探测(NPP)框架，确保EEG基础模型的公平评估和可解释性。
tags	["neuroscience","eeg","foundation-model","evaluation","benchmarking","neural-decoding","interpretability","machine-learning"]
version	2.0.0
arxiv_id	2605.2691
authors	["Xianheng Wang","Yige Yang","Damien Coyle"]
published	"2026-05-26T00:00:00.000Z"
activation_keywords	["EEG基础模型","EEG foundation model","系统评估","systematic evaluation","ASHA基准","benchmarking","神经生理学探测","neurophysiological probing","NPP","消融研究","ablation study"]
updated	"2026-05-28T00:00:00.000Z"

EEG-FM-Audit: A Systematic Evaluation and Analysis Pipeline for EEG Foundation Models

研究背景

核心问题: 大型 EEG 基础模型在跨任务解码中展现出巨大潜力，但现有研究存在三个关键局限：

三大局限

不透明的监督基线调优: 基线模型的调优过程不透明，难以公平比较
复杂学习范式贡献未验证: 复杂范式（如预训练、迁移学习）的有效性未经验证
模型决策缺乏透明性: 缺乏解释模型如何利用 EEG 特征的框架

EEG-FM-Audit 框架

三大核心组件

1. ASHA驱动的基准测试协议

目的: 确保监督基线的公平比较

方法:

使用 ASHA（Asynchronous Successive Halving Algorithm）优化超参数
透明化基线模型调优过程
系统化参数搜索和评估

优势:

自动化超参数优化
确保公平比较
减少人工调优偏差

2. 范式级消融研究

目的: 评估 FM 学习范式的有效性

消融维度:

预训练方法: 自监督 vs 监督预训练
迁移学习: 任务间迁移的有效性
架构设计: 不同架构的贡献
学习范式: 不同范式组合的效果

发现:

学习范式的有效性高度依赖：
- 数据集规模
- 模型架构
- 任务类型

3. 神经生理学探测框架 (NPP)

目的: 探索 FM 是否利用有效的 EEG 特征

探测维度:

时间特征 (Temporal): EEG 时间序列特性
空间特征 (Spatial): 脑区空间分布
频谱特征 (Spectral): EEG 频段特性

框架价值:

建立可解释神经解码框架
验证模型利用生理学有效特征
揭示模型决策机制

实验设计

数据集

数量: 3个公共数据集
类型: 跨认知任务 EEG 数据
规模: 大规模多任务数据

模型对比

EEG-FMs: 4个前沿基础模型
监督模型: 5个代表性监督基线

评估指标

准确性（Accuracy）
跨任务性能（Cross-task performance）
参数效率（Parameter efficiency）
神经生理学特征利用（NPP scores）

核心发现

1. 监督基线性能

惊喜发现:

✅ 适当调优的监督基线可以匹配或超越先进的 FM
✅ 尽管参数显著更少
💡 挑战: FM 的复杂范式可能被简单方法超越

2. 学习范式有效性

关键洞察:

📊 FM 学习范式的有效性高度依赖：
- 数据规模: 大数据集效果更好
- 架构: 不同架构响应不同
🎯 启示: 不能盲目应用范式，需根据场景优化

3. 神经生理学特征利用

NPP 分析结果:

🔍 FM 利用特定的生理学特征：
- 时间特征（时序动态）
- 空间特征（脑区分布）
- 频谱特征（频段信息）
📈 建立了更可解释的神经解码框架

技术创新

ASHA 基准测试协议

传统方法:
手动调优 → 偏差结果 → 不公平比较

EEG-FM-Audit:
ASHA自动优化 → 透明流程 → 公平基线

优势:

系统化超参数搜索
透明化调优过程
可复现的基线性能

范式级消融策略

完整FM → 逐层消融 → 验证各组件贡献

消融步骤:
1. 移除预训练 → 评估贡献
2. 移除迁移 → 评估必要性
3. 简化架构 → 评估设计
4. 组合消融 → 系统验证

NPP 探测框架

模型 → 特征提取 → 生理学验证

探测维度:
Temporal: 时间序列模式 → 脑时间动态
Spatial: 脑区激活 → 空间分布特征
Spectral: 频段功率 → 频谱特性

应用价值

1. EEG 基础模型研究

提供标准化评估框架
确保公平比较
促进可复现研究

2. 神经解码应用

建立可解释解码框架
验证生理学特征利用
提高 BCI 可靠性

3. 临床应用

EEG 诊断辅助系统
可解释的神经疾病检测
跨患者 EEG 分析

关键方法论要点

⚠️ 实施陷阱

不公平基线: 未优化的基线导致 FM 看似更好
盲目范式应用: 不考虑数据规模和架构
缺乏解释性: 只关注性能忽略特征利用

✅ 最佳实践

ASHA优化: 系统化基线调优
消融验证: 验证每个范式贡献
NPP探测: 确保生理学有效性
多数据集: 跨数据集验证稳定性

实验验证

模型对比

模型类型	数量	参数量	性能
EEG-FMs	4	大	多样
监督基线	5	小	可匹配

关键发现: 小参数监督模型可匹配大参数 FM

数据集覆盖

3个公共数据集
多认知任务
大规模验证

NPP 探测结果

时间: 时序特征有效利用
空间: 脑区分布特征激活
频谱: 频段信息提取

理论贡献

1. 挑战 FM 假设

简单方法可能更有效
复杂范式需谨慎应用
参数规模不是决定因素

2. 建立评估标准

ASHA 基准测试成为标准
范式消融成为必要步骤
NPP 探测成为解释工具

3. 促进可解释神经科学

生理学特征验证
模型决策透明化
跨任务可解释解码

未来研究方向

扩展 NPP: 更多生理学特征探测
跨模态应用: EEG + MEG + fMRI
临床验证: 神经疾病诊断应用
自动化评估: 全自动化评估管道

参考文献

Wang et al. (2026) - 本论文
Li et al. (2025) - ASHA 算法
EEG 基础模型相关工作