Run any Skill in Manus with one click

Get Started

snr-sample-size-representational-alignment

信噪比和样本数量调控神经网络表征对齐的方法论。研究神经网络潜在表征的通用性规律，揭示对齐与数据质量和数量的非平凡依赖关系。适用于表征对齐分析、神经网络可解释性、训练优化。触发词：表征对齐、SNR、样本数量、插值阈值、通用表征。

Run Skill in Manus

Overview

Install command

npx skills add https://github.com/hiyenwong/ai_collection --skill snr-sample-size-representational-alignment

Copy and paste this command into Claude Code to install the skill

Source

hiyenwong/ai_collection

Stars1

Forks0

UpdatedJune 4, 2026 at 02:00

SKILL.md

readonly

name	snr-sample-size-representational-alignment
description	信噪比和样本数量调控神经网络表征对齐的方法论。研究神经网络潜在表征的通用性规律，揭示对齐与数据质量和数量的非平凡依赖关系。适用于表征对齐分析、神经网络可解释性、训练优化。触发词：表征对齐、SNR、样本数量、插值阈值、通用表征。
license	Complete terms in LICENSE.txt
metadata	{"arxiv_id":"2605.26973","published":"2026-05-26","authors":"Ali Hussaini Umar, Alessandro Laio","tags":["neuroscience","representational-alignment","SNR","sample-size","neural-networks","interpolation-threshold","generalization"]}

Signal-to-Noise Ratio and Sample Size Govern Representational Alignment

研究背景

神经网络开发出的潜在表征在不同架构、训练协议或训练数据集之间表现出"通用性"(universality)，即结构相似性。这种现象在脑科学和人工智能中都有重要意义，但其控制因素尚不清楚。

核心方法论

控制实验设置

训练网络集合在回归和分类任务上，使用独立噪声过程扰动的训练集。通过控制实验揭示：

信噪比 (SNR) 对表征对齐的影响
训练样本数量 对表征对齐的影响

关键发现

SNR 和样本数量的影响模式

一致性发现（跨越线性和非线性网络、回归和分类任务、合成和真实数据）：

对齐随 SNR 单调变化：数据质量越高，对齐越强
对齐随样本数量非单调变化：在插值阈值附近最小化

插值阈值现象

关键洞察：

对齐在插值阈值（训练样本数量接近模型容量）附近达到最小值
更强的对齐不一定对应更好的泛化误差
对齐与泛化性能解耦

简化网络分析

理论基础：

极简单隐层网络的表征对齐可解析估计
为复杂网络提供理论验证基准
相同模式在不同复杂度网络中重现

数学框架

表征相似性度量

使用表征相似性分析 (RSA) 或中心核对齐 (CKA)： $$\text{Alignment} = \frac{\langle R_1, R_2 \rangle_F}{|R_1|_F |R_2|_F}$$

其中 $R_1, R_2$ 为两个网络的表征矩阵。

SNR 依赖性

$$\text{Alignment} \sim \frac{1}{1 + \sigma_{noise}^2 / \sigma_{signal}^2}$$

对齐随信噪比增加而单调增强。

样本数量依赖性

非单调关系：

样本数 $\ll$ 容量：过拟合主导，表征特异性强
样本数 $\approx$ 容量：插值阈值，对齐最小化
样本数 $\gg$ 容量：数据主导，对齐增强但泛化不一定改善

实验验证

跨架构一致性

验证网络：

简单线性回归网络
单隐层非线性网络
深度 CNN
ResNet 架构

所有架构均展现相同模式：SNR 单调、样本数非单调。

跨任务一致性

任务类型：

合成数据回归
MNIST 分类
CIFAR-10 分类
真实世界数据集

所有任务均展现相同模式。

应用指导

训练优化

数据质量优先：

提高数据 SNR 直接增强表征稳定性
降低噪声比增加样本数量更有效（对齐角度）

样本数量策略：

避免样本数量接近插值阈值（对齐最不稳定）
过渡到"数据主导"区域时需谨慎评估泛化性能

表征分析

对齐 ≠ 泛化：

不要假设强对齐必然带来好泛化
评估模型时需分别考量表征稳定性和性能
插值阈值区域需特别关注

跨模型比较

最佳实践：

确保比较的模型处于相同的 SNR 条件
确保样本数量远离插值阈值
使用多种对齐度量验证一致性

关键洞察

数据质量主导

核心结论：表征对齐主要由数据质量 (SNR) 控制，而非模型架构或训练协议。

插值阈值的临界性

理论意义：插值阈值不仅影响泛化（double descent），也影响表征稳定性。

表征与性能的解耦

实践启示：强表征对齐不保证高性能，需独立评估两个维度。

实验设计建议

表征对齐实验

推荐流程：

控制 SNR（固定噪声方差）
测试多个样本数量（跨越插值阈值）
使用不同架构验证一致性
同时评估对齐和泛化

数据增强策略

噪声注入：测试 SNR 依赖性
样本扩充：跨越插值阈值测试
质量优化：优先降低噪声而非增加样本

Activation Keywords

representational alignment
SNR alignment
sample size alignment
interpolation threshold
universal representations
RSA alignment
CKA alignment
neural representation stability

参考文献

arXiv:2605.26973 [stat.ML] - Submitted 26 May 2026

More from this repository

same repository

attachment-representations-interbrain-synchrony

hiyenwong/ai_collection

Attachment representations in early childhood as independent endogenous driver of interbrain synchrony during remote cooperation. Novel Remote Partner-Belief Manipulation paradigm isolates attachment representations by manipulating partner-belief. EEG synchrony concentrated at P4 channel (right TPJ). Activation: attachment, interbrain synchrony, EEG hyperscanning, child-adult interaction, attachment representations, social neuroscience, partner-belief manipulation, early childhood, mother-child interaction, brain synchronization, attachment security, social-emotional development.

2026-06-041

sleep-replay-acceleration-sharp

hiyenwong/ai_collection

SHARP (Sleep-based Hierarchical Accelerated Replay) 方法论 — 睡眠启发的分层加速回放框架用于长程非平稳时序模式识别。受啮齿动物慢波睡眠中加速回放启发，通过分离记忆模块和模式识别模块实现无反向传播的长程信用分配。适用于流式时序学习、长程依赖建模、神经科学启发的 AI 架构。触发词：睡眠回放、加速回放、SHARP、时序学习、长程依赖、流式学习、慢波睡眠、hierarchical replay

2026-06-041

piston-control-two-ion-quantum

hiyenwong/ai_collection

Inverse-engineering methodology for piston operations in trapped-ion quantum devices. One ion serves as classical piston driven by Coulomb interaction with quantum-controlled ion. Stationary state determined self-consistently. Inverse-engineering protocols enable precise control of classical ion motion. Provides route toward controlled piston dynamics in microscopic quantum devices.

2026-06-041

quantum-fault-trees-minimal-cut

hiyenwong/ai_collection

Quantum fault tree analysis methodology using quantum computing. Extends classical reliability engineering fault trees to quantum domain. Identifies minimal cut sets in system reliability analysis using quantum algorithms. Applicable to safety-critical systems, cyber-physical systems, and quantum system reliability engineering.

2026-06-041

adaptive-hybrid-feature-fusion-medical

hiyenwong/ai_collection

Adaptive Hybrid Quantum-Classical Feature Fusion methodology for medical image classification. Addresses optimization asymmetries between quantum and classical paradigms using Temperature-Scaled Hybrid Fusion (TSHF), Dynamic Hybrid Fusion (DHF), and Static Hybrid Fusion (SHF) strategies. Use when designing hybrid quantum-classical ML pipelines for healthcare/medical imaging, especially when combining ResNet backbones with variational quantum circuits for diagnostic tasks.

2026-06-041

adaptive-spiking-neuron-asn

hiyenwong/ai_collection

Adaptive Spiking Neuron (ASN) methodology for vision and language modeling. Implements trainable membrane potential dynamics with adaptive firing mechanisms for efficient Spiking Neural Networks (SNNs). Activation: adaptive spiking neuron, ASN, spiking neural network vision language, SNN adaptive neuron, neuromorphic vision language model.

2026-06-041

Source

hiyenwong

hiyenwong/ai_collection

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

Useful forSOC

Physical Scientists, All OtherLife, Physical, and Social Science Occupations19-2099L4

name	snr-sample-size-representational-alignment
description	信噪比和样本数量调控神经网络表征对齐的方法论。研究神经网络潜在表征的通用性规律，揭示对齐与数据质量和数量的非平凡依赖关系。适用于表征对齐分析、神经网络可解释性、训练优化。触发词：表征对齐、SNR、样本数量、插值阈值、通用表征。
license	Complete terms in LICENSE.txt
metadata	{"arxiv_id":"2605.26973","published":"2026-05-26","authors":"Ali Hussaini Umar, Alessandro Laio","tags":["neuroscience","representational-alignment","SNR","sample-size","neural-networks","interpolation-threshold","generalization"]}

Signal-to-Noise Ratio and Sample Size Govern Representational Alignment

研究背景

核心方法论

控制实验设置

训练网络集合在回归和分类任务上，使用独立噪声过程扰动的训练集。通过控制实验揭示：

信噪比 (SNR) 对表征对齐的影响
训练样本数量 对表征对齐的影响

关键发现

SNR 和样本数量的影响模式

一致性发现（跨越线性和非线性网络、回归和分类任务、合成和真实数据）：

对齐随 SNR 单调变化：数据质量越高，对齐越强
对齐随样本数量非单调变化：在插值阈值附近最小化

插值阈值现象

关键洞察：

对齐在插值阈值（训练样本数量接近模型容量）附近达到最小值
更强的对齐不一定对应更好的泛化误差
对齐与泛化性能解耦

简化网络分析

理论基础：

极简单隐层网络的表征对齐可解析估计
为复杂网络提供理论验证基准
相同模式在不同复杂度网络中重现

数学框架

表征相似性度量

使用表征相似性分析 (RSA) 或中心核对齐 (CKA)： $$\text{Alignment} = \frac{\langle R_1, R_2 \rangle_F}{|R_1|_F |R_2|_F}$$

其中 $R_1, R_2$ 为两个网络的表征矩阵。

SNR 依赖性

$$\text{Alignment} \sim \frac{1}{1 + \sigma_{noise}^2 / \sigma_{signal}^2}$$

对齐随信噪比增加而单调增强。

样本数量依赖性

非单调关系：

样本数 $\ll$ 容量：过拟合主导，表征特异性强
样本数 $\approx$ 容量：插值阈值，对齐最小化
样本数 $\gg$ 容量：数据主导，对齐增强但泛化不一定改善

实验验证

跨架构一致性

验证网络：

简单线性回归网络
单隐层非线性网络
深度 CNN
ResNet 架构

所有架构均展现相同模式：SNR 单调、样本数非单调。

跨任务一致性

任务类型：

合成数据回归
MNIST 分类
CIFAR-10 分类
真实世界数据集

所有任务均展现相同模式。

应用指导

训练优化

数据质量优先：

提高数据 SNR 直接增强表征稳定性
降低噪声比增加样本数量更有效（对齐角度）

样本数量策略：

避免样本数量接近插值阈值（对齐最不稳定）
过渡到"数据主导"区域时需谨慎评估泛化性能

表征分析

对齐 ≠ 泛化：

不要假设强对齐必然带来好泛化
评估模型时需分别考量表征稳定性和性能
插值阈值区域需特别关注

跨模型比较

最佳实践：

确保比较的模型处于相同的 SNR 条件
确保样本数量远离插值阈值
使用多种对齐度量验证一致性

关键洞察

数据质量主导

核心结论：表征对齐主要由数据质量 (SNR) 控制，而非模型架构或训练协议。

插值阈值的临界性

理论意义：插值阈值不仅影响泛化（double descent），也影响表征稳定性。

表征与性能的解耦

实践启示：强表征对齐不保证高性能，需独立评估两个维度。

实验设计建议

表征对齐实验

推荐流程：

控制 SNR（固定噪声方差）
测试多个样本数量（跨越插值阈值）
使用不同架构验证一致性
同时评估对齐和泛化

数据增强策略

噪声注入：测试 SNR 依赖性
样本扩充：跨越插值阈值测试
质量优化：优先降低噪声而非增加样本

Activation Keywords

representational alignment
SNR alignment
sample size alignment
interpolation threshold
universal representations
RSA alignment
CKA alignment
neural representation stability

参考文献

arXiv:2605.26973 [stat.ML] - Submitted 26 May 2026