Jeden Skill in Manus ausführen
mit einem Klick

Jeden Skill in Manus mit einem Klick ausführen

$pwd:

pymc-testing

Name: Pymc Testing
Author: pymc-labs

// Load when writing or modifying pytest tests that touch pymc.Model, pm.sample, or any PyMC model code. Covers pymc.testing.mock_sample, pytest fixtures for Bayesian models, and the distinction between fast structure-only tests (mocking) and slow posterior inference tests. Triggers include: testing PyMC, pytest with pymc, unit tests for Bayesian models, mock sampling, test fixtures for models, CI/CD for PyMC.

In Manus ausführen

$ git log --oneline --stat

stars:3

forks:0

updated:21. Mai 2026 um 15:18

Datei-Explorer

2 Dateien

SKILL.md

readonly

name

pymc-testing

description

Load when writing or modifying pytest tests that touch pymc.Model, pm.sample, or any PyMC model code. Covers pymc.testing.mock_sample, pytest fixtures for Bayesian models, and the distinction between fast structure-only tests (mocking) and slow posterior inference tests. Triggers include: testing PyMC, pytest with pymc, unit tests for Bayesian models, mock sampling, test fixtures for models, CI/CD for PyMC.

PyMC Testing

PyMC provides testing utilities to speed up test suites by mocking MCMC sampling with prior predictive sampling. This is useful for checking model structure without running expensive inference.

Mock Sampling vs Real Sampling

Aspect	Mock Sampling	Real Sampling
Speed	Fast (seconds)	Slow (minutes)
Use case	Model structure, downstream code	Posterior values, convergence
Output	`prior`, `prior_predictive`	Full `posterior`, `sample_stats`, warmup groups
Divergences	Mocked (configurable)	Real diagnostics

Use mocking when: Testing model specification, CI/CD pipelines, plotting code, API integration, serialization.

Use real sampling when: Checking posterior values, ESS/r_hat diagnostics, LOO-CV, model comparison. See pymc-modeling skill for real inference.

PyMC Testing Utilities

See: https://www.pymc.io/projects/docs/en/latest/api/testing.html

mock_sample

Replaces pm.sample() with prior predictive sampling:

from functools import partial
import numpy as np
import pymc as pm
from pymc.testing import mock_sample

# Basic usage - replaces pm.sample
pm.sample = mock_sample

with pm.Model() as model:
    pm.Normal("x", 0, 1)
    idata = pm.sample()  # Uses prior predictive, not MCMC

mock_sample_setup_and_teardown

Pytest fixture helper for setup/tear-down:

# conftest.py
import pytest
from pymc.testing import mock_sample_setup_and_teardown

mock_pymc_sample = pytest.fixture(scope="function")(mock_sample_setup_and_teardown)

# test_model.py
def test_model_runs(mock_pymc_sample):
    with pm.Model() as model:
        pm.Normal("x", 0, 1)
        idata = pm.sample()
        assert "x" in idata["posterior"]

A production-ready example from pymc-marketing:

conftest.py: https://github.com/pymc-labs/pymc-marketing/blob/main/tests/conftest.py
Also configures pytest markers for slow tests with --run-slow / --only-slow CLI options

Distribution testing helpers

pymc.testing also exposes helpers for validating custom distributions against their analytic log-CDFs. In PyMC 6, both forms are available:

from pymc.testing import check_logcdf, check_logccdf

check_logcdf(MyDist, domain, params)   # log CDF
check_logccdf(MyDist, domain, params)  # log complementary CDF (log survival)

Mocking Sample Stats

By default, no sample_stats are created. Pass a dictionary to mock specific stats:

from functools import partial
import numpy as np
import pymc as pm
from pymc.testing import mock_sample

def mock_diverging(size):
    return np.zeros(size, dtype=int)

def mock_tree_depth(size):
    return np.random.choice(range(2, 10), size=size)

mock_sample_with_stats = partial(
    mock_sample,
    sample_stats={
        "diverging": mock_diverging,
        "tree_depth": mock_tree_depth,
    },
)

pm.sample = mock_sample_with_stats

Example from pymc-marketing:

from functools import partial
import numpy as np
import pymc as pm
import pymc.testing

def mock_diverging(size):
    return np.zeros(size, dtype=int)

pm.sample = partial(
    pymc.testing.mock_sample,
    sample_stats={"diverging": mock_diverging},
)
pm.HalfFlat = pm.HalfNormal
pm.Flat = pm.Normal

What Gets Mocked

The fixture automatically replaces:

pm.Flat → pm.Normal
pm.HalfFlat → pm.HalfNormal

This ensures prior predictive sampling works without invalid starting values.

DataTree Structure Comparison

Mock sampling output (from mock_sample):

posterior (derived from prior predictive)
observed_data

Note: mock_sample uses prior predictive internally but returns it as posterior to mimic the pm.sample() API. By default there is no prior, prior_predictive, posterior_predictive, or sample_stats group. However, you can pass a sample_stats dictionary to mock specific stats (see Mocking Sample Stats section).

Real sampling output (from pm.sample):

posterior
sample_stats
observed_data

Note: posterior_predictive is NOT included by default - you must call pm.sample_posterior_predictive(idata, model=model) separately. Warmup groups are sampler-dependent (nutpie includes them, default NUTS does not).

Gotcha: Code that expects posterior_predictive, warmup groups, or sample_stats will fail with mock sampling. Different samplers produce different DataTree structures.

Common Testing Patterns

See references/patterns.md for:

Basic model structure tests
Testing with multiple chains
Testing downstream code (plotting, serialization)
CI/CD integration

related-skills.json

gleiches Repository

model-evaluation.md

from "pymc-labs/pymc-modeling"

Load when the user is comparing Bayesian models, computing LOO-CV / ELPD, calling az.loo or az.compare, doing model stacking/averaging, or computing Bayes factors. Covers the ArviZ 1.0 LOO/ELPD/stacking APIs exclusively (no waic). Triggers include: model comparison, LOO, ELPD, az.compare, az.loo, loo_expectations, loo_metrics, loo_r2, Pareto k, stacking, Bayes factor, cross-validation, predictive accuracy, information criterion.

2026-05-213

prior-elicitation.md

from "pymc-labs/pymc-modeling"

Load when the user is choosing priors, running prior predictive checks, calling find_constrained_prior, using PreliZ, or otherwise eliciting domain knowledge into a Bayesian model. Covers weakly informative priors, constrained priors, sensitivity analysis, and elicitation workflows. Triggers include: prior selection, elicitation, find_constrained_prior, PreliZ, prior predictive, expert/informative priors, weakly informative priors, constrained priors.

2026-05-213

pymc-extras.md

from "pymc-labs/pymc-modeling"

Load when the user is working with pymc-extras (pmx) features: splines / BSplineBasis, distributional regression / GAMLSS, R2D2M2CP or horseshoe priors, discrete variable marginalization, or Laplace approximation via fit_laplace. Triggers include: pymc_extras, pymc-extras, pmx, splines, BSplineBasis, distributional regression, GAMLSS, R2D2, horseshoe (regularized/Finnish), marginalize, fit_laplace, penalized splines.

2026-05-213

pymc-modeling.md

from "pymc-labs/pymc-modeling"

Load whenever the user is working on code that imports pymc, pytensor, or arviz, or asks about Bayesian modeling, MCMC, priors, posteriors, sampling, or model diagnostics. Covers PyMC 6+, PyTensor 3+, ArviZ 1.0+ (DataTree API), pymc-bart, pymc-extras, nutpie, and JAX/NumPyro backends. Use for building probabilistic models, specifying priors, running MCMC, diagnosing convergence, or comparing models. Triggers include: Bayesian inference, posterior sampling, hierarchical/multilevel models, GLMs, time series, Gaussian processes, HSGP, BART, mixture models, prior/posterior predictive checks, MCMC diagnostics, LOO-CV, model comparison, causal inference with do/observe, and any PyTensor Op or graph work.

2026-05-213

package.json

"author": "pymc-labs"

"repository": "pymc-labs/pymc-modeling"

GitHub-Repository öffnen Creator-Repositorys ansehen

$ install --global

$ download --local

In Manus ausführen

name

pymc-testing

description

PyMC Testing

PyMC provides testing utilities to speed up test suites by mocking MCMC sampling with prior predictive sampling. This is useful for checking model structure without running expensive inference.

Mock Sampling vs Real Sampling

Aspect	Mock Sampling	Real Sampling
Speed	Fast (seconds)	Slow (minutes)
Use case	Model structure, downstream code	Posterior values, convergence
Output	`prior`, `prior_predictive`	Full `posterior`, `sample_stats`, warmup groups
Divergences	Mocked (configurable)	Real diagnostics

Use mocking when: Testing model specification, CI/CD pipelines, plotting code, API integration, serialization.

Use real sampling when: Checking posterior values, ESS/r_hat diagnostics, LOO-CV, model comparison. See pymc-modeling skill for real inference.

PyMC Testing Utilities

See: https://www.pymc.io/projects/docs/en/latest/api/testing.html

mock_sample

Replaces pm.sample() with prior predictive sampling:

from functools import partial
import numpy as np
import pymc as pm
from pymc.testing import mock_sample

# Basic usage - replaces pm.sample
pm.sample = mock_sample

with pm.Model() as model:
    pm.Normal("x", 0, 1)
    idata = pm.sample()  # Uses prior predictive, not MCMC

mock_sample_setup_and_teardown

Pytest fixture helper for setup/tear-down:

# conftest.py
import pytest
from pymc.testing import mock_sample_setup_and_teardown

mock_pymc_sample = pytest.fixture(scope="function")(mock_sample_setup_and_teardown)

# test_model.py
def test_model_runs(mock_pymc_sample):
    with pm.Model() as model:
        pm.Normal("x", 0, 1)
        idata = pm.sample()
        assert "x" in idata["posterior"]

A production-ready example from pymc-marketing:

conftest.py: https://github.com/pymc-labs/pymc-marketing/blob/main/tests/conftest.py
Also configures pytest markers for slow tests with --run-slow / --only-slow CLI options

Distribution testing helpers

pymc.testing also exposes helpers for validating custom distributions against their analytic log-CDFs. In PyMC 6, both forms are available:

from pymc.testing import check_logcdf, check_logccdf

check_logcdf(MyDist, domain, params)   # log CDF
check_logccdf(MyDist, domain, params)  # log complementary CDF (log survival)

Mocking Sample Stats

By default, no sample_stats are created. Pass a dictionary to mock specific stats:

from functools import partial
import numpy as np
import pymc as pm
from pymc.testing import mock_sample

def mock_diverging(size):
    return np.zeros(size, dtype=int)

def mock_tree_depth(size):
    return np.random.choice(range(2, 10), size=size)

mock_sample_with_stats = partial(
    mock_sample,
    sample_stats={
        "diverging": mock_diverging,
        "tree_depth": mock_tree_depth,
    },
)

pm.sample = mock_sample_with_stats

Example from pymc-marketing:

from functools import partial
import numpy as np
import pymc as pm
import pymc.testing

def mock_diverging(size):
    return np.zeros(size, dtype=int)

pm.sample = partial(
    pymc.testing.mock_sample,
    sample_stats={"diverging": mock_diverging},
)
pm.HalfFlat = pm.HalfNormal
pm.Flat = pm.Normal

What Gets Mocked

The fixture automatically replaces:

pm.Flat → pm.Normal
pm.HalfFlat → pm.HalfNormal

This ensures prior predictive sampling works without invalid starting values.

DataTree Structure Comparison

Mock sampling output (from mock_sample):

posterior (derived from prior predictive)
observed_data

Real sampling output (from pm.sample):

posterior
sample_stats
observed_data

Gotcha: Code that expects posterior_predictive, warmup groups, or sample_stats will fail with mock sampling. Different samplers produce different DataTree structures.

Common Testing Patterns

See references/patterns.md for:

Basic model structure tests
Testing with multiple chains
Testing downstream code (plotting, serialization)
CI/CD integration

pymc-testing

PyMC Testing

Mock Sampling vs Real Sampling

PyMC Testing Utilities

mock_sample

mock_sample_setup_and_teardown

Distribution testing helpers

Mocking Sample Stats

What Gets Mocked

DataTree Structure Comparison

Common Testing Patterns

Mehr aus diesem Repository

Mehr aus diesem Repository

PyMC Testing

Mock Sampling vs Real Sampling

PyMC Testing Utilities

mock_sample

mock_sample_setup_and_teardown

Distribution testing helpers

Mocking Sample Stats

What Gets Mocked

DataTree Structure Comparison

Common Testing Patterns