import torch
import GPy
import math
import seaborn as sns
import matplotlib.pyplot as plt
import pyro
from pyro.infer.mcmc import MCMC, NUTS
import pyro.optim

from athena.active import ActiveSubspaces

from torch_functions import sin_2d, radial

import warnings
warnings.filterwarnings('ignore')


# Global parameters
n_samples = 100
input_dim = 5


def model(f):
    """
    Likelihood p(f|x), the prior on the inputs is a multivariate Gaussian distribution.
    The model function of interest is f(X)=(X+1)^{2} where 1 is a vector of ones of the dimension of X.
    """
    x = pyro.sample(
        "input",
        pyro.distributions.MultivariateNormal(torch.zeros([input_dim]), torch.eye(input_dim)))
    mean = torch.norm(x + torch.ones(input_dim))**2
    eps = 0.1
    pyro.sample("outputs", pyro.distributions.Normal(mean, eps), obs=f)


def surrogate_model(f, gp):
    """
    Likelihood p(g|s), the prior on the inputs is a multivariate Gaussian distribution.
    The model function of interest is the response function g(S) designed with active subspaces.
    """
    y = pyro.sample("input", pyro.distributions.Normal(0, 1))
    mean = gp.predict(y.cpu().detach().numpy().reshape(-1, 1))[0]
    eps = 0.1
    pyro.sample("outputs", pyro.distributions.Normal(torch.Tensor(mean), eps), obs=f)


#generate inputs, outputs, gradients
dist_inputs = pyro.distributions.MultivariateNormal(torch.zeros([input_dim]),
                                                    torch.eye(input_dim))
x = dist_inputs(sample_shape=torch.Size([n_samples]))
x.requires_grad = True
f = radial(x + torch.ones(input_dim), generatrix=lambda x: x)
f.backward(gradient=torch.ones([n_samples]))
df = x.grad
print(df.shape, f.shape, x.shape, f.var())

torch.Size([100, 5]) torch.Size([100]) torch.Size([100, 5]) tensor(29.5732, grad_fn=<VarBackward0>)


#search for an active subspace
ss = ActiveSubspaces(dim=1)
ss.fit(gradients=df.cpu().detach().numpy())
ss.plot_eigenvalues(figsize=(6, 4))
ss.plot_sufficient_summary(x.detach().numpy(), f.detach().numpy(), figsize=(6, 4))


kernel = GPy.kern.RBF(input_dim=1, ARD=True)
gp = GPy.models.GPRegression(
    ss.transform(x.detach().numpy())[0],
    f.reshape(-1, 1).detach().numpy(), kernel)
gp.optimize_restarts(5, verbose=False)

[<paramz.optimization.optimization.opt_lbfgsb at 0x7f938046b490>,
 <paramz.optimization.optimization.opt_lbfgsb at 0x7f938046b9d0>,
 <paramz.optimization.optimization.opt_lbfgsb at 0x7f938046b210>,
 <paramz.optimization.optimization.opt_lbfgsb at 0x7f938046be10>,
 <paramz.optimization.optimization.opt_lbfgsb at 0x7f9380462450>]


#plain NUTS
num_chains = 1
num_samples = 100
kernel = NUTS(model)
mcmc = MCMC(kernel,
            num_samples=num_samples,
            warmup_steps=100,
            num_chains=num_chains)
mcmc.run(f)
mcmc.summary()
mcmc_samples = mcmc.get_samples(group_by_chain=True)
print(mcmc_samples.keys())
chains = mcmc_samples["input"]
print(chains.shape)

Sample: 100%|██████████| 200/200 [04:09,  1.25s/it, step size=1.58e-03, acc. prob=0.959]

                mean       std    median      5.0%     95.0%     n_eff     r_hat
  input[0]      0.04      0.84      0.12     -1.38      1.26     26.13      1.00
  input[1]     -0.26      0.94     -0.42     -1.91      1.17     11.14      1.09
  input[2]      0.61      0.76      0.54     -0.39      1.90     14.32      1.03
  input[3]     -0.09      0.73     -0.02     -1.36      0.95     25.41      0.99
  input[4]      0.20      0.92      0.20     -1.08      1.65     17.16      1.03

Number of divergences: 0
dict_keys(['input'])
torch.Size([1, 100, 5])


for i in range(5):
    plt.figure(figsize=(6, 4))  
    sns.distplot(mcmc_samples['input'][:, :, i])
    plt.title("Full model")
    plt.xlabel("input {}th-component".format(i+1))
    plt.show()


print(ss.transform(chains[0])[0].mean())
plt.figure(figsize=(6, 4))  
sns.distplot(ss.transform(chains[0])[0])
plt.title("Full model")
plt.xlabel("active component".format(i+1))
plt.show()

-0.22227419720101785


#AS NUTS
skernel = NUTS(surrogate_model)
smcmc = MCMC(skernel,
             num_samples=num_samples,
             warmup_steps=100,
             num_chains=num_chains)
smcmc.run(f, gp)
smcmc.summary()

smcmc_samples = smcmc.get_samples(group_by_chain=True)
print(smcmc_samples.keys())
chains = smcmc_samples["input"]
print(chains.shape)

Sample: 100%|██████████| 200/200 [03:58,  1.19s/it, step size=4.63e-04, acc. prob=0.781]

                mean       std    median      5.0%     95.0%     n_eff     r_hat
     input     -0.24      0.00     -0.24     -0.24     -0.24      8.50      1.50

Number of divergences: 0
dict_keys(['input'])
torch.Size([1, 100])


print(chains[0].mean())
plt.figure(figsize=(6, 4))  
sns.distplot(smcmc_samples['input'])
plt.title("Surrogate model")
plt.xlabel("input's active variable")
plt.show()

tensor(-0.2409)

04 Inverse problems¶

Remarks¶