sep metric func into util, remove unused packges

AmpersandTV · Jun 29, 2020 · a95ff68 · a95ff68
1 parent decf50c
commit a95ff68
Show file tree

Hide file tree

Showing 3 changed files with 49 additions and 39 deletions.
diff --git a/tests/test_sampling.py b/tests/test_sampling.py
@@ -1,10 +1,9 @@
 from pymc3_hmm.distributions import HMMStateSeq, SwitchingProcess
-from tests.utils import gen_defualt_param, simulate_poiszero_hmm
+from tests.utils import gen_defualt_param, simulate_poiszero_hmm, check_metrics
 from pymc3_hmm.step_methods import FFBSStep, TransMatConjugateStep
 import pymc3 as pm
 import theano.tensor as tt
 import numpy as np
-from datetime import datetime
 
 
 def test_sampling(N: int = 200, off_param=1):
@@ -49,24 +48,9 @@ def test_sampling(N: int = 200, off_param=1):
         ffbs = FFBSStep([S_rv])
         transitions = TransMatConjugateStep([p_0_rv, p_1_rv, p_2_rv], S_rv)
         steps = [ffbs, mu_step, transitions]
-        start_time = datetime.now()
         trace_ = pm.sample(N, step=steps, return_inferencedata=True, chains=1)
-        time_elapsed = datetime.now() - start_time
-        y_trace = pm.sample_posterior_predictive(trace_.posterior)["Y_t"].mean(axis=0)
-
-    st_trace = trace_.posterior["S_t"].mean(axis=0).mean(axis=0)
-    mean_error_rate = (
-        1 - np.sum(np.equal(st_trace, simulation["S_t"]) * 1) / len(simulation["S_t"])
-    ).values.tolist()
-
-    positive_index = simulation["Y_t"] > 0
-    positive_sim = simulation["Y_t"][positive_index]
-    MAPE = np.nanmean(abs(y_trace[positive_index] - positive_sim) / positive_sim)
-
-    assert mean_error_rate < 0.05
-    assert MAPE < 0.05
-
-    return {"mean_error_rate": mean_error_rate, "MAPE": MAPE}
+        posterior = pm.sample_posterior_predictive(trace_.posterior)
+        check_metrics(trace_, posterior, simulation)
 
 
 # def test_PriorRobust():

diff --git a/tests/test_sampling_seasonality.py b/tests/test_sampling_seasonality.py
@@ -3,14 +3,12 @@
     gen_defualt_params_seaonality,
     time_series,
     simulate_poiszero_hmm,
+    check_metrics,
 )
 from pymc3_hmm.step_methods import FFBSStep, TransMatConjugateStep
 import pymc3 as pm
 import theano.tensor as tt
 import numpy as np
-from datetime import datetime
-
-# %%
 import random
 
 
@@ -63,21 +61,8 @@ def test_seasonality_sampling(N: int = 200, off_param=1):
         ffbs = FFBSStep([S_rv])
         transitions = TransMatConjugateStep([p_0_rv, p_1_rv, p_2_rv], S_rv)
         steps = [ffbs, mu_step, transitions]
-        start_time = datetime.now()
         trace_ = pm.sample(N, step=steps, return_inferencedata=True, chains=1)
-        time_elapsed = datetime.now() - start_time
-        y_trace = pm.sample_posterior_predictive(trace_.posterior)["Y_t"].mean(axis=0)
-
-    st_trace = trace_.posterior["S_t"].mean(axis=0).mean(axis=0)
-    mean_error_rate = (
-        1
-        - np.sum(np.equal(st_trace == 0, simulation["S_t"] == 0) * 1)
-        / len(simulation["S_t"])
-    ).values.tolist()
+        posterior = pm.sample_posterior_predictive(trace_.posterior)
 
-    positive_index = simulation["Y_t"] > 0
-    positive_sim = simulation["Y_t"][positive_index]
-    MAPE = np.nanmean(abs(y_trace[positive_index] - positive_sim) / positive_sim)
-    assert mean_error_rate < 0.05
-    assert MAPE < 0.3
-    return trace_, time_elapsed, test_model, simulation, kwargs, y_trace
+    check_metrics(trace_, posterior, simulation)
+    # return trace_, time_elapsed, test_model, simulation, kwargs, y_trace
diff --git a/tests/utils.py b/tests/utils.py
@@ -6,6 +6,7 @@
 import pandas as pd
 import numbers
 import theano
+import arviz as az
 
 theano.config.compute_test_value = "warn"
 
@@ -45,7 +46,7 @@ def simulate_poiszero_hmm(
 def time_series(N):
     t = pd.date_range(end=pd.to_datetime("today"), periods=N, freq="H")
     # month = pd.get_dummies(t.month)
-    week = pd.get_dummies(t.weekday).values
+    week = pd.get_dummies(t.dayofweek).values
     hour = pd.get_dummies(t.hour).values
     return np.concatenate([week, hour], 1)
 
@@ -80,3 +81,43 @@ def gen_defualt_param(N):
         "pi_0_a": np.r_[1, 1, 1],
         "Gamma": np.r_["0,2,1", [5, 1, 1], [1, 3, 1], [1, 1, 5]],
     }
+
+
+def check_metrics(trace_, posterior, simulation):
+
+    ## checking for state prediction
+    st_trace = trace_.posterior["S_t"].mean(axis=0).mean(axis=0)
+    mean_error_rate = (
+        1
+        - np.sum(np.equal(st_trace == 0, simulation["S_t"] == 0) * 1)
+        / len(simulation["S_t"])
+    ).values.tolist()
+
+    ## check for positive possion
+    positive_index = simulation["Y_t"] > 0
+    positive_sim = simulation["Y_t"][positive_index]
+    ## point metric
+    y_trace = posterior["Y_t"].mean(axis=0)
+    MAPE = np.nanmean(abs(y_trace[positive_index] - positive_sim) / positive_sim)
+
+    ## confidence_metrics_
+    az_post_trace = az.from_pymc3(posterior_predictive=posterior)
+    post_pred_imps_hpd_df = az.hdi(
+        az_post_trace, hdi_prob=0.95, group="posterior_predictive", var_names=["Y_t"]
+    ).to_dataframe()
+
+    post_pred_imps_hpd_df = post_pred_imps_hpd_df.unstack(level="hdi")
+    post_pred_imps_hpd_df.columns = post_pred_imps_hpd_df.columns.set_levels(
+        ["upper", "lower"], level="hdi"
+    )
+    pred_range = post_pred_imps_hpd_df[positive_index]["Y_t"]
+    pred_range["T_Y"] = simulation["Y_t"][positive_index]
+
+    pred_95_CI = sum(
+        (pred_range["T_Y"] < pred_range["upper"])
+        & (pred_range["T_Y"] > pred_range["lower"]) * 1
+    ) / len(pred_range)
+
+    assert mean_error_rate < 0.05
+    assert MAPE < 0.3
+    assert pred_95_CI < 0.3