FIX remove y labels from X sets

PSSF23 · PSSF23 · commit 39a6780c2aaf · 2021-11-29T14:58:56.000-05:00
diff --git a/examples/linear_model/plot_poisson_regression_non_normal_loss.py b/examples/linear_model/plot_poisson_regression_non_normal_loss.py
@@ -145,7 +145,11 @@
         ("preprocessor", linear_model_preprocessor),
         ("regressor", DummyRegressor(strategy="mean")),
     ]
-).fit(df_train, df_train["Frequency"], regressor__sample_weight=df_train["Exposure"])
+).fit(
+    df_train.drop(columns=["Frequency"]),
+    df_train["Frequency"],
+    regressor__sample_weight=df_train["Exposure"],
+)
 
 
 ##############################################################################
@@ -159,7 +163,7 @@
 
 def score_estimator(estimator, df_test):
     """Score an estimator on the test set."""
-    y_pred = estimator.predict(df_test)
+    y_pred = estimator.predict(df_test.drop(columns=["Frequency"]))
 
     print(
         "MSE: %.3f"
@@ -217,7 +221,11 @@ def score_estimator(estimator, df_test):
         ("preprocessor", linear_model_preprocessor),
         ("regressor", Ridge(alpha=1e-6)),
     ]
-).fit(df_train, df_train["Frequency"], regressor__sample_weight=df_train["Exposure"])
+).fit(
+    df_train.drop(columns=["Frequency"]),
+    df_train["Frequency"],
+    regressor__sample_weight=df_train["Exposure"],
+)
 
 # %%
 # The Poisson deviance cannot be computed on non-positive values predicted by
@@ -249,7 +257,11 @@ def score_estimator(estimator, df_test):
         ("preprocessor", linear_model_preprocessor),
         ("regressor", PoissonRegressor(alpha=1e-12, max_iter=300)),
     ]
-).fit(df_train, df_train["Frequency"], regressor__sample_weight=df_train["Exposure"])
+).fit(
+    df_train.drop(columns=["Frequency"]),
+    df_train["Frequency"],
+    regressor__sample_weight=df_train["Exposure"],
+)
 
 print("PoissonRegressor evaluation:")
 test_preds.append(score_estimator(poisson_glm, df_test))
@@ -298,7 +310,11 @@ def score_estimator(estimator, df_test):
             HistGradientBoostingRegressor(loss="poisson", max_leaf_nodes=128),
         ),
     ]
-).fit(df_train, df_train["Frequency"], regressor__sample_weight=df_train["Exposure"])
+).fit(
+    df_train.drop(columns=["Frequency"]),
+    df_train["Frequency"],
+    regressor__sample_weight=df_train["Exposure"],
+)
 
 print("Poisson Gradient Boosted Trees evaluation:")
 test_preds.append(score_estimator(poisson_gbrt, df_test))
@@ -330,7 +346,7 @@ def score_estimator(estimator, df_test):
 
     for idx, model in enumerate([ridge_glm, poisson_glm, poisson_gbrt]):
         if label == "train":
-            y_pred = model.predict(df)
+            y_pred = model.predict(df.drop(columns=["Frequency"]))
         else:
             y_pred = test_preds[idx + 1]