scikit-learn
diff --git a/‎sklearn/ensemble/_gb_losses.py
Lines changed: 33 additions & 4 deletions b/‎sklearn/ensemble/_gb_losses.py
Lines changed: 33 additions & 4 deletions
diff --git a/‎sklearn/ensemble/tests/test_gradient_boosting_loss_functions.py
Lines changed: 49 additions & 20 deletions b/‎sklearn/ensemble/tests/test_gradient_boosting_loss_functions.py
Lines changed: 49 additions & 20 deletions
@@ -174,7 +174,16 @@ def check_init_estimator(self, estimator):
             )
 
     def get_init_raw_predictions(self, X, estimator):
-        return estimator.predict(X).reshape(-1, 1).astype(np.float64)
+        predictions = estimator.predict(X)
+        n_samples = X.shape[0]
+        if predictions.shape != (n_samples,):
+            # if the init estimator was trained for e.g. multioutput
+            # regression, raise error
+            raise ValueError(
+                'The init estimator predicted output with shape={}, '
+                'expected shape=({},).'.format(predictions.shape, n_samples)
+                )
+        return predictions.reshape(-1, 1).astype(np.float64)
 
 
 class LeastSquaresError(RegressionLossFunction):
@@ -658,7 +667,14 @@ def _raw_prediction_to_decision(self, raw_predictions):
         return np.argmax(proba, axis=1)
 
     def get_init_raw_predictions(self, X, estimator):
-        proba_pos_class = estimator.predict_proba(X)[:, 1]
+        probas = estimator.predict_proba(X)
+        n_samples = X.shape[0]
+        if probas.shape != (n_samples, 2):
+            raise ValueError(
+                'The init estimator predicted probabilities with shape={}, '
+                'expected shape=({},)'.format(probas.shape, n_samples)
+            )
+        proba_pos_class = probas[:, 1]
         eps = np.finfo(np.float32).eps
         proba_pos_class = np.clip(proba_pos_class, eps, 1 - eps)
         # log(x / (1 - x)) is the inverse of the sigmoid (expit) function
@@ -766,9 +782,15 @@ def _raw_prediction_to_decision(self, raw_predictions):
 
     def get_init_raw_predictions(self, X, estimator):
         probas = estimator.predict_proba(X)
+        n_samples = X.shape[0]
+        if probas.shape != (n_samples, self.K):
+            raise ValueError(
+                'The init estimator predicted probabilities with shape={}, '
+                'expected shape={}'.format(probas.shape, (n_samples, self.K))
+            )
+
         eps = np.finfo(np.float32).eps
         probas = np.clip(probas, eps, 1 - eps)
-
         raw_predictions = np.log(probas).astype(np.float64)
         return raw_predictions
 
@@ -862,7 +884,14 @@ def _raw_prediction_to_decision(self, raw_predictions):
         return (raw_predictions.ravel() >= 0).astype(np.int)
 
     def get_init_raw_predictions(self, X, estimator):
-        proba_pos_class = estimator.predict_proba(X)[:, 1]
+        probas = estimator.predict_proba(X)
+        n_samples = X.shape[0]
+        if probas.shape != (n_samples, 2):
+            raise ValueError(
+                'The init estimator predicted probabilities with shape={}, '
+                'expected shape=({},)'.format(probas.shape, n_samples)
+            )
+        proba_pos_class = probas[:, 1]
         eps = np.finfo(np.float32).eps
         proba_pos_class = np.clip(proba_pos_class, eps, 1 - eps)
         # according to The Elements of Statistical Learning sec. 10.5, the
 
@@ -6,6 +6,7 @@
 from numpy.testing import assert_almost_equal
 from numpy.testing import assert_allclose
 from numpy.testing import assert_equal
+import pytest
 
 from sklearn.utils import check_random_state
 from sklearn.utils.stats import _weighted_percentile
@@ -18,6 +19,8 @@
 from sklearn.ensemble._gb_losses import MultinomialDeviance
 from sklearn.ensemble._gb_losses import ExponentialLoss
 from sklearn.ensemble._gb_losses import LOSS_FUNCTIONS
+from sklearn.linear_model import LinearRegression
+from sklearn.linear_model import LogisticRegression
 
 
 def test_binomial_deviance():
@@ -257,27 +260,13 @@ def test_init_raw_predictions_values():
     p = y.mean()
     assert_almost_equal(raw_predictions, np.log(p / (1 - p)))
 
-    # FIXME: uncomment this and fix
-    # for y_unstable in (np.zeros(shape=n_samples), np.ones(shape=n_samples)):
-    #     init_estimator = loss.init_estimator().fit(X, y_unstable)
-    #     raw_predictions = loss.get_init_raw_predictions(y_unstable,
-    #                                                     init_estimator)
-    #     assert_all_finite(raw_predictions)
-
     # Exponential loss
     loss = ExponentialLoss(n_classes=2)
     init_estimator = loss.init_estimator().fit(X, y)
     raw_predictions = loss.get_init_raw_predictions(y, init_estimator)
     p = y.mean()
     assert_almost_equal(raw_predictions, .5 * np.log(p / (1 - p)))
 
-    # FIXME: uncomment this and fix
-    # for y_unstable in (np.zeros(shape=n_samples), np.ones(shape=n_samples)):
-    #     init_estimator = loss.init_estimator().fit(X, y_unstable)
-    #     raw_predictions = loss.get_init_raw_predictions(y_unstable,
-    #                                                     init_estimator)
-    #     assert_all_finite(raw_predictions)
-
     # Multinomial deviance loss
     for n_classes in range(3, 5):
         y = rng.randint(0, n_classes, size=n_samples)
@@ -288,9 +277,49 @@ def test_init_raw_predictions_values():
             p = (y == k).mean()
         assert_almost_equal(raw_predictions[:, k], np.log(p))
 
-        # FIXME: uncomment this and fix
-        # for y_unstable in (np.zeros(shape=n_samples), np.ones(shape=n_samples)):
-        #     init_estimator = loss.init_estimator().fit(X, y_unstable)
-        #     raw_predictions = loss.get_init_raw_predictions(y_unstable,
-        #                                                     init_estimator)
-        #     assert_all_finite(raw_predictions)
+
+def test_bad_init_estimator():
+    # check that the init estimator predict() or predict_proba() methods output
+    # expected shape
+
+    rng = np.random.RandomState(0)
+    n_samples = 100
+
+    X = rng.normal(size=(n_samples, 10))
+
+    # Regression losses
+    # train init estimator on multioutput regression target
+    y_init_est = rng.normal(size=(n_samples, 2))
+    lr = LinearRegression().fit(X, y_init_est)
+    for loss in (LeastSquaresError(n_classes=1),
+                 LeastAbsoluteError(n_classes=1),
+                 QuantileLossFunction(n_classes=1),
+                 HuberLossFunction(n_classes=1)):
+        with pytest.raises(
+                ValueError,
+                match='The init estimator predicted output with shape'
+                ):
+            loss.get_init_raw_predictions(X, estimator=lr)
+
+    # Binomial deviance and exponential loss
+    # train init estimator on 3 classes instead of 2
+    y_init_est = rng.randint(0, 3, size=(n_samples))
+    lr = LogisticRegression().fit(X, y_init_est)
+    for loss in (BinomialDeviance(n_classes=2),
+                 ExponentialLoss(n_classes=2)):
+        with pytest.raises(
+                ValueError,
+                match='The init estimator predicted probabilities with shape'
+                ):
+            loss.get_init_raw_predictions(X, estimator=lr)
+
+    # Multinomial deviance
+    # train init estimator on 4 classes instead of 3
+    y_init_est = rng.randint(0, 4, size=(n_samples))
+    lr = LogisticRegression().fit(X, y_init_est)
+    loss = MultinomialDeviance(n_classes=3)
+    with pytest.raises(
+            ValueError,
+            match='The init estimator predicted probabilities with shape'
+            ):
+        loss.get_init_raw_predictions(X, estimator=lr)