scikit-learn
diff --git a/‎benchmarks/bench_gbrt.py
Lines changed: 15 additions & 12 deletions b/‎benchmarks/bench_gbrt.py
Lines changed: 15 additions & 12 deletions
diff --git a/‎sklearn/ensemble/gradient_boosting.py
Lines changed: 21 additions & 57 deletions b/‎sklearn/ensemble/gradient_boosting.py
Lines changed: 21 additions & 57 deletions
@@ -19,12 +19,13 @@ def wrapper(*args, **kargs):
     return wrapper
 
 
-np.seterr(invalid='print', under='print', divide='print', over='print')
+# ignore overflows due to exp
+np.seterr(invalid='print', under='print', divide='print', over='ignore')
 
 
-classification_params = {'loss': 'bernoulli', 'n_iter': 100,
+classification_params = {'loss': 'deviance', 'n_iter': 100,
                          'min_split': 1, 'max_depth': 1,
-                         'learn_rate': 1.0, 'subsample': 1.0}
+                         'learn_rate': .6, 'subsample': 1.0}
 
 
 @repeat
@@ -69,7 +70,7 @@ def random_gaussian_learning_curve(random_state=None):
     y_train, y_test = y[:2000], y[2000:]
 
     n_iter = 2000
-    max_depth = 1
+    max_depth = 2
 
     deviance = np.zeros((n_iter,), dtype=np.float64)
     error_rate = np.zeros((n_iter,), dtype=np.float64)
@@ -84,18 +85,20 @@ def monitor(clf, i):
         tmp = ((1.0 / (1.0 + np.exp(-y_pred))) >= 0.5).astype(np.float64)
         error_rate[i] = np.mean(tmp != y_test)
 
-    gbrt = GradientBoostingClassifier(loss='bernoulli', n_iter=n_iter, min_split=1,
+    print "Train first model..."
+    gbrt = GradientBoostingClassifier(loss='deviance', n_iter=n_iter, min_split=1,
                                       max_depth=max_depth, learn_rate=1.0,
                                       subsample=1.0)
     gbrt.fit(X_train, y_train, monitor=monitor)
     n = deviance.shape[0]
-    print deviance[:5]
+
     pl.subplot(122)
     pl.plot(np.arange(n), error_rate, "r-", label="No shrinkage")
     pl.subplot(121)
     pl.plot(np.arange(n), deviance, "r-", label="No shrinkage")
 
-    gbrt = GradientBoostingClassifier(loss='bernoulli', n_iter=n_iter, min_split=1,
+    print "Train second model..."
+    gbrt = GradientBoostingClassifier(loss='deviance', n_iter=n_iter, min_split=1,
                                       max_depth=max_depth, learn_rate=0.2,
                                       subsample=1.0)
     gbrt.fit(X_train, y_train, monitor=monitor)
@@ -230,14 +233,14 @@ def bench_friedman3(random_state=None):
 
 if __name__ == "__main__":
 
-    print "spam", bench_spam()
+     print "spam", bench_spam()
 
 ##     print "Example 10.2 - LC"
-##     random_gaussian_learning_curve()
-    print "Example 10.2", bench_random_gaussian()
+##     random_gaussian_learning_curve(13)
+##     print "Example 10.2", bench_random_gaussian()
 
-    print "Madelon", bench_madelon()
-    print "Arcene", bench_arcene()
+##     print "Madelon", bench_madelon()
+##     print "Arcene", bench_arcene()
 
 ##     print "Boston", bench_boston()
 ##     print "Friedman#1", bench_friedman1()
 
@@ -76,22 +76,6 @@ def predict(self, X):
         return y
 
 
-class ClassPrior2Predictor(object):
-    """A simple initial estimator that predicts the mean
-    of the training targets.
-    """
-
-    prior = None
-
-    def fit(self, X, y):
-        self.prior = np.log(y.sum() / float(y.shape[0] - y.sum()))
-
-    def predict(self, X):
-        y = np.empty((X.shape[0],), dtype=np.float64)
-        y.fill(self.prior)
-        return y
-
-
 class ClassPriorPredictor(object):
     """A simple initial estimator that predicts the mean
     of the training targets.
@@ -100,8 +84,7 @@ class ClassPriorPredictor(object):
     prior = None
 
     def fit(self, X, y):
-        pos_prior = y[y == -1].shape[0] / float(y.shape[0])
-        self.prior = 0.5 * np.log2(pos_prior / (1.0 - pos_prior))
+        self.prior = np.log(y.sum() / float(y.shape[0] - y.sum()))
 
     def predict(self, X):
         y = np.empty((X.shape[0],), dtype=np.float64)
@@ -170,8 +153,8 @@ def negative_gradient(self, y, pred):
 
     def _update_terminal_region(self, node, X, y, residual, pred):
         """LAD updates terminal regions to median estimates. """
-        node.value = np.asanyarray(np.median(y.take(node.sample_mask, axis=0) - \
-                                             pred.take(node.sample_mask, axis=0)))
+        node.value = np.asanyarray(np.median(y.take(node.terminal_region, axis=0) - \
+                                             pred.take(node.terminal_region, axis=0)))
 
 
 ## class HuberError(LossFunction):
@@ -189,14 +172,14 @@ def _update_terminal_region(self, node, X, y, residual, pred):
 ##     def _update_terminal_region(self, node, X, y, residual, pred):
 ##         """LAD updates terminal regions to median estimates. """
 ##         ## FIXME copied from LAD, still TODO
-##         node.value = np.asanyarray(np.median(y.take(node.sample_mask, axis=0) - \
-##                                              pred.take(node.sample_mask, axis=0)))
+##         node.value = np.asanyarray(np.median(y.take(node.terminal_region, axis=0) - \
+##                                              pred.take(node.terminal_region, axis=0)))
 
 
-class BernoulliDeviance(LossFunction):
+class BinomialDeviance(LossFunction):
 
     def init_estimator(self):
-        return ClassPrior2Predictor()
+        return ClassPriorPredictor()
 
     def __call__(self, y, pred):
         """Compute the deviance (= negative log-likelihood). """
@@ -207,45 +190,26 @@ def negative_gradient(self, y, pred):
 
     def _update_terminal_region(self, node, X, y, residual, pred):
         """Make a single Newton-Raphson step. """
-        residual = residual.take(node.sample_mask, axis=0)
-        y = y.take(node.sample_mask, axis=0)
-
-        node.value = np.asanyarray(residual.sum() / \
-                                   np.sum((y - residual) * (1.0 - y + residual)),
-                                   dtype=np.float64)
 
-        # FIXME free mem - rename `sample_mask` since its actually an index arr
-        del node.sample_mask
-        node.sample_mask = None
-
-
-class BinomialDeviance(LossFunction):
-
-    def init_estimator(self):
-        return ClassPriorPredictor()
-
-    def __call__(self, y, pred):
-        return np.log2(1.0 + np.exp(-2.0 * y * pred))
+        residual = residual.take(node.terminal_region, axis=0)
+        y = y.take(node.terminal_region, axis=0)
 
-    def negative_gradient(self, y, pred):
-        return (2.0 * y) / (1.0 + np.exp(2.0 * y * pred))
+        numerator = residual.sum()
+        denominator = np.sum((y - residual) * (1.0 - y + residual))
 
-    def _update_terminal_region(self, node, X, y, residual, pred):
-        """Make a single Newton-Raphson step. """
-        targets = residual.take(node.sample_mask, axis=0)
-        abs_targets = np.abs(targets)
-        node.value = np.asanyarray(targets.sum() / np.sum(abs_targets * \
-                                                          (2.00000001 - abs_targets)))
+        if denominator == 0.0:
+            node.value = np.array(0.0, dtype=np.float64)
+        else:
+            node.value = np.asanyarray(numerator / denominator, dtype=np.float64)
 
         # FIXME free mem - rename `sample_mask` since its actually an index arr
-        del node.sample_mask
-        node.sample_mask = None
+        del node.terminal_region
+        node.terminal_region = None
 
 
 LOSS_FUNCTIONS = {'ls': LeastSquaresError,
                   'lad': LeastAbsoluteError,
-                  'deviance': BinomialDeviance,
-                  'bernoulli': BernoulliDeviance}
+                  'deviance': BinomialDeviance}
 
 
 class BaseGradientBoosting(BaseEstimator):
@@ -357,14 +321,14 @@ def fit(self, X, y, monitor=None):
             #print "Iteration %d - build_tree - in %fs" % (i, time() - t0)
 
 
-            #assert tree.is_leaf == False
-            
+            assert tree.is_leaf != True
+
             loss.update_terminal_regions(tree, X, y, residual, y_pred)
             #print "Iteration %d - update - in %fs" % (i, time() - t0)
             self.trees.append(tree)
 
             y_pred = self._predict(X, old_pred=y_pred)
-
+            
             if monitor:
                 monitor(self, i)