scikit-learn
diff --git a/‎sklearn/model_selection/_search.py
Lines changed: 16 additions & 17 deletions b/‎sklearn/model_selection/_search.py
Lines changed: 16 additions & 17 deletions
diff --git a/‎sklearn/model_selection/tests/test_search.py
Lines changed: 62 additions & 55 deletions b/‎sklearn/model_selection/tests/test_search.py
Lines changed: 62 additions & 55 deletions
@@ -590,34 +590,33 @@ def _fit(self, X, y, labels, parameter_iterable):
 
         time = np.array(time, dtype=np.float64).reshape(n_candidates, n_splits)
         time_means = np.average(time, axis=1)
-        time_stds =  np.sqrt(
+        time_stds = np.sqrt(
             np.average((time - time_means[:, np.newaxis]) ** 2,
                        axis=1))
-        if self.return_train_score:
-            train_means = np.average(train_scores, axis=1)
-            train_stds = np.sqrt(
-                np.average((train_scores - train_means[:, np.newaxis]) ** 2,
-                           axis=1))
 
         cv_results = dict()
         for split_i in range(n_splits):
             cv_results["split%d_test_score" % split_i] = test_scores[:,
                                                                      split_i]
-        cv_results["mean_test_score"] = means
-        cv_results["std_test_score"] = stds
+        cv_results["mean_test_score"] = test_means
+        cv_results["std_test_score"] = test_stds
 
         if self.return_train_score:
+            train_means = np.average(train_scores, axis=1)
+            train_stds = np.sqrt(
+                np.average((train_scores - train_means[:, np.newaxis]) ** 2,
+                           axis=1))
             for split_i in range(n_splits):
-                results["train_split%d_score" % split_i] = (
+                cv_results["split%d_train_score" % split_i] = (
                     train_scores[:, split_i])
-            results["mean_train_score"] = train_means
-            results["std_train_scores"] = train_stds
-            results["rank_train_scores"] = np.asarray(rankdata(-train_means,
-                                                               method='min'),
-                                                      dtype=np.int32)
-
-        results["mean_test_time"] = time_means
-        results["std_test_time"] = time_stds
+            cv_results["mean_train_score"] = train_means
+            cv_results["std_train_score"] = train_stds
+            cv_results["rank_train_score"] = np.asarray(rankdata(-train_means,
+                                                                 method='min'),
+                                                        dtype=np.int32)
+
+        cv_results["mean_test_time"] = time_means
+        cv_results["std_test_time"] = time_stds
         ranks = np.asarray(rankdata(-test_means, method='min'), dtype=np.int32)
 
         best_index = np.flatnonzero(ranks == 1)[0]
 
@@ -594,33 +594,34 @@ def test_param_sampler():
         assert_equal([x for x in sampler], [x for x in sampler])
 
 
-def check_cv_results_array_types(results, param_keys, score_keys):
-    # Check if the search results' array are of correct types
-    assert_true(all(isinstance(results[param], np.ma.MaskedArray)
+def check_cv_results_array_types(cv_results, param_keys, score_keys):
+    # Check if the search `cv_results`'s array are of correct types
+    assert_true(all(isinstance(cv_results[param], np.ma.MaskedArray)
                     for param in param_keys))
-    assert_true(all(results[key].dtype == object for key in param_keys))
-    assert_false(any(isinstance(results[key], np.ma.MaskedArray)
+    assert_true(all(cv_results[key].dtype == object for key in param_keys))
+    assert_false(any(isinstance(cv_results[key], np.ma.MaskedArray)
                      for key in score_keys))
-    assert_true(all(results[key].dtype == np.float64
-                    for key in score_keys if key != 'rank_test_score'))
-    assert_true(results['rank_test_score'].dtype == np.int32)
+    assert_true(all(cv_results[key].dtype == np.float64
+                    for key in score_keys if key not in ('rank_test_score',
+                                                         'rank_train_score')))
+    assert_true(cv_results['rank_test_score'].dtype == np.int32)
 
 
-def check_cv_results_keys(results, param_keys, score_keys, n_cand):
+def check_cv_results_keys(cv_results, param_keys, score_keys, n_cand):
     # Test the search.cv_results_ contains all the required results
-    assert_array_equal(sorted(results.keys()),
+    assert_array_equal(sorted(cv_results.keys()),
                        sorted(param_keys + score_keys + ('params',)))
-    assert_true(all(results[key].shape == (n_cand,)
+    assert_true(all(cv_results[key].shape == (n_cand,)
                     for key in param_keys + score_keys))
 
 
 def check_cv_results_grid_scores_consistency(search):
     # TODO Remove in 0.20
-    results = search.cv_results_
-    res_scores = np.vstack(list([results["split%d_test_score" % i]
+    cv_results = search.cv_results_
+    res_scores = np.vstack(list([cv_results["split%d_test_score" % i]
                                  for i in range(search.n_splits_)])).T
-    res_means = results["mean_test_score"]
-    res_params = results["params"]
+    res_means = cv_results["mean_test_score"]
+    res_params = cv_results["params"]
     n_cand = len(res_params)
     grid_scores = assert_warns(DeprecationWarning, getattr,
                                search, 'grid_scores_')
@@ -633,7 +634,7 @@ def check_cv_results_grid_scores_consistency(search):
         assert_array_equal(grid_scores[i].mean_validation_score, res_means[i])
 
 
-def test_grid_search_results():
+def test_grid_search_cv_results():
     X, y = make_classification(n_samples=50, n_features=4,
                                random_state=42)
 
@@ -649,43 +650,46 @@ def test_grid_search_results():
     grid_search_iid.fit(X, y)
 
     param_keys = ('param_C', 'param_degree', 'param_gamma', 'param_kernel')
-    score_keys = ('mean_test_score', 'mean_train_score', 'mean_test_time',
-                  'rank_test_score', 'split0_test_score', 'split1_test_score',
-                  'split2_test_score', 'split0_train_score',
-                  'split1_train_score', 'split2_train_score',
-                  'std_test_score', 'std_train_score', 'std_test_time')
+    score_keys = ('mean_test_score', 'mean_train_score',
+                  'rank_test_score', 'rank_train_score',
+                  'split0_test_score', 'split1_test_score',
+                  'split2_test_score',
+                  'split0_train_score', 'split1_train_score',
+                  'split2_train_score',
+                  'std_test_score', 'std_train_score',
+                  'mean_test_time', 'std_test_time')
     n_candidates = n_grid_points
 
     for search, iid in zip((grid_search, grid_search_iid), (False, True)):
         assert_equal(iid, search.iid)
-        results = search.cv_results_
+        cv_results = search.cv_results_
         # Check if score and timing are reasonable
-        assert_true(all(results['test_rank_test_score'] >= 1))
-        assert_true(all(results[k] >= 0) for k in score_keys
+        assert_true(all(cv_results['rank_test_score'] >= 1))
+        assert_true(all(cv_results[k] >= 0) for k in score_keys
                     if k is not 'rank_test_score')
-        assert_true(all(results[k] <= 1) for k in score_keys
+        assert_true(all(cv_results[k] <= 1) for k in score_keys
                     if not k.endswith('time') and
                     k is not 'rank_test_score')
-        # Check results structure
-        check_cv_results_array_types(results, param_keys, score_keys)
-        check_cv_results_keys(results, param_keys, score_keys, n_candidates)
+        # Check cv_results structure
+        check_cv_results_array_types(cv_results, param_keys, score_keys)
+        check_cv_results_keys(cv_results, param_keys, score_keys, n_candidates)
         # Check masking
-        results = grid_search.cv_results_
+        cv_results = grid_search.cv_results_
         n_candidates = len(grid_search.cv_results_['params'])
-        assert_true(all((results['param_C'].mask[i] and
-                         results['param_gamma'].mask[i] and
-                         not results['param_degree'].mask[i])
+        assert_true(all((cv_results['param_C'].mask[i] and
+                         cv_results['param_gamma'].mask[i] and
+                         not cv_results['param_degree'].mask[i])
                         for i in range(n_candidates)
-                        if results['param_kernel'][i] == 'linear'))
-        assert_true(all((not results['param_C'].mask[i] and
-                         not results['param_gamma'].mask[i] and
-                         results['param_degree'].mask[i])
+                        if cv_results['param_kernel'][i] == 'linear'))
+        assert_true(all((not cv_results['param_C'].mask[i] and
+                         not cv_results['param_gamma'].mask[i] and
+                         cv_results['param_degree'].mask[i])
                         for i in range(n_candidates)
-                        if results['param_kernel'][i] == 'rbf'))
+                        if cv_results['param_kernel'][i] == 'rbf'))
         check_cv_results_grid_scores_consistency(search)
 
 
-def test_random_search_results():
+def test_random_search_cv_results():
     # Make a dataset with a lot of noise to get various kind of prediction
     # errors across CV folds and parameter settings
     X, y = make_classification(n_samples=200, n_features=100, n_informative=3,
@@ -709,22 +713,25 @@ def test_random_search_results():
     random_search_iid.fit(X, y)
 
     param_keys = ('param_C', 'param_gamma')
-    score_keys = ('test_mean_score', 'train_mean_score', 'test_mean_time',
-                  'test_rank_score', 'test_split0_score', 'test_split1_score',
-                  'test_split2_score', 'train_split0_score',
-                  'train_split1_score', 'train_split2_score',
-                  'test_std_score', 'train_std_score', 'test_std_time')
+    score_keys = ('mean_test_score', 'mean_train_score',
+                  'rank_test_score', 'rank_train_score',
+                  'split0_test_score', 'split1_test_score',
+                  'split2_test_score',
+                  'split0_train_score', 'split1_train_score',
+                  'split2_train_score',
+                  'std_test_score', 'std_train_score',
+                  'mean_test_time', 'std_test_time')
     n_cand = n_search_iter
 
     for search, iid in zip((random_search, random_search_iid), (False, True)):
         assert_equal(iid, search.iid)
-        results = search.cv_results_
+        cv_results = search.cv_results_
         # Check results structure
-        check_cv_results_array_types(results, param_keys, score_keys)
-        check_cv_results_keys(results, param_keys, score_keys, n_cand)
+        check_cv_results_array_types(cv_results, param_keys, score_keys)
+        check_cv_results_keys(cv_results, param_keys, score_keys, n_cand)
         # For random_search, all the param array vals should be unmasked
-        assert_false(any(results['param_C'].mask) or
-                     any(results['param_gamma'].mask))
+        assert_false(any(cv_results['param_C'].mask) or
+                     any(cv_results['param_gamma'].mask))
         check_cv_results_grid_scores_consistency(search)
 
 
@@ -806,15 +813,15 @@ def test_search_cv_results_rank_tie_breaking():
 
     for search in (grid_search, random_search):
         search.fit(X, y)
-        results = search.cv_results_
+        cv_results = search.cv_results_
         # Check tie breaking strategy -
         # Check that there is a tie in the mean scores between
         # candidates 1 and 2 alone
-        assert_almost_equal(results['mean_test_score'][0],
-                            results['mean_test_score'][1])
+        assert_almost_equal(cv_results['mean_test_score'][0],
+                            cv_results['mean_test_score'][1])
         try:
-            assert_almost_equal(results['mean_test_score'][1],
-                                results['mean_test_score'][2])
+            assert_almost_equal(cv_results['mean_test_score'][1],
+                                cv_results['mean_test_score'][2])
         except AssertionError:
             pass
         # 'min' rank should be assigned to the tied candidates
@@ -841,10 +848,10 @@ def test_grid_search_correct_score_results():
     Cs = [.1, 1, 10]
     for score in ['f1', 'roc_auc']:
         grid_search = GridSearchCV(clf, {'C': Cs}, scoring=score, cv=n_splits)
-        results = grid_search.fit(X, y).cv_results_
+        cv_results = grid_search.fit(X, y).cv_results_
 
         # Test scorer names
-        result_keys = list(results.keys())
+        result_keys = list(cv_results.keys())
         expected_keys = (("mean_test_score", "rank_test_score") +
                          tuple("split%d_test_score" % cv_i
                                for cv_i in range(n_splits)))