gbolmier
diff --git a/‎doc/modules/model_evaluation.rst
Lines changed: 1 addition & 0 deletions b/‎doc/modules/model_evaluation.rst
Lines changed: 1 addition & 0 deletions
diff --git a/‎sklearn/metrics/_scorer.py
Lines changed: 9 additions & 4 deletions b/‎sklearn/metrics/_scorer.py
Lines changed: 9 additions & 4 deletions
diff --git a/‎sklearn/metrics/tests/test_score_objects.py
Lines changed: 4 additions & 1 deletion b/‎sklearn/metrics/tests/test_score_objects.py
Lines changed: 4 additions & 1 deletion
@@ -60,6 +60,7 @@ Scoring                                Function
 **Classification**
 'accuracy'                             :func:`metrics.accuracy_score`
 'balanced_accuracy'                    :func:`metrics.balanced_accuracy_score`
+'top_k_accuracy'                       :func:`metrics.top_k_accuracy_score`
 'average_precision'                    :func:`metrics.average_precision_score`
 'neg_brier_score'                      :func:`metrics.brier_score_loss`
 'f1'                                   :func:`metrics.f1_score`                           for binary targets
 
@@ -27,9 +27,9 @@
 from . import (r2_score, median_absolute_error, max_error, mean_absolute_error,
                mean_squared_error, mean_squared_log_error,
                mean_poisson_deviance, mean_gamma_deviance, accuracy_score,
-               f1_score, roc_auc_score, average_precision_score,
-               precision_score, recall_score, log_loss,
-               balanced_accuracy_score, explained_variance_score,
+               top_k_accuracy_score, f1_score, roc_auc_score,
+               average_precision_score, precision_score, recall_score,
+               log_loss, balanced_accuracy_score, explained_variance_score,
                brier_score_loss, jaccard_score, mean_absolute_percentage_error)
 
 from .cluster import adjusted_rand_score
@@ -610,6 +610,9 @@ def make_scorer(score_func, *, greater_is_better=True, needs_proba=False,
 balanced_accuracy_scorer = make_scorer(balanced_accuracy_score)
 
 # Score functions that need decision values
+top_k_accuracy_scorer = make_scorer(top_k_accuracy_score,
+                                    greater_is_better=True,
+                                    needs_threshold=True)
 roc_auc_scorer = make_scorer(roc_auc_score, greater_is_better=True,
                              needs_threshold=True)
 average_precision_scorer = make_scorer(average_precision_score,
@@ -658,7 +661,9 @@ def make_scorer(score_func, *, greater_is_better=True, needs_proba=False,
                neg_root_mean_squared_error=neg_root_mean_squared_error_scorer,
                neg_mean_poisson_deviance=neg_mean_poisson_deviance_scorer,
                neg_mean_gamma_deviance=neg_mean_gamma_deviance_scorer,
-               accuracy=accuracy_scorer, roc_auc=roc_auc_scorer,
+               accuracy=accuracy_scorer,
+               top_k_accuracy=top_k_accuracy_scorer,
+               roc_auc=roc_auc_scorer,
                roc_auc_ovr=roc_auc_ovr_scorer,
                roc_auc_ovo=roc_auc_ovo_scorer,
                roc_auc_ovr_weighted=roc_auc_ovr_weighted_scorer,
 
@@ -53,7 +53,7 @@
                       'max_error', 'neg_mean_poisson_deviance',
                       'neg_mean_gamma_deviance']
 
-CLF_SCORERS = ['accuracy', 'balanced_accuracy',
+CLF_SCORERS = ['accuracy', 'balanced_accuracy', 'top_k_accuracy',
                'f1', 'f1_weighted', 'f1_macro', 'f1_micro',
                'roc_auc', 'average_precision', 'precision',
                'precision_weighted', 'precision_macro', 'precision_micro',
@@ -496,6 +496,9 @@ def test_classification_scorer_sample_weight():
         if name in REGRESSION_SCORERS:
             # skip the regression scores
             continue
+        if name == 'top_k_accuracy':
+            # in the binary case k > 1 will always lead to a perfect score
+            scorer._kwargs = {'k': 1}
         if name in MULTILABEL_ONLY_SCORERS:
             target = y_ml_test
         else: