scikit-learn
diff --git a/‎sklearn/metrics/tests/test_metrics.py
Lines changed: 114 additions & 84 deletions b/‎sklearn/metrics/tests/test_metrics.py
Lines changed: 114 additions & 84 deletions
@@ -556,6 +556,21 @@ def test_roc_curve_toydata():
     assert_array_almost_equal(fpr, [0, 1])
     assert_almost_equal(roc_auc, .5)
 
+    y_true = [0, 0]
+    y_score = [0.25, 0.75]
+    tpr, fpr, _ = roc_curve(y_true, y_score)
+    assert_raises(ValueError, roc_auc_score, y_true, y_score)
+    assert_array_almost_equal(tpr, [ 0. ,  0.5,  1. ])
+    assert_array_almost_equal(fpr, [ np.nan,  np.nan,  np.nan])
+
+    y_true = [1, 1]
+    y_score = [0.25, 0.75]
+    tpr, fpr, _ = roc_curve(y_true, y_score)
+    assert_raises(ValueError, roc_auc_score, y_true, y_score)
+    assert_array_almost_equal(tpr, [ np.nan,  np.nan])
+    assert_array_almost_equal(fpr, [ 0.5,  1. ])
+
+
     # Multi-label classification task
     y_true = np.array([[0, 1], [0, 1]])
     y_score = np.array([[0, 1], [0, 1]])
@@ -1101,91 +1116,106 @@ def test_precision_recall_curve_errors():
 
 
 def test_precision_recall_curve_toydata():
-    # Binary classification
-    y_true = [0, 1]
-    y_score = [0, 1]
-    p, r, _ = precision_recall_curve(y_true, y_score)
-    auc_prc = average_precision_score(y_true, y_score)
-    assert_array_almost_equal(p, [1, 1])
-    assert_array_almost_equal(r, [1, 0])
-    assert_almost_equal(auc_prc, 1.)
-
-    y_true = [0, 1]
-    y_score = [1, 0]
-    p, r, _ = precision_recall_curve(y_true, y_score)
-    auc_prc = average_precision_score(y_true, y_score)
-    assert_array_almost_equal(p, [ 0.5,  0. ,  1. ])
-    assert_array_almost_equal(r, [ 1.,  0.,  0.])
-    assert_almost_equal(auc_prc, 0.25)
-
-    y_true = [1, 0]
-    y_score = [1, 1]
-    p, r, _ = precision_recall_curve(y_true, y_score)
-    auc_prc = average_precision_score(y_true, y_score)
-    assert_array_almost_equal(p, [0.5, 1])
-    assert_array_almost_equal(r, [1., 0])
-    assert_almost_equal(auc_prc, .75)
-
-    y_true = [1, 0]
-    y_score = [1, 0]
-    p, r, _ = precision_recall_curve(y_true, y_score)
-    auc_prc = average_precision_score(y_true, y_score)
-    assert_array_almost_equal(p, [1, 1])
-    assert_array_almost_equal(r, [1, 0])
-    assert_almost_equal(auc_prc, 1.)
+    with np.errstate(all="raise"):
+        # Binary classification
+        y_true = [0, 1]
+        y_score = [0, 1]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        auc_prc = average_precision_score(y_true, y_score)
+        assert_array_almost_equal(p, [1, 1])
+        assert_array_almost_equal(r, [1, 0])
+        assert_almost_equal(auc_prc, 1.)
+
+        y_true = [0, 1]
+        y_score = [1, 0]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        auc_prc = average_precision_score(y_true, y_score)
+        assert_array_almost_equal(p, [ 0.5,  0. ,  1. ])
+        assert_array_almost_equal(r, [ 1.,  0.,  0.])
+        assert_almost_equal(auc_prc, 0.25)
+
+        y_true = [1, 0]
+        y_score = [1, 1]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        auc_prc = average_precision_score(y_true, y_score)
+        assert_array_almost_equal(p, [0.5, 1])
+        assert_array_almost_equal(r, [1., 0])
+        assert_almost_equal(auc_prc, .75)
+
+        y_true = [1, 0]
+        y_score = [1, 0]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        auc_prc = average_precision_score(y_true, y_score)
+        assert_array_almost_equal(p, [1, 1])
+        assert_array_almost_equal(r, [1, 0])
+        assert_almost_equal(auc_prc, 1.)
+
+        y_true = [1, 0]
+        y_score = [0.5, 0.5]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        auc_prc = average_precision_score(y_true, y_score)
+        assert_array_almost_equal(p, [0.5, 1])
+        assert_array_almost_equal(r, [1, 0.])
+        assert_almost_equal(auc_prc, .75)
+
+        y_true = [0, 0]
+        y_score = [0.25, 0.75]
+        assert_raises(Exception, precision_recall_curve, y_true, y_score)
+        assert_raises(Exception, average_precision_score, y_true, y_score)
+
+        y_true = [1, 1]
+        y_score = [0.25, 0.75]
+        p, r, _ = precision_recall_curve(y_true, y_score)
+        assert_almost_equal(average_precision_score(y_true, y_score), 1.)
+        assert_array_almost_equal(p, [ 1. ,  1.,  1.])
+        assert_array_almost_equal(r, [1, 0.5, 0.])
+
+
+        # Multi-label classification task
+        y_true = np.array([[0, 1], [0, 1]])
+        y_score = np.array([[0, 1], [0, 1]])
+        assert_raises(Exception, average_precision_score, y_true, y_score,
+                      average="macro")
+        assert_raises(Exception, average_precision_score, y_true, y_score,
+                      average="weighted")
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="samples"), 1.)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="micro"), 1.)
+
+        y_true = np.array([[0, 1], [0, 1]])
+        y_score = np.array([[0, 1], [1, 0]])
+        assert_raises(Exception, average_precision_score, y_true, y_score,
+                      average="macro")
+        assert_raises(Exception, average_precision_score, y_true, y_score,
+                      average="weighted")
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="samples"), 0.625)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="micro"), 0.625)
+
+        y_true = np.array([[1, 0], [0, 1]])
+        y_score = np.array([[0, 1], [1, 0]])
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="macro"), 0.25)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="weighted"), 0.25)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="samples"), 0.25)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="micro"), 0.25)
+
+        y_true = np.array([[1, 0], [0, 1]])
+        y_score = np.array([[0.5, 0.5], [0.5, 0.5]])
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="macro"), 0.75)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="weighted"), 0.75)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="samples"), 0.75)
+        assert_almost_equal(average_precision_score(y_true, y_score,
+                            average="micro"), 0.75)
 
-    y_true = [1, 0]
-    y_score = [0.5, 0.5]
-    p, r, _ = precision_recall_curve(y_true, y_score)
-    auc_prc = average_precision_score(y_true, y_score)
-    assert_array_almost_equal(p, [0.5, 1])
-    assert_array_almost_equal(r, [1, 0.])
-    assert_almost_equal(auc_prc, .75)
-
-    # Multi-label classification task
-    y_true = np.array([[0, 1], [0, 1]])
-    y_score = np.array([[0, 1], [0, 1]])
-    assert_raises(ValueError, average_precision_score, y_true, y_score,
-                  average="macro")
-    assert_raises(ValueError, average_precision_score, y_true, y_score,
-                  average="weighted")
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="samples"), 1.)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="micro"), 1.)
-
-    y_true = np.array([[0, 1], [0, 1]])
-    y_score = np.array([[0, 1], [1, 0]])
-    assert_raises(ValueError, average_precision_score, y_true, y_score,
-                  average="macro")
-    assert_raises(ValueError, average_precision_score, y_true, y_score,
-                  average="weighted")
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="samples"), 0.625)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="micro"), 0.625)
-
-    y_true = np.array([[1, 0], [0, 1]])
-    y_score = np.array([[0, 1], [1, 0]])
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="macro"), 0.25)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="weighted"), 0.25)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="samples"), 0.25)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="micro"), 0.25)
-
-    y_true = np.array([[1, 0], [0, 1]])
-    y_score = np.array([[0.5, 0.5], [0.5, 0.5]])
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="macro"), 0.75)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="weighted"), 0.75)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="samples"), 0.75)
-    assert_almost_equal(average_precision_score(y_true, y_score,
-                        average="micro"), 0.75)
 
 def test_score_scale_invariance():
     # Test that average_precision_score and roc_auc_score are invariant by