Test for sort warning in DataFrame and clean up sort test for Series

pandas-dev · jreback · May 31, 2018 · Apr 20, 2018 · Apr 25, 2018 · May 8, 2018
commit 0399822f16bbe44cfb910ab342dea7774d8a0d4e
diff --git a/pandas/tests/frame/test_analytics.py b/pandas/tests/frame/test_analytics.py
@@ -858,44 +858,55 @@ def wrapper(x):
         (True, {'H': [8, 9, np.nan, np.nan],
                 'I': [8, 9, np.nan, np.nan],
                 'J': [1, np.nan, np.nan, np.nan],
-                'K': ['a', np.nan, np.nan, np.nan],
-                'L': Categorical(['a', np.nan, np.nan, np.nan],
+                'K': Categorical(['a', np.nan, np.nan, np.nan],
                                  categories=['a']),
-                'M': to_datetime(['2000-1-2', 'NaT', 'NaT', 'NaT']),
-                'N': to_timedelta(['1 days', 'nan', 'nan', 'nan']),
-                'O': [0, 1, 2, 3]}),
+                'L': to_datetime(['2000-1-2', 'NaT', 'NaT', 'NaT']),
+                'M': to_timedelta(['1 days', 'nan', 'nan', 'nan']),
+                'N': [0, 1, 2, 3]}),
         (False, {'H': [8, 9, np.nan, np.nan],
                  'I': [8, 9, np.nan, np.nan],
                  'J': [1, np.nan, np.nan, np.nan],
-                 'K': [np.nan, 'a', np.nan, np.nan],
-                 'L': Categorical([np.nan, 'a', np.nan, np.nan],
+                 'K': Categorical([np.nan, 'a', np.nan, np.nan],
                                   categories=['a']),
-                 'M': to_datetime(['NaT', '2000-1-2', 'NaT', 'NaT']),
-                 'N': to_timedelta(['nan', '1 days', 'nan', 'nan']),
-                 'O': [0, 1, 2, 3]})
+                 'L': to_datetime(['NaT', '2000-1-2', 'NaT', 'NaT']),
+                 'M': to_timedelta(['nan', '1 days', 'nan', 'nan']),
+                 'N': [0, 1, 2, 3]})
     ])
     def test_mode_dropna(self, dropna, expected):
 
-        df = pd.DataFrame({"A": [12, 12, 19, 11],
-                           "B": [10, 10, np.nan, 3],
-                           "C": [1, np.nan, np.nan, np.nan],
-                           "D": [np.nan, np.nan, 'a', np.nan],
-                           "E": Categorical([np.nan, np.nan, 'a', np.nan]),
-                           "F": to_datetime(['NaT', '2000-1-2', 'NaT', 'NaT']),
-                           "G": to_timedelta(['1 days', 'nan', 'nan', 'nan']),
-                           "H": [8, 8, 9, 9],
-                           "I": [9, 9, 8, 8],
-                           "J": [1, 1, np.nan, np.nan],
-                           "K": [np.nan, np.nan, 'a', 'a'],
-                           "L": Categorical(['a', np.nan, 'a', np.nan]),
-                           "M": to_datetime(['2000-1-2', '2000-1-2',
-                                             'NaT', 'NaT']),
-                           "N": to_timedelta(['1 days', 'nan',
-                                              '1 days', 'nan']),
-                           "O": np.arange(4, dtype='int64')})
+        df = DataFrame({"A": [12, 12, 19, 11],
+                        "B": [10, 10, np.nan, 3],
+                        "C": [1, np.nan, np.nan, np.nan],
+                        "D": [np.nan, np.nan, 'a', np.nan],
+                        "E": Categorical([np.nan, np.nan, 'a', np.nan]),
+                        "F": to_datetime(['NaT', '2000-1-2', 'NaT', 'NaT']),
+                        "G": to_timedelta(['1 days', 'nan', 'nan', 'nan']),
+                        "H": [8, 8, 9, 9],
+                        "I": [9, 9, 8, 8],
+                        "J": [1, 1, np.nan, np.nan],
+                        "K": Categorical(['a', np.nan, 'a', np.nan]),
+                        "L": to_datetime(['2000-1-2', '2000-1-2',
+                                          'NaT', 'NaT']),
+                        "M": to_timedelta(['1 days', 'nan',
+                                           '1 days', 'nan']),
+                        "N": np.arange(4, dtype='int64')})
 
         result = df[sorted(list(expected.keys()))].mode(dropna=dropna)
-8000
        expected = pd.DataFrame(expected)
+        expected = DataFrame(expected)
+        tm.assert_frame_equal(result, expected)
+
+    @pytest.mark.skipif(not compat.PY3, reason="only PY3")
+    def test_mode_sortwarning(self):
+        # Check for the warning that is raised when the mode
+        # results cannot be sorted
+
+        df = DataFrame({"A": [np.nan, np.nan, 'a', 'a']})
+        expected = DataFrame({'A': ['a', np.nan]})
+
+        with tm.assert_produces_warning(UserWarning, check_stacklevel=False):
+            result = df.mode(dropna=False)
+            result = result.sort_values(by='A').reset_index(drop=True)
+
         tm.assert_frame_equal(result, expected)
 
     def test_operators_timedelta64(self):

diff --git a/pandas/tests/series/test_analytics.py b/pandas/tests/series/test_analytics.py
@@ -364,18 +364,16 @@ def test_mode_intoverflow(self, dropna, expected1, expected2):
         tm.assert_series_equal(s.mode(dropna), expected2)
 
     @pytest.mark.skipif(not compat.PY3, reason="only PY3")
 f = getattr(htable, "mode_{dtype}".format(dtype=ndtype)) 
 result = f(values) 
 try: 
     result = np.sort(result) 
 except TypeError as e: 
     warn("Unable to sort modes: {error}".format(error=e)) 
 f = getattr(htable, "mode_{dtype}".format(dtype=ndtype)) 
 result = f(values) 
 try: 
     result = np.sort(result) 
 except TypeError as e: 
     warn("Unable to sort modes: {error}".format(error=e)) 
-    @pytest.mark.parametrize('dropna, expected', [
-        (False, ['foo', np.nan]),
-    ])
-    def test_mode_sortwarning(self, dropna, expected):
+    def test_mode_sortwarning(self):
         # Check for the warning that is raised when the mode
         # results cannot be sorted
 
-        expected = Series(expected)
+        expected = Series(['foo', np.nan])
         s = Series([1, 'foo', 'foo', np.nan, np.nan])
 
         with tm.assert_produces_warning(UserWarning, check_stacklevel=False):
-            result = s.mode(dropna).sort_values().reset_index(drop=True)
+            result = s.mode(dropna=False)
+            result = result.sort_values().reset_index(drop=True)
 
         tm.assert_series_equal(result, expected)