Move tokenizer tests to nose

James Graham · James Graham · commit 918027cefb3b · 2011-07-24T20:58:43.000+02:00
--HG--
extra : rebase_source : 690f67ebe16128990d5a788d1c53833c1f0af2f4
diff --git a/html5lib/tests/test_tokenizer.py b/html5lib/tests/test_tokenizer.py
@@ -1,6 +1,5 @@
 import sys
 import os
-import unittest
 import cStringIO
 import warnings
 import re
@@ -122,7 +121,7 @@ def tokensMatch(expectedTokens, receivedTokens, ignoreErrorOrder,
                         tokens[tokenType][1].append(token)
         return tokens["expected"] == tokens["received"]
 
-def unescape_test(test):
+def unescape(test):
     def decode(inp):
         return inp.decode("unicode-escape")
 
@@ -138,7 +137,6 @@ def decode(inp):
                     token[2][decode(key)] = decode(value)
     return test
 
-
 def runTokenizerTest(test):
     #XXX - move this out into the setup function
     #concatenate all consecutive character tokens into a single token
@@ -163,8 +161,7 @@ def runTokenizerTest(test):
                           "\nreceived:", unicode(tokens)])
     errorMsg = errorMsg.encode("utf-8")
     ignoreErrorOrder = test.get('ignoreErrorOrder', False)
-    assert tokensMatch(expected, received, ignoreErrorOrder), errorMsg
-
+    assert tokensMatch(expected, received, ignoreErrorOrder, True), errorMsg
 
 def _doCapitalize(match):
     return match.group(1).upper()
@@ -176,8 +173,7 @@ def capitalize(s):
     s = _capitalizeRe(_doCapitalize, s)
     return s
 
-
-def test_tokenizer():
+def testTokenizer():
     for filename in html5lib_test_files('tokenizer', '*.test'):
         tests = json.load(file(filename))
         testName = os.path.basename(filename).replace(".test","")
@@ -190,4 +186,3 @@ def test_tokenizer():
                 for initialState in test["initialStates"]:
                     test["initialState"] = capitalize(initialState)
                     yield runTokenizerTest, test
-