html5lib
diff --git a/‎src/html5lib/tokenizer.py
Lines changed: 8 additions & 8 deletions b/‎src/html5lib/tokenizer.py
Lines changed: 8 additions & 8 deletions
@@ -627,15 +627,15 @@ def bogusCommentState(self):
     def markupDeclarationOpenState(self):
         charStack = [self.stream.char(), self.stream.char()]
         if charStack == [u"-", u"-"]:
-            self.currentToken = {"type": "Comment", "data": ""}
+            self.currentToken = {"type": "Comment", "data": u""}
             self.state = self.states["commentStart"]
         else:
             for x in xrange(5):
                 charStack.append(self.stream.char())
             # Put in explicit EOF check
             if (not EOF in charStack and
                 "".join(charStack).upper() == u"DOCTYPE"):
-                self.currentToken = {"type":"Doctype", "name":"",
+                self.currentToken = {"type":"Doctype", "name":u"",
                   "publicId":None, "systemId":None, "correct":True}
                 self.state = self.states["doctype"]
             else:
@@ -822,10 +822,10 @@ def beforeDoctypePublicIdentifierState(self):
         if data in spaceCharacters:
             pass
         elif data == "\"":
-            self.currentToken["publicId"] = ""
+            self.currentToken["publicId"] = u""
             self.state = self.states["doctypePublicIdentifierDoubleQuoted"]
         elif data == "'":
-            self.currentToken["publicId"] = ""
+            self.currentToken["publicId"] = u""
             self.state = self.states["doctypePublicIdentifierSingleQuoted"]
         elif data == ">":
             self.tokenQueue.append({"type": "ParseError", "data":
@@ -878,10 +878,10 @@ def afterDoctypePublicIdentifierState(self):
         if data in spaceCharacters:
             pass
         elif data == "\"":
-            self.currentToken["systemId"] = ""
+            self.currentToken["systemId"] = u""
             self.state = self.states["doctypeSystemIdentifierDoubleQuoted"]
         elif data == "'":
-            self.currentToken["systemId"] = ""
+            self.currentToken["systemId"] = u""
             self.state = self.states["doctypeSystemIdentifierSingleQuoted"]
         elif data == ">":
             self.tokenQueue.append(self.currentToken)
@@ -903,10 +903,10 @@ def beforeDoctypeSystemIdentifierState(self):
         if data in spaceCharacters:
             pass
         elif data == "\"":
-            self.currentToken["systemId"] = ""
+            self.currentToken["systemId"] = u""
             self.state = self.states["doctypeSystemIdentifierDoubleQuoted"]
         elif data == "'":
-            self.currentToken["systemId"] = ""
+            self.currentToken["systemId"] = u""
             self.state = self.states["doctypeSystemIdentifierSingleQuoted"]
         elif data == ">":
             self.tokenQueue.append({"type": "ParseError", "data":