Konwersja ciąg od xmlcharrefreplace powrotem na UTF-8

mam Kolejna część kodu:Konwersja ciąg od xmlcharrefreplace powrotem na UTF-8

In [8]: st = u"опа" 

In [11]: st.encode("ascii", "xmlcharrefreplace") 
Out[11]: '&#1086;&#1087;&#1072;' 

In [14]: st1 = st.encode("ascii", "xmlcharrefreplace") 

In [15]: st1.decode("ascii", "xmlcharrefreplace") 
Out[15]: u'&#1086;&#1087;&#1072;' 

In [16]: st1.decode("utf-8", "xmlcharrefreplace") 
Out[16]: u'&#1086;&#1087;&#1072;'

Czy macie jakiś pomysł jak konwertować st1 powrotem do u"опа"?

Źródło

2013-06-27 Tural Gurbanov

Korzystanie instancją HTMLParser.HTMLParser():

>>> from HTMLParser import HTMLParser 
>>> parser = HTMLParser() 
>>> parser.unescape('&#1086;&#1087;&#1072;') 
u'\u043e\u043f\u0430' 
>>> print parser.unescape('&#1086;&#1087;&#1072;') 
опа

Źródło

2013-06-27 11:18:53

Jest doskonale pracować z 'u "опа"', ale nie działa w tym situatuion: '>>> z HTMLParser importowej HTMLParser' '> >> p = HTMLParser() ' ' >>> st = u "michel tel & # 243" ' ' >>> p.unescape (st) ' ' u'michel tel & # 243'' –

@TuralGurbanov: That ponieważ zapomniałeś dodać ';': 'u'michel tel ó ''. Musisz przekazać * prawne * jednostki XML. –

Och :) dziękuję. –

Konwersja ciąg od xmlcharrefreplace powrotem na UTF-8

Odpowiedz

Powiązane problemy