2011-06-28 7 views
24

Gdybym przypisać unicode surowych literałów do zmiennej, mogę odczytać jej wartość:Jak odkodować surowe literały Unicode na czytelny ciąg?

>>> s = u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> print s 
Сообщение отправлено 

Ale kiedy już przypisana wartość na równinie, nie Unicode ciąg, nie mogę:

>>> s = '\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
'\\u0421\\u043e\\u043e\\u0431\\u0449\\u0435\\u043d\\u0438\\u0435 \\u043e\\u0442\\u043f\\u0440\\u0430\\u0432\\u043b\\u0435\\u043d\\u043e' 
>>> print s 
\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e 

Jak mogę go odkodować i przeczytać?

Odpowiedz

31

Użyj unicode_escape codec:

s.decode('unicode_escape') 
+3

(Powodem jest, że "\ uXXXX" jest * dosłowny * w literałowym ciągu znaków Unicode.) –

+0

Znalezione najlepsze rozwiązanie, w historii dla rosyjskich znaków –

0

Jeśli otrzymujesz dziwne rezultaty podczas dekodowania spróbować następujące

print repr(s).decode('unicode-escape').encode('latin-1') // or encode using some other encoding 

Mogło być tak, że zacisk Python używa domyślnego ASCII i jest symbolem, który wychodzi z zasięg.