Python re
modułu documentation mówi, że gdy flaga re.UNICODE
jest ustawiony, '\s'
będzie pasował:Python regex ' s' nie pasuje do BOM Unicode (U + FEFF)
cokolwiek jest klasyfikowany jako przestrzeni w Baza danych właściwości znaków Unicode.
O ile mogę stwierdzić, BOM (U + FEFF) to classified as a space.
Jednakże:
re.match(u'\s', u'\ufeff', re.UNICODE)
ocenia się None
.
Czy to błąd w Pythonie, czy coś mi brakuje?
'len ([c dla c na mapie (chr, range (sys.maxunicode + 1)) jeśli unicodedata.category (c) == 'Cf' i c.isspace()])' wynosi zero. – jfs