Istnieje kilka wątków na stackoverflow, ale nie mogłem znaleźć poprawnego rozwiązania problemu jako całości.Kodek "ascii" nie może kodować znaków na pozycji * ord nie jest w zasięgu (128)
Zebrałem ogromne sumy danych tekstowych z funkcji odczytu urllib i zapisałem to samo w plikach pikli.
Teraz chcę zapisać te dane do pliku. Pisząc Dostaję błędy podobne do -
'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128)
i dużo danych jest stracone.
Przypuszczam dane off urllib czytać jest bajt danych
Próbowałem
1. text=text.decode('ascii','ignore')
2. s=filter(lambda x: x in string.printable, s)
3. text=u''+text
text=text.decode().encode('utf-8')
ale wciąż im kończąc podobnych błędów. Czy ktoś może wskazać właściwe rozwiązanie. A także będzie działać stripe kodeków. Nie mam żadnych problemów, jeśli bajty konfliktu nie są zapisywane do pliku jako ciąg znaków, dlatego utrata jest akceptowana.
można pokazać, co jest w 'text'? –