Mam następujące polecenie do zamiany znaków Unicode na znaki ASCII.Jak zamienić znaki Unicode na ASCII
sed -i 's/Ã/A/g'
Problemem jest Ã
nie jest rozpoznawany przez polecenia sed w moim środowisku Unix więc ja zakładam, że zastąpić go jego wartości szesnastkowej. Jak wyglądałaby składnia, gdybym zamiast tego używał C3
?
Używam tego polecenia jako wzorzec dla innych znaków chciałbym zamienić z pustych przestrzeniach, takich jak:
sed -i „s/©// g”
masz na myśli? http://stackoverflow.com/questions/22450563/sed-matching-unicode-blocks-z – Leo
Jakiego zestawu znaków używa twój terminal? A jakie kodowanie wykorzystuje tekst wejściowy? W UTF-8 jest 0xC3 0x83, a znak 0x83 jest kodem kontrolnym w ISO 8859-1, więc może to być problem. Przypuszczam, że nie możesz po prostu ustawić 'LANG = en_US.UTF-8' na swoim systemie. – yellowantphil
"sed" wykona zadanie. Proszę zobaczyć moją odpowiedź. – ajaaskel