8
mam ciąg znaków ASCII, z podmiotami HTML, takich jak:Jak przekonwertować z HTML na UTF-8 w Javie
à
¨
ç
muszę ten łańcuch zostanie bez tych podmiotów i przekształcenie ich w UTF-8 znaków . Czy jest jakiś łatwy sposób, w języku Java, aby to zrobić?
Gdzie:
Clazz.method("aà","UTF-8")
powraca "AA"
czy coś takiego?
Masz na myśli zamiast "à" masz i agrave; ? Na przykład zamiast * "c'est-à-dire" * masz * "c'est- & agrave; -dire" *? (wiesz, że ASCII definiuje tylko 128 współrzędnych poprawnych? "à" to ** nie ** znak ASCII) – SyntaxT3rr0r
ok, zredagowałem twój wpis, aby zobaczyć, że był to problem z kodowaniem w twoim pytaniu. – SyntaxT3rr0r
Sposób, w jaki zadajesz to pytanie, jest nieco dziwny, ponieważ HTML i UTF-8 to dwie zupełnie różne rzeczy - HTML to format pliku, a UTF-8 to kodowanie znaków. Pliki HTML mają kodowanie znaków, tzn. Możesz mieć plik HTML zakodowany w UTF-8, kodowany ISO-8859-1 itd. – Jesper