2010-05-13 6 views
8

mam ciąg znaków ASCII, z podmiotami HTML, takich jak:Jak przekonwertować z HTML na UTF-8 w Javie

à 
¨ 
ç 

muszę ten łańcuch zostanie bez tych podmiotów i przekształcenie ich w UTF-8 znaków . Czy jest jakiś łatwy sposób, w języku Java, aby to zrobić?

Gdzie:

Clazz.method("aà","UTF-8") 

powraca "AA"

czy coś takiego?

+0

Masz na myśli zamiast "à" masz i agrave; ? Na przykład zamiast * "c'est-à-dire" * masz * "c'est- & agrave; -dire" *? (wiesz, że ASCII definiuje tylko 128 współrzędnych poprawnych? "à" to ** nie ** znak ASCII) – SyntaxT3rr0r

+1

ok, zredagowałem twój wpis, aby zobaczyć, że był to problem z kodowaniem w twoim pytaniu. – SyntaxT3rr0r

+0

Sposób, w jaki zadajesz to pytanie, jest nieco dziwny, ponieważ HTML i UTF-8 to dwie zupełnie różne rzeczy - HTML to format pliku, a UTF-8 to kodowanie znaków. Pliki HTML mają kodowanie znaków, tzn. Możesz mieć plik HTML zakodowany w UTF-8, kodowany ISO-8859-1 itd. – Jesper

Odpowiedz