2013-09-30 31 views
13

Mam plik txt rozmowy wyeksportowanej z WhatsApp. WhatsApp obsługuje emotikony w rozmowie, a wyeksportowana rozmowa również, ku mojemu zaskoczeniu, zawiera te emotikony! Oznacza to, że jeśli otworzę plik tekstowy w edytorze tekstów (Text Wrangler na Macu 10.8), widzę emotikony. Plik tekstowy jest zakodowany w UTF-8 i nie ma zasobów powiązanych z plikiem, który mogę powiedzieć.znaki specjalne (emotikony) w pliku tekstowym

Czy ktoś może mi wyjaśnić, w jaki sposób te emotikony są zawarte w pliku tekstowym i jak dokładnie są interpretowane przez edytor tekstu? Czy to w ogóle ma związek z kodowaniem znaków? Czy dodatkowe pliki znajdują się w pliku tekstowym?

Odpowiedz

21

Kod Unicode zawiera sekcje, które określają emoji jako "znaki". Są zwykłymi postaciami, potrzebujesz tylko czcionki, która je wyświetli. Zobacz także Unicode Emoji FAQ.

W pliku tekstowym znaki są w zasadzie zakodowane jako liczby w postaci bajtów. Aby wyświetlić je wizualnie na ekranie komputera, potrzebna jest czcionka, która zawiera wizualny gatunek glyph, aby wyrenderować tę postać. Ponieważ proces jest zawsze numeryczny identyfikator → czcionka → widoczny glyph, powinno być dość oczywiste, że "znak" może być wszystko wizualne, w tym emotikony lub inny obraz.

character viewer

+1

Niezłe wyjaśnienie. Dodam, że gdy emotikony są kodowane przy użyciu standardowych punktów kodowania Unicode, takich jak U + 1F600, można użyć dowolnej czcionki, która je zawiera. Czasami używane są codepoints Private Use, a następnie potrzebujesz bardzo specyficznej czcionki, która ma emotikony w tych "współdzielonych" punktach kodowych. –

+1

kilka sposobów, aby poprawić tę odpowiedź: 1) gdzie dostałeś ten wykres? 2) przykład użycia tego wykresu do wstawienia symbolu/symbolu emoji – ahnbizcad