Pracuję więc nad projektem C (ANSI 9899: 1999) i próbuję ustalić, od czego zacząć: Unicode, UTF-8 i cały ten jazz.Gdzie mogę rozpocząć korzystanie z programowania przyjaznego dla Unicode w C?
W szczególności jest to projekt tłumacza językowego i mam dwa główne miejsca, w których muszę obsługiwać Unicode: czytanie w plikach źródłowych (język ostentacyjnie obsługuje identyfikatory Unicode i inne) oraz w obiektach ciągowych.
Jestem zaznajomiony ze wszystkimi oczywistymi podstawami dotyczącymi Unicode, UTF-7/8/16/32 & UCS-2/4, tak i tak dalej ... W większości poszukuję użytecznej, specyficznej dla C (to znaczy, proszę, nie proszę C++ lub C#, który jest wszystkim, co zostało tu wcześniej udokumentowane na SO), co do moich "kolejnych kroków" w celu implementacji elementów przyjaznych dla Unicode ... w C.
Wszelkie linki, strony podręczników, artykuły z Wikipedii, przykładowy kod, jest bardzo mile widziany. Spróbuję także zachować listę takich zasobów tutaj w pierwotnym pytaniu, dla każdego, kto stanie się później.
- musi przeczytać przed rozważeniem cokolwiek innego, jeśli jesteś zaznajomiony z Unicode, a co za kodowanie faktycznie jest: http://www.joelonsoftware.com/articles/Unicode.html
- UTF-8 home-page: http://www.utf-8.com/
man 3 iconv
(jak równieżiconv_open
iiconvctl
)- International Components for Unicode (poprzez Geoff Reedy)
libbasekit
, który wydaje się to światło Unicode obsługi narzędzi- Glib ma jedne Unicode działa
- Podstawowym UTF-8 detector funkcyjnego przez Christoph
+1 do iconv, gdzie jest ona dostępna. na windows icu może być lepsza opcja –