Ponieważ utf8 MySQL nie obsługuje znaków 4-bajtowych, szukam sposobu na wykrycie i wyeliminowanie 4 bajtowych utf8 znaków z ciągu w Ruby. Rozumiem, że mogę zaktualizować tabelę, aby używać utf8m4, ale z kilku powodów, które nie są możliwe lub pożądane rozwiązanie.Jak usunąć 4-bajtowe utf-8 znaków w Ruby?
Po prostu kodowanie ciągu znaków do ASCII spowoduje usunięcie tych znaków, ale spowoduje również usunięcie wszystkich innych znaków spoza zestawu ASCII, co nie jest dobre.
Dzięki! Wydaje się oczywiste, że już to zasugerowałeś. Tak głęboko zastanawiałem się nad kodowaniem, nie myślałem po prostu patrzeć na liczbę bajtów każdej postaci. – JZC
Jaka jest wydajność tego z długim ciągiem? 5000+ znaków? –
dziękuję dziękuję dziękuję ... nie osobiście martwisz się o wydajność, na chwilę jestem szczęśliwy, że mam działające rozwiązanie – steve