Redshift będący magazynem kolumnowym, przechowywanie danych w formacie JSON nie przyspieszyłoby kwerend na nim. To działałoby na bazie danych modelu NOSQL, ale nie na RedShift. Aby sprawić, by zapytania RedShift były efektywne, styl dystrybucji (nawet w przypadku scenariusza, w którym dane nie są zgodne lub dziwne) w tabelach jest ważny, w zależności od liczby posiadanych klastrów. Ponadto klucz Dystrybucja w kolumnie klucza podstawowego (w innym przypadku model RDBMS) i klucz sortowania na tym samym poziomie ułatwiłoby Ci dołączanie (przy użyciu łączenia Sortuj scalenie zamiast dłuższego przyłączenia skrótu).
Aby uzyskać więcej informacji na ten temat, zajrzyj do dokumentacji. RTFM jest tu twoim przyjacielem.
czy możesz dodać przykład? ogólnie wszystkie manipulacje tekstem powodują, że zapytania działają dłużej - ale pomocne może być zobaczenie zapytania – alexanderlz