Myślę, że to, co opisałeś, przypomina różnicę pomiędzy optymalizacją dla różnych wzorców dostępu (sekwencyjny, wsadowy a losowy) niż różnica między przepustowością a opóźnieniem w najczystszym znaczeniu.
Kiedy myślę o systemie o dużym opóźnieniu, nie myślę o tym, do którego zapisu mam dostęp, ale raczej o tym, że dostęp do każdej płyty ma wysokie koszty ogólne. Uzyskanie dostępu nawet do pierwszego bajtu pliku z HDFS może zająć około sekundy lub więcej.
Jeśli masz więcej skłonności ilościowych, możesz pomyśleć o łącznym czasie wymaganym do uzyskania dostępu do wielu rekordów N jako T(N)=aN+b
. Tutaj, a
reprezentuje przepustowość, a b
oznacza opóźnienie. W systemie takim, jak HDFS, N jest często tak duży, że b
staje się nieistotny, a korzystne dla niego są korzystne rozwiązania polegające na niskiej wartości a
. Porównaj to z magazynem danych o małym opóźnieniu, w którym często każdy odczyt ma tylko dostęp do pojedynczego rekordu, a następnie optymalizacja pod kątem niskiego poziomu b
jest lepsza.
Po tym stwierdzeniu twoje oświadczenie nie jest niepoprawne; Jest to z pewnością prawda i często zdarza się, że sklepy z dostępem do partii mają dużą zwłokę i wysoką przepustowość, podczas gdy sklepy z dostępem losowym mają małe opóźnienie i niską przepustowość, ale nie zawsze tak jest.
Wygląda dobrze dla mnie. – Tariq