Pierwotnym pytaniem jest plik zawierający 5 GB URL odwiedzany w ostatnim dniu, znajdź najczęstszy częsty URL. Problem można rozwiązać, używając mapy skrótów, aby policzyć wystąpienia odrębnego adresu URL i znaleźć najlepsze k za pomocą min sterty, przyjmując czas O (n log k).Znajdź górny adres URL odwiedzin z ostatniego dnia, ostatniej godziny lub ostatniej minuty?
Teraz zastanawiam się, co jeśli dane wejściowe były nieograniczonym strumieniem danych online (zamiast pliku statycznego), to skąd mogę wiedzieć, jaki jest najwyższy adres URL ostatniego dnia?
Czy jest jakaś poprawa, którą mogę wprowadzić do systemu, który pozwala mi dynamicznie uzyskać górny adres URL k ostatniej minuty i ostatniego dnia i ostatniej godziny?
Każda wskazówka zostanie doceniona !!
Zamówienie http://stackoverflow.com/a/10190836/404145 – DiveInto