Podczas generowania wykresów rozproszenia wielu punktów w R (na przykład przy użyciu ggplot()
) może być wiele punktów, które znajdują się za innymi i wcale nie są widoczne. Na przykład patrz poniższy wykres:Zmniejsz rozmiar pliku PDF za pomocą filtrowania ukrytych obiektów.
Jest to wykres punktowy od kilkuset tysięcy punktów, ale większość z nich znajduje się za innych punktach. Problem polega na tym, że podczas rzutowania danych wyjściowych do pliku wektorowego (na przykład pliku PDF), niewidoczne punkty powodują, że rozmiar pliku jest tak duży, a także zwiększa się wykorzystanie pamięci i procesora podczas przeglądania pliku.
Prostym rozwiązaniem jest rzutowanie obrazu na bitmapę (na przykład TIFF lub PNG), ale tracą one jakość wektorową i mogą być jeszcze większe. Próbowałem niektórych kompresorów PDF online, ale wynik był tego samego rozmiaru co mój oryginalny plik.
Czy istnieje jakieś dobre rozwiązanie? Na przykład jakiś sposób filtrowania punktów, które nie są widoczne, prawdopodobnie podczas generowania wykresu lub po nim, edytując plik PDF?
Zalecanym rozwiązaniem jest wykres sześciokątny. Jednak w kolorze sześciokąta kolor wskazuje liczbę wartości w każdym pojemniku i wydaje się, że używasz koloru do czegoś innego. – Roland
+1 dla heksbina. Inne opcje to 'sunflowerplot' i' bigvis' package: https://github.com/hadley/bigvis – Ben
@Roland Tak, ponieważ odgadłeś, że kolory punktów są znaczące, więc dla mojego przypadku hexbin nie jest dobrym rozwiązaniem – Ali