2015-09-16 59 views
6

Próbuję dołączyć (nieco) duży zbiór danych w pakiecie R. Wciąż otrzymuję Ostrzeżenie podczas odprawy Rstudio mówiąc, że mogę zaoszczędzić miejsce z kompresją:Jak kompresować zapisy w kompilacji pakietu R

* checking data for ASCII and uncompressed saves ... WARNING 

    Note: significantly better compression could be obtained 
     by using R CMD build --resave-data 
      old_size new_size compress 
    slp.rda 499Kb 310Kb bzip2 
    sst.rda 1.3Mb 977Kb  xz 

Próbowałem dodanie -- resave-data do „Konfiguracja buid Narzędzia” RStudio do żadnego efektu.

enter image description here

Odpowiedz

5

devtools funkcja use_data przyjmuje parametr dla rodzaju kompresji i umożliwia dodawanie danych do PKGS znacznie łatwiejsze w ogóle. Używając go lub po prostu save na własną rękę), używaj kompresji xz podczas zapisywania danych (dla save jest to parametr compression_level).

Jeśli chcesz użyć --resave-data to można spróbować --resave-data=best ponieważ tylko przy użyciu domyślnych --resave-data do gzip (zyskuje dość dużo nic w tym przypadku).

Aby uzyskać więcej informacji, patrz Building package tarballs.

+1

Dzięki za odpowiedź - próbowałem 'save' z kompresją. Błąd kompresji już nie istnieje, ale teraz otrzymuję ostrzeżenie: Ostrzeżenie: zależność od potrzeb pakietu zależy od R (> = 2.10) '. Jakieś doświadczenie z tym? –

+3

Wynika to z dodatkowej kompresji. Dodaj 'R (> = 2.10)' do twojego pliku 'DESCRIPTION'. – hrbrmstr

0

Inną alternatywą, jeśli masz duży zestaw danych, którego nie chcesz ponownie utworzyć, jest użycie tools::resaveRdaFiles z poziomu R. Skieruj go na plik zestawu danych lub cały katalog danych, a skompresuje dane w wybranym formacie. Aby uzyskać więcej informacji, zobacz jej numer manual page.