2013-06-08 5 views
128

Więc całkowicie rozumiem, jak używać resample, ale dokumentacja nie działa dobrze wyjaśniając opcje.panda dokumentuje próbkę ponownie

Więc większość opcji w funkcji resample są dość proste, z wyjątkiem tych dwóch:

  • zasadą: offset łańcuch lub obiekt reprezentujący konwersji podsystemu
  • jak: ciąg, metoda dla puchu lub re- próbkowania, domyślnie „znaczy”

Więc patrząc na tak wiele przykładów jak znaleźć w internecie widzę dla reguły można zrobić 'D' na dobę, 'xMin' dla minutach 'xL' na milisekundy, ale to wszystko, co mogłem znaleźć.

na jak widziałem co następuje: 'first', np.max, 'last', 'mean' i 'n1n2n3n4...nx' gdzie nx jest pierwsza litera każdego indeksu kolumny.

Czy jest gdzieś w dokumentacji, której brakuje, że wyświetla każdą opcję dla reguły pandas.resample i jak wejść? Jeśli tak, gdzie, ponieważ nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?

+6

Dla wędrowców Google, za pomocą 'resampling jak last'' = 'i' how = 'first'': nie zapomnij dodać 'closed =' left ', label =' left''. [link] (https://github.com/pydata/pandas/issues/1998) –

+0

@ NasserAl-Wohaibi Jestem przekonany, że powyższy komentarz jest wskazówką, że te opcje mogą pomóc w pełni odpowiedzieć na następujące pytanie. Napotkaliście już ten problem? http://stackoverflow.com/questions/26247301/causal-resampling-values-within-time-window-until-now –

+0

how = 'last' jest teraz przestarzałe na rzecz 'resample (...). last() ' – shadi

Odpowiedz

200
B  business day frequency 
C  custom business day frequency (experimental) 
D  calendar day frequency 
W  weekly frequency 
M  month end frequency 
SM  semi-month end frequency (15th and end of month) 
BM  business month end frequency 
CBM  custom business month end frequency 
MS  month start frequency 
SMS  semi-month start frequency (1st and 15th) 
BMS  business month start frequency 
CBMS custom business month start frequency 
Q  quarter end frequency 
BQ  business quarter endfrequency 
QS  quarter start frequency 
BQS  business quarter start frequency 
A  year end frequency 
BA  business year end frequency 
AS  year start frequency 
BAS  business year start frequency 
BH  business hour frequency 
H  hourly frequency 
T  minutely frequency 
S  secondly frequency 
L  milliseonds 
U  microseconds 
N  nanoseconds 

Zobacz timeseries documentation. Zawiera listę offsets (i 'anchored' offsets) oraz sekcję o numerze resampling.

Zauważ, że nie jest to lista wszystkich różnych how opcji, ponieważ może to być dowolna funkcja array NumPy i każda funkcja, która jest dostępna poprzez groupby dispatching mogą być przekazywane do how według nazwy.

+1

" ... ponieważ może to być dowolna funkcja tablicowa NumPy i ... "- tak, czytałem to w dokumentach, ale czy jest tam jakaś dokumentacja wyjaśniająca, co dokładnie ta funkcja ma robić i co ma robić z resamplingiem ...? Czuję się tutaj bardzo zagubiony. – jhin

+0

Powinno to być powiązane we wszystkich odpowiednich obszarach dokumentacji, takich jak ponowne próbkowanie. Oto link do skrótów: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases – wordsforthewise

63

coś więcej niż tylko to, ale jesteś prawdopodobnie patrząc na tej liście:

B business day frequency 
C custom business day frequency (experimental) 
D calendar day frequency 
W weekly frequency 
M month end frequency 
BM business month end frequency 
MS month start frequency 
BMS business month start frequency 
Q quarter end frequency 
BQ business quarter endfrequency 
QS quarter start frequency 
BQS business quarter start frequency 
A year end frequency 
BA business year end frequency 
AS year start frequency 
BAS business year start frequency 
H hourly frequency 
T minutely frequency 
S secondly frequency 
L milliseconds 
U microseconds 

Źródło: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

+4

Dlaczego nie ma "Min" (jak "5Min" używane w dokumentacja)? – ziyuang