Mam zestaw danych z następującymi trzema pierwszymi kolumnami. Dołącz identyfikator koszyka (unikatowy identyfikator), kwotę sprzedaży (w dolarach) i datę transakcji. Chcę obliczyć następujące kolumna dla każdego wiersza zestawu danych i chciałbym to w Pythonie.Python - wyrównanie szeregów czasowych i funkcje "na dzień"
Poprzednia sprzedaż tego samego koszyka (jeśli istnieje); Liczba sprzedaży do tej pory dla bieżącego koszyka; Do tej pory dla bieżącego koszyka (jeśli jest dostępny); MAX Data dla bieżącej kosza (jeśli są dostępne)
Basket Sale Date PrevSale SaleCount MeanToDate MaxToDate
88 $15 3/01/2012 1
88 $30 11/02/2012 $15 2 $23 $30
88 $16 16/08/2012 $30 3 $20 $30
123 $90 18/06/2012 1
477 $77 19/08/2012 1
477 $57 11/12/2012 $77 2 $67 $77
566 $90 6/07/2012 1
Jestem całkiem nowy w Pythonie, i naprawdę ciężko będzie znaleźć coś go w fantazyjny sposób. Posortowałem dane (jak wyżej) według BasketID i Date, dzięki czemu mogę uzyskać wcześniejszą sprzedaż hurtową, przesuwając ją o jeden dla każdego pojedynczego koszyka. Nie ma wskazówki, jak uzyskać MeanToDate i MaxToDate w skuteczny sposób, z wyjątkiem zapętlenia ... jakichkolwiek pomysłów?
Jaki jest format bieżącego "zestawu danych" (trzy pierwsze kolumny)? Czy jest to plik czy używasz obecnie jakiejś struktury danych? – askewchan
Przepraszam, zapomniałem wspomnieć. pochodzi z pliku tekstowego, ale jest przechowywany w ramce danych pandy. –