"ValueError: labels ['timestamp'] not contained in axis"
nie masz nagłówków w pliku, więc sposób można go załadować masz df
gdzie nazwy kolumn są pierwszymi wierszami danych. Próbowałeś uzyskać dostęp do colunm timestamp
, która nie istnieje.
Twoje u.data
nie mają nagłówków w nim
$head u.data
196 242 3 881250949
186 302 3 891717742
więc praca z nazwami kolumn nie będzie możliwe, chyba dodawać nagłówki. Możesz dodać nagłówki do pliku u.data
, np. Otworzyłem go w edytorze tekstowym i dodałem wiersz a b c timestamp
na górze (wydaje się, że jest to plik rozdzielany tabulatorami, więc zachowaj ostrożność, dodając nagłówek, aby nie używać spacji, w przeciwnym razie łamie format)
$head u.data
a b c timestamp
196 242 3 881250949
186 302 3 891717742
teraz twoje prace kod i data.columns
powraca
Index([u'a', u'b', u'c', u'timestamp'], dtype='object')
a reszta śladu kodzie roboczej jest obecnie
(100000, 4) # the shape
['a', 'b', 'c', 'timestamp'] # the columns
a b c timestamp # the df
0 196 242 3 881250949
1 186 302 3 891717742
2 22 377 1 878887116
3 244 51 2 880606923
4 166 346 1 886397596
5 298 474 4 884182806
6 115 265 2 881171488
7 253 465 5 891628467
8 305 451 3 886324817
9 6 86 3 883603013
Jeśli nie chcesz, aby dodać nagłówki
Albo można upuścić kolumnę „timestamp” używając To indeks (przypuszczalnie 3), możemy zrobić to przy użyciu df.ix
poniżej wybiera wszystkie wiersze, kolumny indeksu 0 do indeksu 2 w ten sposób rezygnację z kolumny o indeksie 3
data.ix[:, 0:2]
Prawdopodobny duplikat [ValueError: etykiety \ ['znacznik czasu' \] nie zawarte w osi] (http://stackoverflow.com/questions/37763715/valueerror-labels-timestamp-not-contained-in-axis) – pekapa