2015-05-19 14 views
25

Próbuję uzyskać pogrupowany boxplot pracuje używając Seaborn jak na exampleSeaborn load_dataset

mogę uzyskać powyższy przykład działa, jednak wiersz:

tips = sns.load_dataset("tips") 

nie jest wyjaśnione w ogóle. Zlokalizowałem plik tips.csv, ale nie mogę znaleźć odpowiedniej dokumentacji na temat tego, co konkretnie robi load_dataset. Próbowałem stworzyć własny plik CSV i załadować go, ale bez skutku. Ja też przemianowany plik wskazówek i nadal pracował ...

Moje pytanie brzmi zatem:

Gdzie jest load_dataset rzeczywiście szuka plików? Czy mogę go użyć na własne plansze?

EDYCJA: Udało mi się uzyskać własną działkę przy użyciu mojego własnego DataFrame, ale nadal zastanawiam się, czy load_dataset jest używany do niczego więcej niż tajemniczych przykładów samouczka.

+2

'load_dataset' jest po prostu wygodną funkcją dla dokumentacji morskiej. – mwaskom

Odpowiedz

36

load_dataset wyszukuje pliki csv online pod numerem https://github.com/mwaskom/seaborn-data. Oto dokumentacja:

Załaduj zestaw danych z internetowego repozytorium (wymaga połączenia z Internetem).

Parametry


name: str Nazwa zestawu danych (name .csv na https://github.com/mwaskom/seaborn-data). Można uzyskać listę dostępnych zestawów danych przy użyciu : func: get_dataset_names

KWS: DICT, opcjonalnie przekazywane do pandas.read_csv

Jeśli chcesz zmodyfikować ten zestaw danych w trybie online lub przynieść własne dane, prawdopodobnie trzeba użyć pandas. load_dataset faktycznie zwraca obiekt pandy DataFrame, który można potwierdzić za pomocą type(tips).

Jeśli już stworzył własne dane w pliku csv nazwie, powiedzmy, tips2.csv i zapisaniu go w tym samym miejscu jako skryptu, to wykorzystać (po zainstalowaniu pandy), aby załadować go w:

import pandas as pd 

tips2 = pd.read_csv('tips2.csv')