robię kilka ćwiczeń z zestawów danych tak:Lista wielu słowników Słownik VS z kilkoma listami?
Lista z wielu słowników
users = [
{"id": 0, "name": "Ashley"},
{"id": 1, "name": "Ben"},
{"id": 2, "name": "Conrad"},
{"id": 3, "name": "Doug"},
{"id": 4, "name": "Evin"},
{"id": 5, "name": "Florian"},
{"id": 6, "name": "Gerald"}
]
słownik z kilku list
users2 = {
"id": [0, 1, 2, 3, 4, 5, 6],
"name": ["Ashley", "Ben", "Conrad", "Doug","Evin", "Florian", "Gerald"]
}
Pandy dataframes
import pandas as pd
pd_users = pd.DataFrame(users)
pd_users2 = pd.DataFrame(users2)
print pd_users == pd_users2
Pytania:
- Mam struktury zbiorów danych, takich jak użytkownicy lub podobnego users2?
- Czy występują różnice w wydajności?
- Czy jest czytelniejszy od drugiego?
- Czy istnieje standard, którego powinienem przestrzegać?
- Zwykle konwertuję je na ramki danych pand. Kiedy to robię, obie wersje są identyczne ... prawda?
- Dane wyjściowe są prawdziwe dla każdego elementu, więc nie ma znaczenia, czy pracuję z prawą panda df?
Nicea pytania pójdę z pierwszej opcji, bo Recon wyszukiwania i wstawiania będzie mniej uciążliwe w porównaniu z drugi numer: – therealprashant
Byłbym na pierwszym miejscu, o ile wygoda użytkowania jest najważniejszym aspektem. Posiadanie identyfikatora razem z NAME będzie przydatne podczas przenoszenia. –
Pierwsza wersja jest łatwa do sortowania tam, gdzie druga nie. –