Chciałbym utworzyć wykres rozproszenia pand z DataFrame z kategorycznymi etykietami wierszy i kolumn przy użyciu matplotlib
. Przykładowa DataFrame wygląda następująco:Parsowanie wykresów DataFrame z kategorycznie oznaczonymi wierszami/kolumnami
Rozmiar znacznika jest funkcją odpowiednich wartości DataFrame. Do tej pory, ja przyszedłem z niezręcznej rozwiązanie, które zasadniczo wylicza wierszy i kolumn, działki dane, a następnie rekonstruuje etykiety:
flat = df.reset_index(drop=True).T.reset_index(drop=True).T.stack().reset_index()
# level_0 level_1 0
#0 0 0 1
#1 0 1 2
#2 1 0 3
#3 1 1 4
flat.plot(kind='scatter', x='level_0', y='level_1', s=100*flat[0])
plt.xticks(range(df.shape[1]), df.columns)
plt.yticks(range(df.shape[0]), df.index)
plt.show()
Teraz pytanie: czy istnieje bardziej intuicyjny, bardziej zintegrowany sposób tworzenia tego wykresu rozproszonego, najlepiej bez podziału danych i metadanych?
Nie sądzę, możemy korzystać z danych liczbowych dla non-kreślenia. AFAIK i tak będziesz musiał ustawić takty oddzielnie ... – MaxU
Domyślam się, że pytanie tłumaczy się w * "Dlaczego żadna biblioteka nie zaimplementowała mojej niestandardowej funkcji życzeń?" *. – ImportanceOfBeingErnest