ręcznie, można użyć pd.DataFrame
konstruktora, dając numpy array (data
) oraz listę nazw kolumn (columns
). Aby mieć wszystko w jednym DataFrame można łączyć funkcje i cel w jednym numpy tablicy z np.c_[...]
(uwaga []
):
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
# save load_iris() sklearn dataset to iris
# if you'd like to check dataset type use: type(load_iris())
# if you'd like to view list of attributes use: dir(load_iris())
iris = load_iris()
# np.c_ is the numpy concatenate function
# which is used to concat iris['data'] and iris['target'] arrays
# for pandas column argument: concat iris['feature_names'] list
# and string list (in this case one string); you can make this anything you'd like..
# the original dataset would probably call this ['Species']
data1 = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
columns= iris['feature_names'] + ['target'])
Czy możesz dodać trochę tekstu, aby objaśnić ten kod? Jest to nieco zwięzłe według naszych standardów. – gung
Niektóre paczki mają nazwę feature_names jako ndarray, która będzie łamać parametr columns. –
Brakujący klucz "Gatunek" i wartości dla ramki danych. – mastash3ff