Czy10 * 10-krotny sprawdzian krzyżowy w nauce scikit?
class sklearn.cross_validation.ShuffleSplit(
n,
n_iterations=10,
test_fraction=0.10000000000000001,
indices=True,
random_state=None
)
właściwa droga dla 10 * 10fold CV w scikit-learn? (Zmieniając random_state do 10 różnych numerów)
Bo nie znaleźliśmy żadnego parametru random_state
w Stratified K-Fold
lub K-Fold
i oddzielone od K-Fold
są zawsze identyczne do tych samych danych.
Jeśli ShuffleSplit
jest w porządku, jeden problemem jest to, że jest ona wymieniona
Uwaga: w przeciwieństwie do innych strategii cross-walidacji, przypadkowe podziały nie gwarancji, że wszystkie fałdy będzie inaczej, choć jest to nadal bardzo prawdopodobne w przypadku dużych zestawów danych
Czy ma to zawsze miejsce w przypadku 10 * 10-krotnego CV?
Dzięki, właśnie tego szukałem. BTW, widziałem 42 razy w przykładach na stronie internetowej, jakąś historię na ten temat? – Flake
Zadajesz niewłaściwe pytanie :) http://en.wikipedia.org/wiki/42_(Hitchhiker%27s_Guide_to_the_Galaxy)#Answer_to_the_Ultimate_Question_of_Life.2C_the_Universe.2C_and_Everything_.2842.29 – ogrisel
Znam to! Ale zapomniałem 42 jest tym ... – Flake