Mam bazę danych, która zawiera streaming wideo. Chcę obliczyć funkcje LBP z obrazów i dźwięku MFCC, a dla każdej klatki w filmie mam trochę adnotacji. Adnotacja jest zaznaczona ramkami wideo i czasem
Próbuję nauczyć realizację HMM GMM i stworzył prosty model wykryć jakieś pewne dźwięki (połączenia zwierzęce itp) Staram się trenować HMM (Ukryty model Markowa) sieci z GMM (Mieszanki Gaussa) w MATLAB
Mam już FFT i wysokość + absolutna częstotliwość obliczana w czasie rzeczywistym z wejścia mikrofonu. Teraz chcę obliczyć barwę. Widziałem współczynniki Cepstrum Mel częstotliwości - MFCC, ale nie roz