W aplikacji, muszę porównać nagrywanie na żywo z wcześniej lokalnie zapisanym poleceniem głosowym, jeśli pasuje (nie tylko tekst, ale także zidentyfikowane osoby głos), a następnie wykonaj niezbędne czynności.Porównaj dwa dźwięki (lokalnie przechowywane wcześniej nagrane polecenie głosowe i nagrane z mikrofonu w aplikacji) w iOS
Komendy głosowe 1-meczowe od tej samej osoby.
Tekst polecenia 2-meczowego.
Zastosowałem wiele sposobów, ale żaden nie działa zgodnie z moimi oczekiwaniami.
pierwsze: użycie mowy na tekst Biblioteka jak OpenEars, SpeechKit ale te biblioteki konwertować tylko tekst z mową.
Wynik: Nie Jak moje oczekiwania
drugie: (druk Finger Audio)
acrcloud Library: w tej bibliotece, mogę nagrać polecenie i przechowywane że mp3file na serwerze acrcloud i dopasować się do nagrania na żywo (mówione przeze mnie), nie pasuje, ale kiedy odtwarzam to samo nagranie (nagrany plik MP3 mojego głosu), który jest przesłany na serwer Acrcloud, to pasuje. Wynik: Nie Jak moje oczekiwania
API.AI: w tej bibliotece, to jest jak mowy na tekst, mam pewne komendy tekstowe przechowywane na swoim serwerze, a następnie ktoś mówi to samo polecenie wynikiem uzyskać sukces. Wynik: Nie Jak moje oczekiwania
Proszę zasugerować mi, jak rozwiązać ten problem dla iOS Aplikacja
@ gnasher729 zabawy z zeszłego tygodnia, zgodnie z komentarzem jest to możliwe. –
jeśli biblioteka Acrcloud się nie udała, to podbijcie ją na swojej stronie internetowej. –
@TejaNandamuri biblioteka akrcloud nie zawodzi, ale moje oczekiwania różnią się od tego, aby dopasować głos osoby wraz z zawartością. –