Twilio może dostarczyć call recording, ale to nie jest w czasie rzeczywistym. Czy można napisać aplikację, która przetwarza dźwięk dzwoniącego w czasie rzeczywistym i odpowiada po przetworzeniu dźwięku? Chciałbym, aby jakieś oprogramowanie "słuchało" głośnika i reagowało programowo.Czy można uzyskać dostęp do strumienia audio na żywo w wywołaniu Twilio?
Odpowiedz
Dwa lata później Twilio opublikował przypadek użycia, który próbowałem wykonać sam. Mają teraz usługę rozpoznawania mowy w czasie rzeczywistym wbudowaną w programowalny głos. Jest w publicznej wersji beta: https://www.twilio.com/blog/2017/05/introducing-speech-recognition.html
Twilio nie oferuje sposobu przetwarzania dźwięku jako wejścia IVR, o ile wiem. Oferują możliwość wprowadzania liczb, ale nie jest to tak inteligentne, jak to, czego szukasz: https://www.twilio.com/docs/api/twiml/gather.
Możesz jednak odsłuchać połączenie, które właśnie trwa, z przerwami. Musi być ustawiony jako konferencja. Konferencja może zrobić wszystko, co może zrobić zwykła tarcza. Możesz wyłączyć niektóre z dodatkowych funkcji, a następnie możesz skorzystać z biblioteki twilio js, aby dyskretnie dołączyć do konferencji i słuchać rozmowy. Przypuszczam, że gdybyś był bardzo ambitny, mógłbyś użyć mowy do oprogramowania tekstowego, aby robić różne rzeczy za pośrednictwem klienta Twilio.
Zobacz annyang! dla pewnej interaktywności tekstu mowy: https://www.talater.com/annyang/