2016-11-30 12 views
13

Więc szukam w budowaniu mowy do aplikacji tekstowej dla zabawy. Zrobiłem kilka badań i znalazłem wbudowany interfejs API "Speech to Text" za pomocą RecognizerIntent, który jest darmowy, ale odkryłem również, że Google oferuje teraz interfejs API przetwarzania w chmurze, za który pobierana jest opłata.Różnica między Androidem Speech a Text API (Recognizer Intent) i Google Cloud Speech API?

Moje pytanie brzmi, jaka jest różnica między nimi, a jeśli korzystam z wbudowanego RecognizerIntent, czy to za darmo?

+0

Jak sam zauważyłeś, jeden jest wbudowany, a drugi to chmura API. – Houseman

+0

Yup - zakładam, że chmura jest bardziej solidna i ma więcej funkcji? W przeciwnym razie, dlaczego miałbyś używać jednego, a nie drugiego? – AndroidDev21921

+1

Za pomocą interfejsu API w chmurze można go używać z dowolnego urządzenia, które może wysyłać żądania http (laptop, iOS, serwer). Mogą również występować ograniczenia użytkowania, takie jak ograniczenia prędkości lub liczba żądań dziennie. Z wbudowanym modułem musisz używać tych bibliotek (Android) i zazwyczaj nie ma żadnych ograniczeń (chyba, że ​​lib otacza chmurę API). Ale to tylko ogólne API i biblioteka rzeczy. – Houseman

Odpowiedz

16

dla API Google Cloud mowy znajdują się w poniższym linku:

https://cloud.google.com/speech/. Oto najważniejsze:

  1. Obsługuje 80 różnych języków.
  2. Może rozpoznać audio przesłane w żądaniu.
  3. Powoduje zwrócenie tekstu w czasie rzeczywistym.
  4. Jest dokładny w hałaśliwym otoczeniu.
  5. Działa z aplikacjami na dowolnym urządzeniu i platformie.
  6. To nie jest za darmo. Zapoznaj się z poniższego linku do wyceny:

https://cloud.google.com/speech/pricing

Dla API Android mowy na tekst (Recognizer Intent), zapoznać się z poniższego linku:

http://www.androidhive.info/2014/07/android-speech-to-text-tutorial/. Oto najważniejsze:

  1. Musisz przekazać lokalny język, aby przekonwertować mowę na tekst.
  2. Nie wszystkie urządzenia obsługują wprowadzanie mowy w trybie offline.
  3. Nie można przekazać pliku audio do rozpoznania.
  4. Intencja zwraca tablicę ciągów pasujących do danych wejściowych. Możemy uważać pierwszy za najdokładniejszy.
  5. Działa tylko z telefonami z systemem Android.
  6. To nic nie kosztuje.