2012-05-02 17 views
8

Próbuję zbudować kolekcję angielskich słów, które są trudne do wymówienia.Czy istnieje sposób na określenie stopnia trudności wymowy słowa?

Zastanawiam się, czy istnieje jakiś algorytm lub teoria, która może być użyta do pokazania, jak trudne jest wymówienie słowa.

Czy to ci się wydaje, jako coś, co można obliczyć?

Ponieważ wydaje się to być bardzo subiektywną rzeczą, pozwólcie, że uczynię to bardziej obiektywnym, powiedzmy najtrudniejsze słowa do wymówienia przez technologie przetwarzania tekstu na mowę. Programy

+1

Trudniejsze dla kogo? – dweiss

+2

Wiele słów jest trudnych do wymówienia dla programistów Lisp. –

+0

Podczas gdy byłoby to bardzo interesującym problemem do rozwiązania, fakt, że angielski zawiera wiele słów wzroku ... musiałoby być dużo "zakodowanych" oczekiwań – afuzzyllama

Odpowiedz

3

Jednym podejściem byłoby zbudowanie listy z dwiema wersjami każdego słowa. Jedna poprawna pisownia, a druga to słowo pisane za pomocą najprostszej pisowni fonetycznej. Zastosuj funkcję odległości dla dwóch słów (np. Odległość Levenshteina http://en.wikipedia.org/wiki/Levenshtein_distance). Im większa odległość między tymi dwoma słowami, tym trudniejsze będzie wymówienie słowa.

+0

To bardzo sprytny przyjacielu! – Yasser1984

0

Do pewnego stopnia ...

mowy na przykład użyć systemu fonetyki i spróbować wymówić słowa.

Na przykład, „chwyt” będzie podzielony na:

GR-A-Sp

Jednak dla słów obcych (lub słowa, które nie stosują ten deseń), listy wyjątków muszą być przechowywane np Jacht

+0

Dobra uwaga, jakie słowa najczęściej wymawia się w programach do konwersji tekstu na mowę? – Yasser1984

1

Wielki problem! Z góry mojej głowy mógłbyś stworzyć system zawierający wszystkie litery alfabetu fonetycznego i połączone ciężary pomiędzy każdą kombinacją opartą na trudności (bardzo specyficzne, więc może potrzebować wielu ludzi, którzy testują i biorą średnie itd.), A następnie mają listę wszystkich słowa ze słownika angielskiego przechowywane na dysku i wywoływanie skryptu, który przechodzi przez każdy wpis i wykonuje skrobanie w Internecie na wikipedii dla pisowni fonetycznej i ocenia ich trudność. To może wziąć pod uwagę długość słowa, a także trudność między fonetyką, a następnie uporządkować listę na podstawie trudności.

Ów co bym spróbować i robić: P

0

Sugestia

szczęście wymowy jako proces zależy od dwóch czynników tych należą

  1. telefony wchodzące w skład słowa i położenie samogłosek i pół samogłosek, tj.

/a /,/ae /,/e /,/i /,/o /,/u /,/w /,/j/...

  1. długość słowa .

pierwsza dotyczy mechaniki produkcji dźwięku telefonu jako Veluma, policzki język muszą zostać zmienione, aby produkować różne dźwięki związane z poszczególnymi telefonami tj nosa itd. To sprawia, że ​​niektóre słowa trudniej wymówić jako wymagany ruch może być dużo. Zapoznaj się z książkami na temat fonetyki, aby znaleźć pozycje wypowiadania każdego telefonu.

Algorytm

a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/ 

powodzenia.