Matches in SemOpenAlex for { <https://semopenalex.org/work/W2052947690> ?p ?o ?g. }
- W2052947690 endingPage "333" @default.
- W2052947690 startingPage "321" @default.
- W2052947690 abstract "When using hidden Markov models for speech recognition, it is usually assumed that the probability that a particular acoustic vector is emitted at a given time only depends on the current state and the current acoustic vector observed. In this paper, we introduce another idea, i.e., we assume that, in a given state, the acoustic vectors are generated by a continuous Markov process. Indeed, the time evolution of the acoustic vector is inherently dynamic and continuous, and sampling only occurs for the purpose of computation. This allows us to assign a probability density to the time trajectory of the acoustic vector inside the state, reflecting the probability that this particular path has been generated by the continuous Markov process associated with this state. Roughly speaking, it measures the “adequacy” of the observed trajectory with respect to an ideal trajectory, which is modelled by a vectorial linear differential equation. This model is introduced in order to describe the dynamic behaviour of the acoustic vector inside a state. Once the segmentation is fixed, reestimation formulae for the parameters of the continuous Markov process are derived for the Viterbi algorithm. As usual, the segmentation can be obtained by sampling the continuous process, and by applying dynamic programming to find the best path over all the possible sequences of states and all the possible durations. Finally, we sketch a possible generalization to path mixtures, for which different trajectories are available in each state. However, we have to stress that no experimental results are available at present. Indeed, we did not have the opportunity to test the algorithm on real speech. We are aware of the fact that the assumptions we did may not be appropriate for the modelling of speech. Wenn man “hidden” Markovmodelle zur Spracherkennung benutzt, macht man gewöhnlich die Hypothese, daß die Ausgabewahrscheinlichkeit eines akustischen nur vom derzeitigen Zustand und Vektor abhängt. In diesem Beitrag betrachten wir eine weniger einschränkende Hypothese: wir nehmen an, daß innerhalb eines Zustands der Markovkette, die akustischen Vektoren durch einen kontinuierlichen Markovprozess generiert werden. In der Tat, der Zeitverlauf des Sprachsignals ist in Wirklichkeit kontinuierlich und die Abtastung wird nur ausgeführt zu Zwecken der numerischen Berechnung. Wir weisen dem beobachteten Zeitverlauf des akustischen Vektors eine Wahrscheinlichkeitsdichte zu, welche die Wahrscheinlichkeit angibt, daß dieser bestimmte Zeitverlauf von dem jeweiligen Markovprozess ausgegeben wurde. Die Warhscheinlichkeitsdichte misst die Angemessenheit der beobachteten Zeitverlaufs im Verhältnis zu einem idealen Zeitverlauf welcher anhand einer Differentialgleichung beschrieben wird. Wenn die Segmentierung bestimmt ist, können die Formeln der Wiedereinschätzung der Parameter des kontinuierlichen Markovmodells anhand des Viterbi-algorithmus berechnet werden. Die wahrscheinlichste Segmentierung (im Sinne der maximalen Wahrscheinlichkeit) wird erhalten indem der kontinuierliche Prozes abgetastet wird und mit Hilfe der dynamischen Programmierung der beste Weg errechnet wird für alle möglichen Segmentierungen und Dauern. Schliesslich, erwähnen wir eine mögliche Generalisierung für eine Mischung von Zeitverläufen wenn mehrere Zeitverläufe von dem gleichen Zustand aus erreichbar sind. Wir sind uns bewußt, daß unsere Annahmen möglicherweise nicht auf das Sprachsignal übertragbar sind. Lorsqu'on utilise des modèles de Markov cachés pour la reconnaissance de la parole, l'on fait habituellement l'hypothèse que la probabilité d'émission d'un vecteur acoustique ne dépend que de l'état courant et du vecteur acoustique actuellement observé. Dans cet article, nous envisageons une hypothèse moins restrictive: nous considérons qu'au sein d'un même état de la chaîne de Markov, les vecteurs acoustiques sont générés par un processus markovien continu. En effet, l'évolution temporelle du signal de parole est intrinsèquement continue, et l'échantillonnage n'est réalisé que pour les besoins de calculs numériques. Nous assignons une densité de probabilité à la trajectoire temporelle observée du vecteur acoustique, reflétant la probabilité que cette particulière a été générée par le processus markovien continu associé à l'état. Elle mesure “l'adéquation” de cette trajectoire observée par rapport à une trajectoire idéale, supposée générée par équation différentielle vectorielle linéaire. Une fois la segmentation fixée, les formules de réestimation pour les paramètres du modèle markovien continu peuvent être calculées dans le cadre de l'algorithme de Viterbi. La segmentation la plus probable (au sens du maximum de vraisemblance) s'obtient en échantillonnant le processus continu, et en calculant le meilleur chemin à travers toutes les segmentations possibles et toutes les durées possibles par programmation dynamique. Ensuite, nous mentionnons une extension possible à des mélanges de trajectoires, pour laquelle plusieures trajectoires sont accessibles dans un même état. Cependant, aucun test expérimental n'a encoure été effectué pour le moment, si bien que les hypothèses que nous avons faites ne pourraient pas s'appliquer au signal de parole." @default.
- W2052947690 created "2016-06-24" @default.
- W2052947690 creator A5015460788 @default.
- W2052947690 date "1993-08-01" @default.
- W2052947690 modified "2023-10-18" @default.
- W2052947690 title "A continuous-time dynamic formulation of Viterbi algorithm for one-Gaussian-per-state hidden Markov models" @default.
- W2052947690 cites W1552736770 @default.
- W2052947690 cites W1667165204 @default.
- W2052947690 cites W172953872 @default.
- W2052947690 cites W1833981795 @default.
- W2052947690 cites W1990005915 @default.
- W2052947690 cites W1994396704 @default.
- W2052947690 cites W1997093580 @default.
- W2052947690 cites W2010585829 @default.
- W2052947690 cites W2020127877 @default.
- W2052947690 cites W2020335243 @default.
- W2052947690 cites W2037315394 @default.
- W2052947690 cites W2051725967 @default.
- W2052947690 cites W2061903919 @default.
- W2052947690 cites W2062533874 @default.
- W2052947690 cites W2064218608 @default.
- W2052947690 cites W2070256701 @default.
- W2052947690 cites W2070351351 @default.
- W2052947690 cites W2088943892 @default.
- W2052947690 cites W2105080323 @default.
- W2052947690 cites W2105505506 @default.
- W2052947690 cites W2112197391 @default.
- W2052947690 cites W2125838338 @default.
- W2052947690 cites W2130039513 @default.
- W2052947690 cites W2135090195 @default.
- W2052947690 cites W2139576349 @default.
- W2052947690 cites W2140337865 @default.
- W2052947690 cites W2141899961 @default.
- W2052947690 cites W2146121986 @default.
- W2052947690 cites W2148776466 @default.
- W2052947690 cites W2152042469 @default.
- W2052947690 cites W2154136024 @default.
- W2052947690 cites W2156101286 @default.
- W2052947690 cites W2165253089 @default.
- W2052947690 cites W2171850596 @default.
- W2052947690 cites W2342418827 @default.
- W2052947690 cites W2396232061 @default.
- W2052947690 cites W2798909945 @default.
- W2052947690 cites W2989448192 @default.
- W2052947690 cites W3017143921 @default.
- W2052947690 cites W3148186152 @default.
- W2052947690 cites W52437239 @default.
- W2052947690 cites W72699008 @default.
- W2052947690 doi "https://doi.org/10.1016/0167-6393(93)90081-u" @default.
- W2052947690 hasPublicationYear "1993" @default.
- W2052947690 type Work @default.
- W2052947690 sameAs 2052947690 @default.
- W2052947690 citedByCount "4" @default.
- W2052947690 crossrefType "journal-article" @default.
- W2052947690 hasAuthorship W2052947690A5015460788 @default.
- W2052947690 hasConcept C105795698 @default.
- W2052947690 hasConcept C11413529 @default.
- W2052947690 hasConcept C119857082 @default.
- W2052947690 hasConcept C121332964 @default.
- W2052947690 hasConcept C1276947 @default.
- W2052947690 hasConcept C13662910 @default.
- W2052947690 hasConcept C159886148 @default.
- W2052947690 hasConcept C163836022 @default.
- W2052947690 hasConcept C189973286 @default.
- W2052947690 hasConcept C196455857 @default.
- W2052947690 hasConcept C199360897 @default.
- W2052947690 hasConcept C23224414 @default.
- W2052947690 hasConcept C2777735758 @default.
- W2052947690 hasConcept C2777798563 @default.
- W2052947690 hasConcept C28490314 @default.
- W2052947690 hasConcept C33923547 @default.
- W2052947690 hasConcept C41008148 @default.
- W2052947690 hasConcept C54907487 @default.
- W2052947690 hasConcept C60582962 @default.
- W2052947690 hasConcept C64939953 @default.
- W2052947690 hasConcept C74650414 @default.
- W2052947690 hasConcept C98763669 @default.
- W2052947690 hasConceptScore W2052947690C105795698 @default.
- W2052947690 hasConceptScore W2052947690C11413529 @default.
- W2052947690 hasConceptScore W2052947690C119857082 @default.
- W2052947690 hasConceptScore W2052947690C121332964 @default.
- W2052947690 hasConceptScore W2052947690C1276947 @default.
- W2052947690 hasConceptScore W2052947690C13662910 @default.
- W2052947690 hasConceptScore W2052947690C159886148 @default.
- W2052947690 hasConceptScore W2052947690C163836022 @default.
- W2052947690 hasConceptScore W2052947690C189973286 @default.
- W2052947690 hasConceptScore W2052947690C196455857 @default.
- W2052947690 hasConceptScore W2052947690C199360897 @default.
- W2052947690 hasConceptScore W2052947690C23224414 @default.
- W2052947690 hasConceptScore W2052947690C2777735758 @default.
- W2052947690 hasConceptScore W2052947690C2777798563 @default.
- W2052947690 hasConceptScore W2052947690C28490314 @default.
- W2052947690 hasConceptScore W2052947690C33923547 @default.
- W2052947690 hasConceptScore W2052947690C41008148 @default.
- W2052947690 hasConceptScore W2052947690C54907487 @default.
- W2052947690 hasConceptScore W2052947690C60582962 @default.
- W2052947690 hasConceptScore W2052947690C64939953 @default.
- W2052947690 hasConceptScore W2052947690C74650414 @default.