Matches in SemOpenAlex for { <https://semopenalex.org/work/W2050487305> ?p ?o ?g. }
- W2050487305 endingPage "76" @default.
- W2050487305 startingPage "65" @default.
- W2050487305 abstract "This paper presents a comprehensive study of continuous speech recognition in Spanish. It shows the use and optimisation of several well-known techniques together with the application for the first time to Spanish of language specific knowledge to these systems, i.e. the careful selection of the phone inventory, the phone-classes used, and the selection of alternative pronunciation rules. We have developed a semicontinuous phone-class dependent contextual modelling. Using four phone-classes, we have obtained recognition error rate reductions roughly equivalent to the percentage increase of the number of parameters, compared to baseline semicontinuous contextual modelling. We also show that the use of pausing in the training system and multiple pronunciations in the vocabulary help to improve recognition rates significantly. The actual pausing of the training sentences and the application of assimilation effects improve the transcription into context-dependent units. Multiple pronunciation possibilities are generated using general rules that are easily applied to any Spanish vocabulary. With all these ideas we have reduced the recognition errors of the baseline system by more than 30% in a task parallel to DARPA-RM translated into Spanish with a vocabulary of 979 words. Our database contains four speakers with 600 training sentences and 100 testing sentences each. All experiments have been carried out with a perplexity of 979, and even slightly higher in the case of multiple pronunciations, to be able to study the acoustic modelling power of the systems with no grammar constraints. In diesem Artikel wird eine umfassende Studie über das Erkennen von kontinuierlicher Sprache im Spanischen vorgestellt. Der Gebrauch und die Optimierung mehrerer bekannter Techniken werden gezeigt, zusammen mit der für die spanische Sprache erstmaligen Anwendung spezifischer Sprachkenntnisse auf diese Systeme. Dazu gehören die sorgfältige Auswahl des Lautinventars, die benutzten Lautklassen und die Auswahl alternativer Ausspracheregeln. Wir haben ein semi-kontinuierliches, von den Lautklassen abhängendes, kontextuelles Modell entwickelt. Durch das Benutzen von vier Lautklassen haben wir Reduzierungen der Erkennungsfehlerrate erreicht, die annähernd der prozentualen Zunahme der Parameteranzahl entspricht, verglichen mit dem semi-kontinuierlichen, kontextuellen Ausgangsmodell. Wir zeigen ebenfalls, dass der Gebrauch von Pausen im Trainingssystem und Mehrfach-Aussprachen im Vokabular dazu beitragen, die Erkennungsraten erheblich zu verbessern. Das derzeitig angewandte Markieren von Pausen in den Trainingssätzen und die Berücksichtigung von Assimilationseffekten verbessern das Transkribieren in kontextabhängige Einheiten. Aussprachevarianten werden erzeugt, indem man allgemeine Regeln benutzt, die man leicht auf beliebiges spanisches Vokabular anwenden kann. Mithilfe dieser Ideen haben wir die Erkennungsfehler des Ausgangssystems um mehr als 30% reduziert, bei einer Aufgabe, die parallel zu DARPA-RM – ins Spanische übersetzt – ist, mit einem Vokabular von 979 Wörtern. Unsere Datenbasis enthält vier Sprecher mit jeweils 600 Trainingssätzen, und 100 Testsätzen. Alle Experimente wurden mit einer Perplexität von 979 durchgeführt und sogar noch mit einer ein wenig höheren im Fall der Mehrfach-Aussprachen, um die Mächtigkeit der akustischen Modellierung des Systems ohne grammatische Einschränkungen zu untersuchen. Dans cet article, nous présentons une étude exhaustive de la reconnaissance de la parole continue en espagnol. On montre l'utilisation et l'optimisation de plusieurs techniques bien connues et en même temps l'application des connaissances spécifiques de la langue à ses systèmes qui se fait pour la première fois à l'espagnol. Ceci veut dire: la selection soigneuse de l'inventaire des phones, les classes des phones utilisées et la selection des règles d'autres prononciations. Nous avons dévéloppé un modèle semi-continu et contextuel dependant des classes des phones. En utilisant quatre phones, nous avons obtenu des réductions du taux des erreurs de reconnaissance qui sont approximativement équivalent à l'augmentation par pourcentage du nombre des paramètres, comparé avec le modèle semi-continu et contextuel qui sert de point de comparaison. Nous montrons également que l'utilisation de la pause dans le système d'entraı̂nement et les prononciations multiples dans le vocabulaire contribuent à améliorer le taux de reconnaissance considérablement. Les pauses actuelles des phrases d'entraı̂nement et le considération des effets d'assimilation améliorent la transcription dans des unitées qui dependent du contexte. Des multiples possibilités de prononciation sont générées en utilisant des règles générales qui s'appliquent facilement à n'importe quel vocabulaire espagnol. À l'aide de ces idées, nous avons réduit le taux des erreurs du système de base en plus du 30% dans un travail qui est parallèle à DARPA-RM, traduit à l'espagnol avec un vocabulaire de 979 mots. Notre base de données contient quatre locuteurs avec 600 phrases d'entraı̂nement et 100 phrases de test par locuteur. Toutes les expériences ont été réalisées avec une perplexité de 979 et même avec une perplexité un peu plus haute dans le cas des prononciations multiples pour pouvoir étudier la force du modèle en acoustique des systèmes sans contraintes grammaticales." @default.
- W2050487305 created "2016-06-24" @default.
- W2050487305 creator A5028386517 @default.
- W2050487305 creator A5029373440 @default.
- W2050487305 date "1999-09-01" @default.
- W2050487305 modified "2023-10-01" @default.
- W2050487305 title "Improving continuous speech recognition in Spanish by phone-class semicontinuous HMMs with pausing and multiple pronunciations" @default.
- W2050487305 cites W108506772 @default.
- W2050487305 cites W121973820 @default.
- W2050487305 cites W131025725 @default.
- W2050487305 cites W1504959038 @default.
- W2050487305 cites W1509251888 @default.
- W2050487305 cites W1521058074 @default.
- W2050487305 cites W1535702289 @default.
- W2050487305 cites W1546181631 @default.
- W2050487305 cites W1643320849 @default.
- W2050487305 cites W1977286842 @default.
- W2050487305 cites W199434361 @default.
- W2050487305 cites W2024169449 @default.
- W2050487305 cites W2113197526 @default.
- W2050487305 cites W2145264505 @default.
- W2050487305 cites W2155368638 @default.
- W2050487305 cites W2167131998 @default.
- W2050487305 cites W2406037625 @default.
- W2050487305 cites W268518200 @default.
- W2050487305 cites W95252094 @default.
- W2050487305 doi "https://doi.org/10.1016/s0167-6393(99)00013-8" @default.
- W2050487305 hasPublicationYear "1999" @default.
- W2050487305 type Work @default.
- W2050487305 sameAs 2050487305 @default.
- W2050487305 citedByCount "14" @default.
- W2050487305 countsByYear W20504873052014 @default.
- W2050487305 countsByYear W20504873052015 @default.
- W2050487305 countsByYear W20504873052016 @default.
- W2050487305 countsByYear W20504873052019 @default.
- W2050487305 crossrefType "journal-article" @default.
- W2050487305 hasAuthorship W2050487305A5028386517 @default.
- W2050487305 hasAuthorship W2050487305A5029373440 @default.
- W2050487305 hasConcept C100279451 @default.
- W2050487305 hasConcept C137293760 @default.
- W2050487305 hasConcept C138885662 @default.
- W2050487305 hasConcept C151730666 @default.
- W2050487305 hasConcept C154945302 @default.
- W2050487305 hasConcept C162324750 @default.
- W2050487305 hasConcept C187736073 @default.
- W2050487305 hasConcept C204321447 @default.
- W2050487305 hasConcept C26022165 @default.
- W2050487305 hasConcept C2777212361 @default.
- W2050487305 hasConcept C2777601683 @default.
- W2050487305 hasConcept C2778707766 @default.
- W2050487305 hasConcept C2779343474 @default.
- W2050487305 hasConcept C2780451532 @default.
- W2050487305 hasConcept C2780844864 @default.
- W2050487305 hasConcept C28490314 @default.
- W2050487305 hasConcept C40969351 @default.
- W2050487305 hasConcept C41008148 @default.
- W2050487305 hasConcept C41895202 @default.
- W2050487305 hasConcept C81917197 @default.
- W2050487305 hasConcept C86803240 @default.
- W2050487305 hasConceptScore W2050487305C100279451 @default.
- W2050487305 hasConceptScore W2050487305C137293760 @default.
- W2050487305 hasConceptScore W2050487305C138885662 @default.
- W2050487305 hasConceptScore W2050487305C151730666 @default.
- W2050487305 hasConceptScore W2050487305C154945302 @default.
- W2050487305 hasConceptScore W2050487305C162324750 @default.
- W2050487305 hasConceptScore W2050487305C187736073 @default.
- W2050487305 hasConceptScore W2050487305C204321447 @default.
- W2050487305 hasConceptScore W2050487305C26022165 @default.
- W2050487305 hasConceptScore W2050487305C2777212361 @default.
- W2050487305 hasConceptScore W2050487305C2777601683 @default.
- W2050487305 hasConceptScore W2050487305C2778707766 @default.
- W2050487305 hasConceptScore W2050487305C2779343474 @default.
- W2050487305 hasConceptScore W2050487305C2780451532 @default.
- W2050487305 hasConceptScore W2050487305C2780844864 @default.
- W2050487305 hasConceptScore W2050487305C28490314 @default.
- W2050487305 hasConceptScore W2050487305C40969351 @default.
- W2050487305 hasConceptScore W2050487305C41008148 @default.
- W2050487305 hasConceptScore W2050487305C41895202 @default.
- W2050487305 hasConceptScore W2050487305C81917197 @default.
- W2050487305 hasConceptScore W2050487305C86803240 @default.
- W2050487305 hasIssue "1" @default.
- W2050487305 hasLocation W20504873051 @default.
- W2050487305 hasOpenAccess W2050487305 @default.
- W2050487305 hasPrimaryLocation W20504873051 @default.
- W2050487305 hasRelatedWork W2048917925 @default.
- W2050487305 hasRelatedWork W2050487305 @default.
- W2050487305 hasRelatedWork W2075815989 @default.
- W2050487305 hasRelatedWork W2110022257 @default.
- W2050487305 hasRelatedWork W2115282603 @default.
- W2050487305 hasRelatedWork W2121755096 @default.
- W2050487305 hasRelatedWork W2154075111 @default.
- W2050487305 hasRelatedWork W2773095876 @default.
- W2050487305 hasRelatedWork W2938181924 @default.
- W2050487305 hasRelatedWork W3160429328 @default.
- W2050487305 hasVolume "29" @default.
- W2050487305 isParatext "false" @default.
- W2050487305 isRetracted "false" @default.
- W2050487305 magId "2050487305" @default.