Matches in SemOpenAlex for { <https://semopenalex.org/work/W2042684547> ?p ?o ?g. }
Showing items 1 to 69 of
69
with 100 items per page.
- W2042684547 endingPage "271" @default.
- W2042684547 startingPage "261" @default.
- W2042684547 abstract "In the framework of an ANN/HMM hybrid system for phone recognition three specialized ANNs were designed and evaluated. One of these ANNs detects the manner of articulation. The other two ANNs describe the speech signal in terms of place of articulation. One of these is used for plosive and nasal classification, and the other one is used for fricative classification. The design of these networks was inspired by acoustic-phonetic knowledge. Input parameters, ANN topology and desired output representation have been optimized for the specific task of the network. Experiments are reported for the TIMIT database. Frame classification errors of 17.7% with the manner ANN (5 broad classes), 25.4% with the plosive and nasal ANN (10 phones), and 25.2% with the fricative ANN (11 phones) were obtained on a set of 616 sentences from 77 new speakers. Experiments for a prototype ANN/HMM hybrid system are also reported. We developed an algorithm for the global optimization of this hybrid system. The network for the manner of articulation and one network for the place of articulation were merged to a single ANN which outputs were modeled by an HMM. With this globally optimized hybrid system we achieved a recognition accuracy of 86% on an 8 class recognition problem (7 plosives and one class corresponding to all other phonemes). Im Kontext eines KNN/HMM Hybridsystems für Phonerkennung wurden drei spezialisierte KNN entwickelt und ausgewertet. Eines dieser KNN detektiert die Artikulationsart. Die beiden anderen KNN beschreiben das Sprachsignal mit Merkmalen, die den Artikulationsort charakterisieren. Eines der beiden dient zur Klassifikation von Plosiven bzw. Nasalen, das andere zur Frikativklassifikation. Die Entwicklung der Netzwerke orientierte sich an akustisch-phonetischem Wissen. Die Eingabeparameter, die KNN Topologie und die Repräsentation der Ausgabeknoten wurden im Hinblick auf die spezialisierte Aufgabe jedes Netzwerks optimiert. Experimente mit der TIMIT Sprachstichprobe werden vorgestellt. Bei der Klassifikation von Frames wurden für 616 Testsätze von 77 neuen Sprechern folgende Fehlerraten erzielt: mit dem KNN für die Artikulationsart (5 Lautoberklassen) 17,7%, für das Plosiv/Nasal-KNN (10 Phone) 25,4% und für das Frikativ-Netzwerk (11 Phone) 25,2%. Experimente mit einem KNN/HMM-Hybridsystem, das die Vorteile von KNN und HMM verbindet, wurden durchgeführt. Wir entwickelten ein Verfahren zur globalen Optimierung eines solchen Systems. Das Netz für die Artikulationsart und eines für den Artikulationsort wurden zu einem Netz vereinigt, dessen Ausgabe mit einem HMM Postprozessor modelliert wurde. Mit diesem global optimierten Hybridsystem erzielten wir bei der Erkennung von 8 Klassen (7 Plosive und 1 Klasse, die allen anderen Phonen entspricht) eine Akkuratheit von 86%. Dans le cadre d'un décodeur acoustique-phonétique hybride (ANN/HMM), trois réseaux de neurones (ANNs) spécialisés ont été développés et évalués. Un de ces ANNs détecte le mode d'articulation. Les deux autres ANNs décrivent le signal en termes du lieu d'articulation. Un réseau est utilisé pour classifier les consonnes nasales et plosives. Un autre est utilisé pour la classification des fricatives. Le design de ces réseaux est inspiré par des connaissances acoustiques et phonétiques. Les entrées, la topologie et le codage des sorties ont été optimisés pour chacun des réseaux. Ceux-ci sont évalués sur la base de données TIMIT. Les erreurs de classification trame par trame sur un test de 77 locuteurs indépendants sont de 17.7% pour les 5 modes d'articulation, de 25.4% pour les consonnes nasales et plosives (10 phonèmes) et de 25.2% pour les consonnes fricatives (11 phonèmes). On évalue aussi la performance d'un système hybride ANN/HMM, pour lequel a été développé un algorithme d'optimisation globale de tous les paramètres. Le réseau dédié au mode d'articulation et un réseau dédié au lieu d'articulation ont été unis dans un seul ANN. Les sorties de ce nouveau réseau sont modélisées par un HMM. Ce système hybride atteint un taux d'erreur de 14% pour la reconnaissance en parole continue de 8 classes de phonèmes (7 plosives et une classe représentant tous les autres phonémes)." @default.
- W2042684547 created "2016-06-24" @default.
- W2042684547 creator A5007549496 @default.
- W2042684547 creator A5055636350 @default.
- W2042684547 creator A5081408760 @default.
- W2042684547 creator A5086198262 @default.
- W2042684547 date "1992-06-01" @default.
- W2042684547 modified "2023-09-25" @default.
- W2042684547 title "Phonetically motivated acoustic parameters for continuous speech recognition using artificial neural networks" @default.
- W2042684547 cites W2016580193 @default.
- W2042684547 cites W2045956438 @default.
- W2042684547 cites W2098457679 @default.
- W2042684547 cites W2148099973 @default.
- W2042684547 cites W2169415433 @default.
- W2042684547 doi "https://doi.org/10.1016/0167-6393(92)90020-8" @default.
- W2042684547 hasPublicationYear "1992" @default.
- W2042684547 type Work @default.
- W2042684547 sameAs 2042684547 @default.
- W2042684547 citedByCount "9" @default.
- W2042684547 countsByYear W20426845472017 @default.
- W2042684547 countsByYear W20426845472021 @default.
- W2042684547 crossrefType "journal-article" @default.
- W2042684547 hasAuthorship W2042684547A5007549496 @default.
- W2042684547 hasAuthorship W2042684547A5055636350 @default.
- W2042684547 hasAuthorship W2042684547A5081408760 @default.
- W2042684547 hasAuthorship W2042684547A5086198262 @default.
- W2042684547 hasConcept C153180895 @default.
- W2042684547 hasConcept C154945302 @default.
- W2042684547 hasConcept C17744445 @default.
- W2042684547 hasConcept C199539241 @default.
- W2042684547 hasConcept C23224414 @default.
- W2042684547 hasConcept C2778724510 @default.
- W2042684547 hasConcept C2779337067 @default.
- W2042684547 hasConcept C28490314 @default.
- W2042684547 hasConcept C41008148 @default.
- W2042684547 hasConcept C50644808 @default.
- W2042684547 hasConcept C94625758 @default.
- W2042684547 hasConceptScore W2042684547C153180895 @default.
- W2042684547 hasConceptScore W2042684547C154945302 @default.
- W2042684547 hasConceptScore W2042684547C17744445 @default.
- W2042684547 hasConceptScore W2042684547C199539241 @default.
- W2042684547 hasConceptScore W2042684547C23224414 @default.
- W2042684547 hasConceptScore W2042684547C2778724510 @default.
- W2042684547 hasConceptScore W2042684547C2779337067 @default.
- W2042684547 hasConceptScore W2042684547C28490314 @default.
- W2042684547 hasConceptScore W2042684547C41008148 @default.
- W2042684547 hasConceptScore W2042684547C50644808 @default.
- W2042684547 hasConceptScore W2042684547C94625758 @default.
- W2042684547 hasIssue "2-3" @default.
- W2042684547 hasLocation W20426845471 @default.
- W2042684547 hasOpenAccess W2042684547 @default.
- W2042684547 hasPrimaryLocation W20426845471 @default.
- W2042684547 hasRelatedWork W1586532344 @default.
- W2042684547 hasRelatedWork W1990589093 @default.
- W2042684547 hasRelatedWork W1994694193 @default.
- W2042684547 hasRelatedWork W2008638795 @default.
- W2042684547 hasRelatedWork W2054353061 @default.
- W2042684547 hasRelatedWork W2108688091 @default.
- W2042684547 hasRelatedWork W2140027889 @default.
- W2042684547 hasRelatedWork W2155033763 @default.
- W2042684547 hasRelatedWork W2370928766 @default.
- W2042684547 hasRelatedWork W2340308015 @default.
- W2042684547 hasVolume "11" @default.
- W2042684547 isParatext "false" @default.
- W2042684547 isRetracted "false" @default.
- W2042684547 magId "2042684547" @default.
- W2042684547 workType "article" @default.