Matches in SemOpenAlex for { <https://semopenalex.org/work/W2034878035> ?p ?o ?g. }
- W2034878035 endingPage "116" @default.
- W2034878035 startingPage "97" @default.
- W2034878035 abstract "This paper investigates the problem of automatic segmentation of speech recorded in noisy channel corrupted environments. Using an HMM-based speech segmentation algorithm, speech enhancement and parameter compensation techniques previously proposed for robust speech recognition are evaluated and compared for improved segmentation in colored noise. Speech enhancement algorithms considered include: Generalized Spectral Subtraction, Nonlinear Spectral Subtraction, Ephraim–Malah MMSE enhancement, and Auto-LSP Constrained Iterative Wiener filtering. In addition, the Parallel Model Combination (PMC) technique is also compared for additive noise compensation. In telephone environments, we compare channel normalization techniques including Cepstral Mean Normalization (CMN) and Signal Bias Removal (SBR) and consider the coupling of channel compensation with front-end speech enhancement for improved automatic segmentation. Compensation performance is assessed for each method by automatically segmenting TIMIT degraded by additive colored noise (i.e., aircraft cockpit, automobile highway, etc.), telephone transmitted NTIMIT, and cellular telephone transmitted CTIMIT databases. Untersucht wird die automatische Sprachsegmentierung, sofern der aufgenommenen Sprache additives Rauschen überlagert ist. In der Vergangenheit für die robuste Spracherkennung vorgeschlagene Verfahren zur Qualitätssteigerung werden unter Verwendung eines HMM-Modells zur Sprachsegmentierung bezüglich ihrer Eignung zur verbesserten Sprachsegmentierung in farbigem Rauschen untersucht und verglichen. Die untersuchten Verfahren sind: Verallgemeinerte spektrale Subtraktion (Generalized Spectral Subtraction), nichtlineare spektrale Subtraktion (Nonlinear Spectral Subtraction), Ephraim–Malah MMSE sowie iterative Wiener-Filterung (Auto-LSP Constrained Iterative Wiener filtering). Zusätzlich erfolgt ein Vergleich mit dem PMC-Verfahren (Parallel Model Combination) bezüglich der Kompensation additiven Rauschens. Die Kanalnormierungsverfahren (Channel Normalization) CNN (Cepstral Mean Normalization) und SBR (Signal Bias Removal) sowie die Kopplung von Kanal-Kompensation mit Front-end-Sprachqualitätssteigerung für die verbesserte Sprachsegmentierung werden für Telefonierkanäle untersucht. Die Beurteilung der Güte der Kompensation erfolgt für jedes der Verfahren anhand der automatische Segmentierung von durch additives farbiges Rauschen gestörten TIMIT-Daten (z.B. Flugzeug-Cockpit, typische KFZ-Umgebung), NTIMIT-Daten (leitungsgebundene Telefonierkanäle) und CTIMIT (zellulare Mobilfunkkanäle) Daten. Dans cet article, nous étudions le problème de la segmentation automatique du signal de parole enregistré dans un environnement bruité. Des techniques de rehaussement de la parole et de compensation de paramètres basées sur les modèles de Markov cachés (HMM), et récemment proposées pour la reconnaissance robuste de la parole, sont évaluées et comparées afin d'améliorer la segmentation automatique dans le cas de bruit coloré. Les techniques de rehaussement de la parole considérées ici sont: la Soustraction Spectrale Généralisée, la Soustraction Spectral Non Lineaire, le Rehaussement MMSE d'Ephraim–Malah, et le Filtrage Itératif de Wiener avec Contrainte Auto-LSP. De plus, la technique de Combinaison Parallèle de Modèles (PMC) est également comparée dans le cas de la compensation de bruit additif. Pour les applications téléphoniques, nous comparons les techniques de normalisation du canal de transmission, Normalisation de la Moyenne Cepstrale, annulation du biais du signal (SBR), et considérons une méthode de couplage de compensation du canal de transmission avec le rehaussement de la parole dans l'étage de pré-traitement afin d'améliorer la segmentation automatique. La qualité de la segmentation résultante est évaluée pour chaque méthode de compensation sur base des données TIMIT dégradées par du bruit additif coloré (à savoir, poste de pilotage d'un avion, autoroute, etc.), les données NTIMIT de parole transmise sur ligne téléphonique, et finalement CTIMIT correspondant à la transmission à partir de téléphones cellulaires." @default.
- W2034878035 created "2016-06-24" @default.
- W2034878035 creator A5000755345 @default.
- W2034878035 creator A5085723847 @default.
- W2034878035 date "1998-08-01" @default.
- W2034878035 modified "2023-10-18" @default.
- W2034878035 title "Automatic segmentation of speech recorded in unknown noisy channel characteristics" @default.
- W2034878035 cites W1549877291 @default.
- W2034878035 cites W1586084638 @default.
- W2034878035 cites W1720037957 @default.
- W2034878035 cites W1800365115 @default.
- W2034878035 cites W1846195874 @default.
- W2034878035 cites W1950396994 @default.
- W2034878035 cites W1992576854 @default.
- W2034878035 cites W1995390470 @default.
- W2034878035 cites W1995536493 @default.
- W2034878035 cites W2009674825 @default.
- W2034878035 cites W2018228148 @default.
- W2034878035 cites W2036099872 @default.
- W2034878035 cites W2044523939 @default.
- W2034878035 cites W2045036776 @default.
- W2034878035 cites W2050693797 @default.
- W2034878035 cites W2054665642 @default.
- W2034878035 cites W2056457557 @default.
- W2034878035 cites W2077804127 @default.
- W2034878035 cites W2107105119 @default.
- W2034878035 cites W2109349638 @default.
- W2034878035 cites W2114992418 @default.
- W2034878035 cites W2121418951 @default.
- W2034878035 cites W2127695539 @default.
- W2034878035 cites W2136419841 @default.
- W2034878035 cites W2137075158 @default.
- W2034878035 cites W2148154194 @default.
- W2034878035 cites W2149535104 @default.
- W2034878035 cites W2150658333 @default.
- W2034878035 cites W2153384885 @default.
- W2034878035 cites W2162125266 @default.
- W2034878035 cites W2167152389 @default.
- W2034878035 cites W2167204516 @default.
- W2034878035 cites W2192975138 @default.
- W2034878035 cites W3147539069 @default.
- W2034878035 cites W5164730 @default.
- W2034878035 cites W66693052 @default.
- W2034878035 doi "https://doi.org/10.1016/s0167-6393(98)00031-4" @default.
- W2034878035 hasPublicationYear "1998" @default.
- W2034878035 type Work @default.
- W2034878035 sameAs 2034878035 @default.
- W2034878035 citedByCount "48" @default.
- W2034878035 countsByYear W20348780352012 @default.
- W2034878035 countsByYear W20348780352013 @default.
- W2034878035 countsByYear W20348780352014 @default.
- W2034878035 countsByYear W20348780352015 @default.
- W2034878035 countsByYear W20348780352017 @default.
- W2034878035 countsByYear W20348780352019 @default.
- W2034878035 countsByYear W20348780352021 @default.
- W2034878035 crossrefType "journal-article" @default.
- W2034878035 hasAuthorship W2034878035A5000755345 @default.
- W2034878035 hasAuthorship W2034878035A5085723847 @default.
- W2034878035 hasConcept C11413529 @default.
- W2034878035 hasConcept C127162648 @default.
- W2034878035 hasConcept C136886441 @default.
- W2034878035 hasConcept C144024400 @default.
- W2034878035 hasConcept C153180895 @default.
- W2034878035 hasConcept C154945302 @default.
- W2034878035 hasConcept C163294075 @default.
- W2034878035 hasConcept C18537770 @default.
- W2034878035 hasConcept C19165224 @default.
- W2034878035 hasConcept C2776182073 @default.
- W2034878035 hasConcept C28490314 @default.
- W2034878035 hasConcept C33923547 @default.
- W2034878035 hasConcept C41008148 @default.
- W2034878035 hasConcept C68060419 @default.
- W2034878035 hasConcept C76155785 @default.
- W2034878035 hasConcept C88485024 @default.
- W2034878035 hasConcept C89600930 @default.
- W2034878035 hasConcept C94375191 @default.
- W2034878035 hasConceptScore W2034878035C11413529 @default.
- W2034878035 hasConceptScore W2034878035C127162648 @default.
- W2034878035 hasConceptScore W2034878035C136886441 @default.
- W2034878035 hasConceptScore W2034878035C144024400 @default.
- W2034878035 hasConceptScore W2034878035C153180895 @default.
- W2034878035 hasConceptScore W2034878035C154945302 @default.
- W2034878035 hasConceptScore W2034878035C163294075 @default.
- W2034878035 hasConceptScore W2034878035C18537770 @default.
- W2034878035 hasConceptScore W2034878035C19165224 @default.
- W2034878035 hasConceptScore W2034878035C2776182073 @default.
- W2034878035 hasConceptScore W2034878035C28490314 @default.
- W2034878035 hasConceptScore W2034878035C33923547 @default.
- W2034878035 hasConceptScore W2034878035C41008148 @default.
- W2034878035 hasConceptScore W2034878035C68060419 @default.
- W2034878035 hasConceptScore W2034878035C76155785 @default.
- W2034878035 hasConceptScore W2034878035C88485024 @default.
- W2034878035 hasConceptScore W2034878035C89600930 @default.
- W2034878035 hasConceptScore W2034878035C94375191 @default.
- W2034878035 hasIssue "1-3" @default.
- W2034878035 hasLocation W20348780351 @default.
- W2034878035 hasOpenAccess W2034878035 @default.
- W2034878035 hasPrimaryLocation W20348780351 @default.