Affordable Access

Publisher Website

Low-dimensional representation of vowels based on all-pole modeling in the psychophysical domain

Authors
Journal
Speech Communication
0167-6393
Publisher
Elsevier
Publication Date
Volume
4
Identifiers
DOI: 10.1016/0167-6393(85)90045-7
Keywords
  • Speech
  • Perception
  • Analysis
  • Synthesis
  • Linear Prediction
  • All-Pole Spectral Modelling
  • Models Of Hearing
  • Psychoacoustics
  • Critical Band
  • Loudness

Abstract

Zusammenfassung Eine neuartige Sprachanalysemethode, welche verschiedene bewährte psychoakustische Konzepte benutzt, wird auf die Analyse von Vokalen angewendet. Diese wahrnehmungsbezogene lineare prädiktive Analyse (PLP) bildet das Gehörsprektrum mittels des Spektrums eines Allpolmodells niedriger Ordnung nach. Das Gehörsprektrum wird vom Sprachsignal durch Frequenzgruppenfilterung, Entzerrung gemäβ den Kurven konstanter Lautheit und Intensitäts-Lautheits-Kompression nach dem Wurzelgesetz abgeleitet. Durch Analyse sowohl mit natürlicher als auch synthetischer Sprache weisen wir nach, daβ psychoakustische Konzepte der spektralen Integration bei der Vokalwahrnehmung, nämlich das F1, F2′-Konzept von Carlson und Fant und das 3.5 Bark-Integrationskonzept von Chistovich, durch die PLP-Methode gut nachgebildet werden. Weiterhin wird ein vollständiges Sprachanalyse-Synthese-System beschrieben, welches auf der PLP-Methode beruht.

There are no comments yet on this publication. Be the first to share your thoughts.