Impact perceptuel d'une mise à zéro des segments plosifs de parole


Autoria(s): Santini, Vincent
Contribuinte(s)

Lefebvre, Roch

Gournay, Philippe

Data(s)

2016

Resumo

En traitement du signal audio, les plosives sont des sons de parole très importants au regard de l’intelligibilité et de la qualité. Les plosives sont cependant difficiles à modéliser à l’aide des techniques usuelles (prédiction linéaire et codage par transformée), à cause de leur dynamique propre importante et à cause de leur nature non prédictible. Cette étude présente un exemple de système complet capable de détecter, segmenter, et altérer les plosives dans un flux de parole. Ce système est utilisé afin de vérifier la validité de l’hypothèse suivante : La phase d’éclatement (de burst) des plosives peut être mise à zéro, de façon perceptuellement équivalente. L’impact sur la qualité subjective de cette transformation est évalué sur une banque de phrases enregistrées. Les résultats de cette altération hautement destructive des signaux tendent à montrer que l’impact perceptuel est mineur. Les implications de ces résultats pour le codage de la parole sont abordées.

Identificador

http://hdl.handle.net/11143/9530

Idioma(s)

fre

eng

Publicador

Université de Sherbrooke

Direitos

© Vincent Santini

Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 2.5 Canada

http://creativecommons.org/licenses/by-nc-sa/2.5/ca/

Palavras-Chave #Plosive #Transitoire #Éclatement #Fermeture #Segmentation #Modélisation #Parole #Codage
Tipo

Mémoire