Наконец, ЧОТ – важнейшее средство кодирования не только лингвистической интонации голоса, но и экстралингвистической информации речи: индивидуальных особенностей речи человека (Рамишвили, 1981) и эмоциональной интонации (Попов и др., 1966; Цеплитис, 1974; Брызгунова, 1984; Sedlačec, Sychra, 1962; Williams, Stevens, 1972).

Амплитудно-временные характеристики речевого сигнала и их роль в восприятии речи. Психоакустической основой восприятия громкости речи является различие в физической силе речевых звуков. Средний уровень различной разговорной речи при измерении на расстоянии 1 м колеблется от 60 до 80 дБ (относительно стандартного нулевого уровня, за который принято звуковое давление 2,10–5 Н/м>2). Уровень звукового давления гласных в целом на 10–40 дБ больше, чем согласных. Поэтому огибающая интенсивности речевого потока выглядит на осциллограмме в виде амплитудно-модулированной кривой с максимумами на гласных и минимумами на согласных.

Статистические исследования звукового потока речи по мощности показали, что разница в децибелах между наиболее слабыми звуками речи, встречающимися в 1 % случаев (по времени), и наиболее сильными звуками, встречающимися также в 1 % случаев, составляет 47 дБ. Она носит название динамического диапазона речи. А разница между условным максимумом и средним уровнем получила название пикфактора речи.

Для эффективного восприятия речи она должна быть достаточно громкой. Однако понятие достаточной громкости относительно и сильно зависит от окружающего шума, на фоне которого воспринимается речь. Для обеспечения отличной разборчивости речи (чему соответствует 80 % слоговой разборчивости) в присутствии сравнительно небольшого шума (50 дБ) уровень речи должен достигать около 73 дБ. В шуме 70 дБ для обеспечения того же качества разборчивости (80 %) необходимо усилить речь до 99 дБ, а в шуме 80 дБ речевой сигнал должен быть усилен до 110 дБ. Иными словами, для того чтобы быть отлично разборчивым, речевой сигнал должен превышать уровень средних и громких шумов примерно на 30 дБ. В случае слабых шумов (40 дБ) указанное превышение достаточно на 20 дБ. Для достижения более низкого класса разборчивости речи требуется, естественно, меньшее превышение уровня речевого сигнала над шумом, что определяется расчетным путем (Покровский, 1962), Среднестатистическая частота амплитудной модуляции (AM) речи и ее связь с характеристиками слуха была предметом специального исследования (Морозов, Черниговская, 1975). Полученные гистограммы статистического распределения AM речи русских дикторов (из числа известных чтецов) показали, что наиболее часто встречающаяся AM речи сосредоточена в области 4–6 Гц (хотя в целом захватывает и более широкий диапазон). Параллельное исследование чувствительности слуха человека к AM звука показало, что ее максимальная величина наблюдается как раз в том диапазоне AM, в котором имеется максимум AM речевых звуков, т. е. в области 3–8 Гц. Это как раз укладывается в диапазон длительности речевых слогов, т. е. 330–120 мс. Высказывается гипотеза, что данное соответствие AM характеристик слуха и речи является не случайным, а возникло в процессе эволюции в результате взаимного согласования характеристик речи и слуха. Такая повышенная избирательность слуха к AM речи обусловливает высокую помехоустойчивость слухового восприятия человеком речевого сигнала на фоне различного рода шумов (Морозов, 1977).

Амплитудно-временные характеристики речи являются весьма важными в передаче слушателю главным образом ее экстралингвистической информации. Так, показано, что одна и та же фраза в зависимости от ее эмоциональной окраски характеризуется специфическим узором амплитудно-временных или, как их еще называют, динамических характеристик сигнала (Котляр, Морозов, 1976). Например, время нарастания и спада амплитуды звуков при выражении эмоции горя максимально велико, а при гневе максимально коротко (см. рисунок 7). Для выражения разных эмоций человек характерным образом видоизменяет амплитудно-временную организацию фразы