为什么在分析强度、RMS振幅、基频等声学参数时,单声道声音比立体声声音更受欢迎



在语音分析中,在使用Praat等软件时,我看到人们喜欢单声道而不是立体声。即使录音是使用立体声麦克风完成的,音频文件也经常转换为立体声。除了节省大量内存之外,还有什么原因吗?谢谢

我收集了一些关于是使用单声道还是立体声音频的评论。大家一致认为单声道音频可以节省空间,就像你说的那样。然而,一些来源会注意到你想要使用立体声音频的一些时间。

  1. 您想要同时记录电声门图数据。将一个文件上的音频和电声门图数据都作为";立体声";音频使您的数据保持整洁。

  2. 您希望录制一次音频,但也希望在录制完成后选择音频的较佳一半。

此外,请注意,人类语言几乎是作为单声道信号产生的。我不知道有什么人类语言依赖立体声音频来传达有意义的信息。这个链接提到,一些涉及紧急通信的职业会利用每只耳朵中的不同音频来同时获得更多信息,但这是我所能找到的关于立体声语言使用的最接近的资源。

此外,当多个文件不是全单声道或全立体声时,Praat似乎无法处理这些文件,因此这也可能是使用单声道音频的原因。将单声道音频复制到双耳与将立体声音频还原为单声道音频并不完全相同。

以下是我发现的最有用的来源:

发件人https://colangpraat.wordpress.com/part-3-how-to-record-using-praat/

在对象窗口的菜单栏中,单击新建并录制MONO SOUND。PRAT还具有立体声录制功能,但在收集语言数据时,首选单声道文件。

来源https://web.stanford.edu/dept/linguistics/corpora/material/PRAAT_workshop_manual_v421.pdf

在大多数情况下,您将录制一个语音或语音样本目的您可以选择"录制单声道声音.."。如果你想制作立体声录音,你显然必须使用"录制立体声"。后一个选项,例如可以用于将EG-2 PC的立体声输出信号数字化声门企业的电子声门描记器(http://www.glottal.com/electroglottograph.html),从而使您可以访问同时记录语音和EGG信号。

来源https://www.fon.hum.uva.nl/praat/manual/ExperimentMFC_2_2__The_stimuli.html

您也可以使用AIFF文件,在这种情况下,stimulusFileNameTail可能是"。aiff";,或者Praat支持的任何其他类型的声音文件。但是,所有声音文件必须具有相同数量的声道(即,所有单声道或所有立体声(和相同的采样频率。

来源https://www.fon.hum.uva.nl/david/LOT/sspbook.pdf

在我们继续之前,我们重复一个声音在Praat中表示为矩阵,这意味着声音被存储为数字行。单声道是一个只有一行和多行的矩阵列。立体声是一种有两个声道的声音,每个声道都表示在一行中矩阵的。因此,立体声是一个具有两行的矩阵,并且两行具有相同的行列数。每个矩阵单元格包含一个样本值。每当我们想使用关于一个声音的公式我们可以把一个声音看作一个矩阵。

来源https://person2.sol.lu.se/SidneyWood/praate/monstee.html

但要确保将频道合并为一个单声道信号会有所收获。在Praat中使用立体声录音机并选择最佳频道更简单。

最新更新