使用python以原始或pcm格式录制音频



我正试图在我的Jetson Nano上使用豪猪作为唤醒词。为了做到这一点,我需要使用pythonpcm格式(我认为这是原始格式(录制音频。我还需要采样率为16000,并且在单通道上线性编码为16位。我的输入设备索引是11。那么,我该如何使用python以这种格式录制音频呢?

看起来已经有一个来自豪猪的演示了。

在这里查看他们的演示-它有很多代码,所以我不会全部粘贴。

本质上,它需要安装pvporcupinedemo包:

$ sudo pip3 install pvporcupinedemo

然后运行演示脚本(位于Python演示中(开始运行处理:

$ porcupine_demo_mic --access_key ${ACCESS_KEY} --keywords picovoice

这个脚本有各种各样的参数,这些参数可以在repo本身中找到文档。

演示明确指出,这应该适用于Jetson Nano:

在Linux(x86_64(、Mac(x86_64和arm64(、Windows(x86_64(上运行,树莓派(所有变体(、NVIDIA Jetson(Nano(和BeagleBone。

为了确保演示检测到您的麦克风,您可以运行检测麦克风脚本标志:

$ porcupine_demo_mic --show_audio_devices

你应该看到这样的东西:

index: 0, device name: USB Audio Device
index: 1, device name: MacBook Air Microphone

然后你可以确定哪个麦克风是正确的,并使用索引作为演示的参数,例如";"USB音频设备":

$ porcupine_demo_mic --access_key ${ACCESS_KEY} --keywords picovoice --audio_device_index 0

然后我会继续,开始在他们的演示中挑选代码,根据需要进行修改。

相关内容

最新更新