我需要从连接插孔的麦克风获取声音信号,并使用数据在Python中立即处理。
处理和后续步骤都很清楚。我只是迷失在从程序获得信号中。频道的数量无关紧要,一个就足够了。我不打算播放声音,所以声卡上不需要ASIO。
我的问题是:如何从 Python 捕获杰克音频?(如果有一个包,有据可查的利基示例,那就太好了:-)。
你试过pyaudio吗?要安装:
python -m pip install pyaudio
录音示例,来自官网:
PyAudio 示例:录制几秒钟的音频并将其保存到 WAVE 文件中。
import pyaudio
import wave
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("* recording")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("* done recording")
stream.stop_stream()
stream.close()
p.terminate()
wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()
这个例子适用于我的笔记本电脑,在Windows 8.1中装有Python 2.7.11(和3.5.1),pyaudio 0.2.9。
您是否打算从麦克风中获取音频或流媒体?无论哪种情况,都可以使用声音装置。
您可以使用以下方法
安装 python 模块 pip install sounddevice --user
有关API的详细信息,请参阅官方网站。
SoundDevice 将录制来自笔记本电脑麦克风的音频(标准音频输入)并在扬声器或耳机上播放(标准音频输出)。您可以使用声音对象进行进一步处理。
import sounddevice as sd
import numpy as np
import scipy.io.wavfile as wav
fs=44100
duration = 5 # seconds
myrecording = sd.rec(duration * fs, samplerate=fs, channels=2,dtype='float64')
print "Recording Audio"
sd.wait()
print "Audio recording complete , Play Audio"
sd.play(myrecording, fs)
sd.wait()
print "Play Audio Complete"
这是输出: Python 2.7.9(默认,2014 年 12 月 10 日,12:24:55)[MSC v.1500 32 位(英特尔)] 在 win32 上 键入"版权","信用"或"许可证()"以获取更多信息。 ====
===================================================录制音频
录音完成,播放音频
播放音频完成
我会考虑使用pysox,libsox的python绑定。
你可以从 PyPI 获取 pysox 包。
如果要求是 Jack,那么你可能需要使用 PyJack,它是 Jack 的 Python 绑定。
此外,源代码有一个您想要执行的操作的示例,即捕获音频。 请参阅文件 capture.py
您必须考虑到,为了避免丢失块,您必须每 500 *(buffer_size/sample_rate)
毫秒调用一次jack.process
。 当您错过音频块(jack.InputSyncError
和jack.OutputSyncError
)时,jack.process
引发异常。