正如标题所示,我需要一个API来将标点符号引入意大利语句子中。
我正在使用SpeechRecognition将语音转换为文本,但我实现的代码将不带标点符号的句子作为输出。
我的代码如下:
import speech_recognition as sr
recognizer_instance = sr.Recognizer()
with sr.Microphone() as source:
recognizer_instance.adjust_for_ambient_noise(source)
print("I'm listening... say something!")
audio = recognizer_instance.listen(source)
print("Ok! I'm processing the message!")
try:
text = recognizer_instance.recognize_google(audio, language="it-IT")
print("Google understood: n", text)
except Exception as e:
print(e)
如果我说,在执行过程中,这句话:
"Mi chiamo Paolo.Tu?">
意思是"我叫保罗。你的?">
输出如下:
我在听。。。说点什么
好的!我正在处理消息
谷歌理解:
mi chiamo Paolo tu
不考虑标点符号。如何插入此信息?
谢谢!
Google语音识别API支持意大利语标点符号,但您需要在识别配置中设置enable_automatic_punctuation=True
(请参阅此处(。将此功能添加到SpeechRecognition库的拉取请求当前在GitHub上打开。目前,您可以直接使用Google API,也可以尝试添加标点符号作为后期处理步骤(似乎需要付出很多努力,因为它很可能需要训练类似于标点符号的模型(。