我尝试使用 ws 包通过 websocket 使用基本的语音转文本服务。但是在成功打开连接并发送初始消息后,我从未获得listening
状态。我还尝试发送音频和空二进制文件(以指示上传过程已完成),但服务器总是返回带有代码1000
close
。
以下是我的代码
'use strict';
var fs = require('fs');
var request = require('request');
var WS = require('ws');
var wsURI = 'wss://stream.watsonplatform.net/speech-to-text/api/v1/recognize?watson-token=[TOKEN]&model=en-UK_NarrowbandModell&x-watson-learning-opt-out=1';
var getTokenForm = {
method: 'GET',
uri: 'https://[USER_ID]:[PASSWORD]@stream.watsonplatform.net/authorization/api/v1/token?url=https://stream.watsonplatform.net/speech-to-text/api',
};
var filepath = 'C:/Temp/test1.wav';
request(getTokenForm, function(error, response, body) {
wsURI = wsURI.replace('[TOKEN]', body);
var message = {
'action': 'start',
'content-type': 'audio/wav',
'continuous': true,
'inactivity_timeout': -1
};
var ws = new WS(wsURI);
['message', 'error', 'close', 'open', 'connection'].forEach(function(eventName) {
ws.on(eventName, console.log.bind(console, eventName + ' event: '));
});
ws.on('open', function(evt) {
ws.send(JSON.stringify(message));
setTimeout(function timeout() {
var readStream = fs.createReadStream(filepath);
readStream.on('data', function(data) {
ws.send(data, {
binary: true,
mask: false,
});
});
readStream.on('end', function() {
ws.send(new Buffer(0), {
binary: true,
mask: false,
});
});
}, 1000);
});
ws.on('close', function(data) {
console.log(data)
});
});
还要尝试直接发送文件(不带流)。
var sound = fs.readFileSync(filepath);
ws.send(sound, { binary: true, mask: false});
并尝试添加自定义标头Authorization
var authorization = 'Basic ' + new Buffer('USER_ID:PASSWORD').toString('base64');
var ws = new WS(wsURI, {
headers: {
'Authorization': authorization,
}
});
但到目前为止没有运气。
这里有几件事。主要问题是查询字符串中的模型有一个拼写错误 - 末尾应该只有一个"l"。(虽然,不响应错误消息是我将向团队报告的服务中的错误。
因此,修复它,您会收到一个错误,即帧应该被屏蔽。这是一个简单的解决方法,只需在两个地方mask: false
切换到true
即可。
一旦您发送完音频和结束消息,该服务将发送您的最终结果,然后发送另一条{"state": "listening"}
消息。这第二个state: listening
应该是关闭连接的触发器。否则,它最终将超时并自动关闭(inactivity_timeout
当您发送没有语音的音频时适用,而不是当您根本不发送任何数据时。