IBM Watson Speech to Text Websocket 关闭(代码为 1000)没有结果



我尝试使用 ws 包通过 websocket 使用基本的语音转文本服务。但是在成功打开连接并发送初始消息后,我从未获得listening状态。我还尝试发送音频和空二进制文件(以指示上传过程已完成),但服务器总是返回带有代码1000 close

以下是我的代码

'use strict';
var fs = require('fs');
var request = require('request');
var WS = require('ws');
var wsURI = 'wss://stream.watsonplatform.net/speech-to-text/api/v1/recognize?watson-token=[TOKEN]&model=en-UK_NarrowbandModell&x-watson-learning-opt-out=1';
var getTokenForm = {
  method: 'GET',
  uri: 'https://[USER_ID]:[PASSWORD]@stream.watsonplatform.net/authorization/api/v1/token?url=https://stream.watsonplatform.net/speech-to-text/api',
};
var filepath = 'C:/Temp/test1.wav';
request(getTokenForm, function(error, response, body) {
  wsURI = wsURI.replace('[TOKEN]', body);
  var message = {
    'action': 'start',
    'content-type': 'audio/wav',
    'continuous': true,
    'inactivity_timeout': -1
  };
  var ws = new WS(wsURI);
  ['message', 'error', 'close', 'open', 'connection'].forEach(function(eventName) {
    ws.on(eventName, console.log.bind(console, eventName + ' event: '));
  });
  ws.on('open', function(evt) {
    ws.send(JSON.stringify(message));
    setTimeout(function timeout() {
      var readStream = fs.createReadStream(filepath);
      readStream.on('data', function(data) {
        ws.send(data, {
          binary: true,
          mask: false,
        });
      });
      readStream.on('end', function() {
        ws.send(new Buffer(0), {
          binary: true,
          mask: false,
        });
      });
    }, 1000);
  });
  ws.on('close', function(data) {
    console.log(data)
  });
});

还要尝试直接发送文件(不带流)。

var sound = fs.readFileSync(filepath);
ws.send(sound, { binary: true, mask: false});

并尝试添加自定义标头Authorization

var authorization = 'Basic ' + new Buffer('USER_ID:PASSWORD').toString('base64');
var ws = new WS(wsURI, {
    headers: {
        'Authorization': authorization,
    }
});

但到目前为止没有运气。

这里有几件事。主要问题是查询字符串中的模型有一个拼写错误 - 末尾应该只有一个"l"。(虽然,不响应错误消息是我将向团队报告的服务中的错误。

因此,修复它,您会收到一个错误,即帧应该被屏蔽。这是一个简单的解决方法,只需在两个地方mask: false切换到true即可。

然后,

一旦您发送完音频和结束消息,该服务将发送您的最终结果,然后发送另一条{"state": "listening"}消息。这第二个state: listening应该是关闭连接的触发器。否则,它最终将超时并自动关闭(inactivity_timeout当您发送没有语音的音频时适用,而不是当您根本不发送任何数据时。

相关内容

  • 没有找到相关文章

最新更新