小贝子编程

如何将音频字节流转换为torch张量

本文关键字：torch 张量转换字节流音频 audio pytorch tensor torch bytestream
更新时间 : 2023-09-21
英文 : How to convert audio byte stream to torch tensor?

我正在尝试将bytes音频流转换为PyTorch张量，作为PyTorch的forward()函数的输入。

(更具体地说，我使用Nemo扬声器模型来识别扬声器：

audio_signal, audio_signal_length = torch.tensor([audio]), torch.tensor([audio_length]))

有人知道怎么做吗？

这对我有效，尽管我相信有一种更简单的方法

import io
import numpy as np
import scipy as sc
import torch
import torchaudio

SAMPLE_RATE = 16000
def bytes_to_audio_tensor(audio_bytes:bytes) -> torch.Tensor:
bytes_io = io.BytesIO()
raw_data = np.frombuffer(
buffer=audio_bytes, dtype=np.int32
)
sc.io.wavfile.write(bytes_io, SAMPLE_RATE, raw_data)
audio, _ = torchaudio.load(bytes_io)
return audio.squeeze(0)

最新更新

如何在函数中返回更多的mysql行?
Jetpack撰写格式日期字符串
如何在LinkedList中获得两个值
我可以确定向量包含对象而不是指向对象的指针吗?
使用传统的foreach循环替换c#中List中特定索引处的项
如何测试以record为参数的函数?
JSON为现代c++漂亮打印机不工作在Eclipse IDE
OPPO Mobile在Appium中的移动自动化测试问题
Select语句为1表返回新的行，然后表实际有
如何在html页面中使用循环设置css设计
基于docker的Vue项目的热加载
MySQL用户属于组织
使用正则表达式从颤振字符串中提取子字符串
Django模板在CSS中使用自定义过滤器
Redux存储值没有在其他组件中更新
从对象中获取一个值，并使用该值在一个条件下填充同一对象中的其他键
Java:具有不同主机头和目的地的Http请求
表单中的 Submit按钮在第二次点击后生效.ReactJS
未定义名称"文件"。运行 XBRL 代码时
通过布尔级数进行过滤
模拟器错误，其中SF符号不显示在UIKit(但在SwiftUI工作)
为什么我的 shell 脚本循环在 Linux 中不起作用？
reactjs useState empty array
将Plotly Dash中的数据存储到外部对象
删除划线文本时错误400
是否有办法将表中的一个字段中的数据分割成两个字段(列)在MySQL中打印
postgresql-为什么行共享锁与行独占锁冲突?
Google drive API (v2)无法下载一些文件(扩展名为xlsx,pdf)
Google Apps Script简单递归脚本运行非常慢
显示django admin中链接模型字段的信息

如何将音频字节流转换为torch张量

相关内容

最新更新

热门标签：