小贝子编程

Intel AVX:为什么没有256位的双精度浮点变量点积版本?

本文关键字：浮点变量双精度版本 256位 AVX Intel c++ performance simd avx
更新时间 : 2023-08-24
英文 : Intel AVX : Why is there no 256-bits version of dot product for double precision floating point variables?

在另一个关于SO的问题中，我们尝试(并成功)找到一种方法来替换AVX缺失的指令:

 __m256d _mm256_dp_pd(__m256d m1, __m256d m2, const int mask);

有谁知道这条指令缺失的原因吗?

这个和其他各种AVX限制的潜在原因是AVX在体系结构上只不过是两个并排的SSE执行单元——你会注意到几乎没有AVX指令在两个128位的向量之间的边界上水平操作(这在vpalignr的情况下特别烦人)。一般来说，你只需要并行地获得两个128位SSE操作，这对于大多数仅以元素方式操作的指令很有用，但不如适当的256位SIMD实现有用。

最新更新

android WebView:复制到剪贴板[https://poe.com]
为什么我的web scraper将所有内容写在一行中?
无法获取…的applicationId项目类型:PROJECT_TYPE_LIBRARY
实例化prefab内部的对象
如何在html文本区的左上角放置按钮?
如何使用Nodejs API获取数据
为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合
类型 'String' 不是类型转换中 'List<String>' 类型的子类型？
__init__是一个类属性吗?
如何格式化LocalDateTime yyyy-MM-dd HH:mm到dd-MM-yyyy HH:mm作为字符串的整个
为什么客户端组件不工作- NextJS 13.3.0实验特性
跨行扩展字典，维护其他列- python
如何将open()加载的数据编码为UTF-8?
这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?
Picutre 未显示在警报对话框中
如何在SQL Server中赋予用户CREATE DATABASE的权限?
选项importsNotUsedAsValues已弃用
在c# WinForms中不维护更改鼠标指针
Rust执行类型转换在运行时或在编译静态?
我如何在log4net中指定一个绝对文件路径，使用datePattern?
如何在服务端使用pubnub w/ nodejs作为服务，并从不同的客户端连接到该nodejs服务器
用下划线替换其中任意一个字符
Typescript在访问映射的Proxy对象时丢失了键类型的特定性

Intel AVX:为什么没有256位的双精度浮点变量点积版本?

相关内容

最新更新

热门标签：