int型数据做SIMD时，用SSE怎么做呢？

laijj02 2008-04-08 01:56:44

SSE的intrinsic主要是针对浮点数的啊，
int型的操作明显没有float的丰富，
用浮点数的一些intrinsic来操作int，有warning，
而且不知道效率会不会有影响，
这个问题怎么解决的？
thanks：）

...全文

133 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

intel_jeff 2008-04-09

打赏
举报

回复

我记得int转换到浮点的开销不小哦。
请问你需要用哪个intrinsic呢？

VC中使用内联汇编-对混合编程学习很实用

SIMD指令集 SSE/AVX 概述参考手册 Intel® Intrinsics Guide Tommesani.com Docs Intel® 64 and IA-32 Architectures Software Developer Manuals 背景 1. 什么是指令集所谓指令集，就是CPU中用来计算和控制计算机系统的一套指令的集合，而每一种新型的CPU在设计时就规定了一系列与其他硬件电路相配合的指令系统。而指令集的先进与否，也关系到CPU的性能发挥，它也是CPU性能体现的一个重

这几天在做学校的一个学习小项目，需要用到SIMD指令计算提速。也是第一次碰这个，看了一些资料和代码，模仿着写了两个函数。 void sse_mul_float(float *A, float *B, int cnt)：两段内存float数据点乘，结果覆盖第一组内存。 float sse_acc_float(float *A, int cnt)：一组内存float值累加。注： 1. 没...

前言 ClickHouse之所以会像闪电一样快（"blazing fast"），是多方面优化的结果，包括且不限于：高效且磁盘友好的列式存储，高效的数据压缩，精心设计的各类索引，并行分布式查询，运行时代码生成等。另外，ClickHouse为了最大限度地压榨硬件——尤其是CPU——的性能，实现了向量化查询执行（vectorized query execution）机制。这个名词相对于上面的那些可能没...

从这些示例可以看出，行程长度编码（RLE）通过统计连续重复出现的数据元素及其重复次数，将原始数据转换为一种更紧凑的表示形式，从而实现了数据压缩的效果。RLE是一种简单的数据压缩算法，它的原理是把数据中连续重复出现的字符（或数值）用一个计数值和该字符（或数值）来表示，从而达到压缩数据的目的。在这个示例中，我们将使用C语言结合Intel的SSE2指令集（SSE2是一种常见的SIMD扩展，支持整型计算等功能，方便演示）来展示SIMD指令的加速效果。函数，可以显著减少循环迭代次数，从而加快数据压缩的速度。

英特尔边缘计算技术

568

社区成员

7,024

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章