正在阅读:SSE指令介绍及其C、C++应用SSE指令介绍及其C、C++应用

2004-06-02 10:24 出处:CSDN 作者:fireseed 责任编辑:linjixiong


__m128 S1 = { 1.0f, 2.0f, 3,0f, 4,0f };


  要改变其中第2个(基数为0)元素时可以这样写:


S1.m128_f32[2] = 6.0f;

  令外我们还会用到几个赋值的指令,它可以让我们更方便的使用这个数据结构:


S1 = _mm_set_ps1( 2.0f );

  它会让S1.m128_f32中的四个元素全部赋予2.0f,这样会比你一个一个赋值要快的多。


S1 = _mm_setzero_ps();

  这会让S1中的所有4个浮点数都置零。

  还有一些其它的赋值指令,但执行起来还没有自己逐个赋值来的快,只做为一些特殊用途,如果你想了解更多的信息,可以参考MSDN -> VisualC++参考 -> C/C++Language -> C++Language Reference -> Compiler Intrinsics -> MMX, SSE, and SSE2 Intrinsics -> Stream SIMD Extensions(SSE)章节。

  一般来讲,所有SSE指令函数都有3个部分组成,中间用下划线隔开:


_mm_set_ps1

  mm表示多媒体扩展指令集

  set表示此函数的含义缩写

  ps1表示该函数对结果变量的影响,由两个字母组成,第一个字母表示对结果变量的影响方式,p表示把结果做为指向一组数据的指针,每一个元素都将参与运算,S表示只将结果变量中的第一个元素参与运算;第二个字母表示参与运算的数据类型。s表示32位浮点数,d表示64位浮点数,i32表示32位定点数,i64表示64位定点数,由于SSE只支持32位浮点数的运算,所以你可能会在这些指令封装函数中找不到包含非s修饰符的,但你可以在MMX和SSE2的指令集中去认识它们。

  接下来我举一个例子来说明SSE的指令函数是如何使用的,必须要说明的是我以下的代码都是在VC7.1的平台上写的,不保证对其它如Dev-C++、Borland C++等开发平台的完全兼容。

  为了方便对比速度,我会用常归方法和SSE优化两种写法写出,并会用一个测试速度的类CTimer来进行计时。

  这个算法是对一组float值进行放大,函数ScaleValue1是使用SSE指令优化的,函数ScaleValue2则没有。我们用10000个元素的float数组数据来测试这两个算法,每个算法运算10000遍,下面是测试程序和结果:


#include <xmmintrin.h>

#include <windows.h>

 


察看评论详细内容 我要发表评论
作者笔名 简短内容 发表时间
:

键盘也能翻页,试试“← →”键

相关文章

关注我们

最新资讯离线随时看 聊天吐槽赢奖品