要改变其中第2个(基数为0)元素时可以这样写:
令外我们还会用到几个赋值的指令,它可以让我们更方便的使用这个数据结构:
它会让S1.m128_f32中的四个元素全部赋予2.0f,这样会比你一个一个赋值要快的多。
这会让S1中的所有4个浮点数都置零。 还有一些其它的赋值指令,但执行起来还没有自己逐个赋值来的快,只做为一些特殊用途,如果你想了解更多的信息,可以参考MSDN -> VisualC++参考 -> C/C++Language -> C++Language Reference -> Compiler Intrinsics -> MMX, SSE, and SSE2 Intrinsics -> Stream SIMD Extensions(SSE)章节。 一般来讲,所有SSE指令函数都有3个部分组成,中间用下划线隔开:
mm表示多媒体扩展指令集 set表示此函数的含义缩写 ps1表示该函数对结果变量的影响,由两个字母组成,第一个字母表示对结果变量的影响方式,p表示把结果做为指向一组数据的指针,每一个元素都将参与运算,S表示只将结果变量中的第一个元素参与运算;第二个字母表示参与运算的数据类型。s表示32位浮点数,d表示64位浮点数,i32表示32位定点数,i64表示64位定点数,由于SSE只支持32位浮点数的运算,所以你可能会在这些指令封装函数中找不到包含非s修饰符的,但你可以在MMX和SSE2的指令集中去认识它们。 接下来我举一个例子来说明SSE的指令函数是如何使用的,必须要说明的是我以下的代码都是在VC7.1的平台上写的,不保证对其它如Dev-C++、Borland C++等开发平台的完全兼容。 为了方便对比速度,我会用常归方法和SSE优化两种写法写出,并会用一个测试速度的类CTimer来进行计时。 这个算法是对一组float值进行放大,函数ScaleValue1是使用SSE指令优化的,函数ScaleValue2则没有。我们用10000个元素的float数组数据来测试这两个算法,每个算法运算10000遍,下面是测试程序和结果:
|
正在阅读:SSE指令介绍及其C、C++应用SSE指令介绍及其C、C++应用
2004-06-02 10:24
出处:CSDN
责任编辑:linjixiong
键盘也能翻页,试试“← →”键