About the performance

aXu 2008-05-05 11:29:32
Hi,

I want to know, how performance about IPP and MKL functions. Did you do some test and compare with others? Can you give a report about it?

Thanks and Best regards.
...全文
104 7 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
youxia000 2008-06-06
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 intel_cyu 的回复:]
》但是当小矩阵乘法的时候ipp节省的时间小于调用函数要花的时间,反而不如直接来快了

测试中是否有较多的矩阵数据? 最好在一次的函数调用中,处理多个矩阵数据, 这样可以减少函数调用的开销. 见函数手册中,下面两类函数:

Case 17: Matrix - matrix array operation
IppStatus ippmMul_mma_32f(const Ipp32f* pSrc1, int src1Stride1,
int src1Stride2, int src1Width, int src1Height, const Ipp32f* pSrc2,
int …
[/Quote]

3q,不过我要做的是坐标变换 3*3的小矩阵,而且每次变换之后做其他计算才能确定下次要计算的 坐标,所以没法实现一次处理多个矩阵乘法
我做过试验了,我这样的需求还是用直接算的快

十分希望IPP 出支持光线追踪的函数
tantaiyizu 2008-06-04
  • 打赏
  • 举报
回复
thanks for your post ,but i don't understand "IPP" ,Good luck.
intel_cyu 2008-05-08
  • 打赏
  • 举报
回复
》但是当小矩阵乘法的时候ipp节省的时间小于调用函数要花的时间,反而不如直接来快了

测试中是否有较多的矩阵数据? 最好在一次的函数调用中,处理多个矩阵数据, 这样可以减少函数调用的开销. 见函数手册中,下面两类函数:

Case 17: Matrix - matrix array operation
IppStatus ippmMul_mma_32f(const Ipp32f* pSrc1, int src1Stride1,
int src1Stride2, int src1Width, int src1Height, const Ipp32f* pSrc2,
int src2Stride0, int src2Stride1, int src2Stride2, int src2Width,
int src2Height, Ipp32f* pDst, int dstStride0, int dstStride1,
int dstStride2, int count);


Case 21: Matrix array - matrix operation
IppStatus ippmMul_mam_32f(const Ipp32f* pSrc1, int src1Stride0,
int src1Stride1, int src1Stride2, int src1Width, int src1Height,
const Ipp32f* pSrc2, int src2Stride1, int src2Stride2, int src2Width,
int src2Height, Ipp32f* pDst, int dstStride0, int dstStride1,
int dstStride2, int count);
intel_iclifort 2008-05-08
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 Intel_merryhy 的回复:]
咦,那个ippmMul_MV的帖子那里去了?我们可以做个实验比较比较呢。
[/Quote]

在这里: http://topic.csdn.net/u/20080504/10/2ad50d36-69a1-4fcc-8562-a91ff2311103.html

从本论坛的精华汇总贴里, 也能找到的.
Intel_merryhy 2008-05-08
  • 打赏
  • 举报
回复
咦,那个ippmMul_MV的帖子那里去了?我们可以做个实验比较比较呢。
intel_iclifort 2008-05-07
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 youxia000 的回复:]
我用在图像库 ippi的时候效果很明显,比如光滑一下,比自己写的要快不少

但是当小矩阵乘法的时候ipp节省的时间小于调用函数要花的时间,反而不如直接来快了

MKL没用过,正想研究下,那位高手给介绍下MKL,都有那些类库
[/Quote]

MKL的介绍, 请参考 "英特尔软件开发工具技术文章索引"中的介绍: http://topic.csdn.net/u/20080407/13/fcf18324-44ea-4a61-9011-a4bc11d48af5.html

MKL相比IPP, 适应更大规模的矩阵计算. 如果非常小的矩阵, 可以考虑借助编译器生成SSE指令, 效果更好些
youxia000 2008-05-05
  • 打赏
  • 举报
回复
我用在图像库 ippi的时候效果很明显,比如光滑一下,比自己写的要快不少

但是当小矩阵乘法的时候ipp节省的时间小于调用函数要花的时间,反而不如直接来快了

MKL没用过,正想研究下,那位高手给介绍下MKL,都有那些类库

567

社区成员

发帖
与我相关
我的任务
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
  • 英特尔技术社区
  • shere_lin
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧