社区
英特尔边缘计算技术
帖子详情
在双核上运行Huffman压缩的性能
信谦
2008-05-19 10:31:39
大家好啊 ,我用OpenMP实现了Huffman压缩文本文件程序,运行环境是Intel双核,
但是很奇怪,发现并行性能还不如串行的好。
我想的原因可能是负载不平衡,因为我用了很多的任务队列;
还有一种可能是读文件和写文件是不能并行的,所以造成瓶颈。
有高人可以帮我指点一下吗,我们快要检测代码了。
谢谢
...全文
142
3
打赏
收藏
在双核上运行Huffman压缩的性能
大家好啊 ,我用OpenMP实现了Huffman压缩文本文件程序,运行环境是Intel双核, 但是很奇怪,发现并行性能还不如串行的好。 我想的原因可能是负载不平衡,因为我用了很多的任务队列; 还有一种可能是读文件和写文件是不能并行的,所以造成瓶颈。 有高人可以帮我指点一下吗,我们快要检测代码了。 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
intel_www
2008-05-28
打赏
举报
回复
对MakeHuffmanCode的调用是否是在另一个循环中?如果是的话,这里的thread overhead会过大,导致并行版本比串行更慢。
信谦
2008-05-19
打赏
举报
回复
[Quote=引用 1 楼 Intel_CG 的回复:]
建议用Intel Thread Profiler检查负载平横。 请贴出用OpenMP的代码,方便讨论。或去premier.intel.com提交问题
[/Quote]
比如一个生成Huffman码的函数:
void MakeHuffmanCode(PHuffNode hnode,int deep) //生成Huffman码
{
static char hcode[256]={0}; //每次调用均清0
static int ncnt = 0;
BOOL IsChild = TRUE; //用来标记是否为叶节点
if(hnode->lChild || hnode->rChild)
{
hnode->arrIndex = ncnt;
m_fhead.push_back(*hnode);
ncnt++;
}
#pragma intel omp parallel taskq
{
#pragma intel omp task
{
if(hnode->lChild != NULL)
{
hcode[deep] = '0'; //左边为0,右边为1
MakeHuffmanCode(hnode->lChild,deep+1);
IsChild = FALSE;
}
}
#pragma intel omp task
{
if(hnode->rChild != NULL)
{
hcode[deep] = '1';
MakeHuffmanCode(hnode->rChild,deep+1);
IsChild = FALSE;
}
}
}
if(IsChild) //一个字符的编码结束
{
hcode[deep]='\0';
HuffCode[hnode->cKey] = hcode;
}
}
还有其他很多函数的WHILE循环都是用任务队列实现的。
我再用Intel Thread Profiler检测一下负载平衡。
希望大家有建议提出来
谢谢了!!
Intel_CG
2008-05-19
打赏
举报
回复
建议用Intel Thread Profiler检查负载平横。 请贴出用OpenMP的代码,方便讨论。或去premier.intel.com提交问题
7-Zip
压缩
技术源码深度解析与实战
7-Zip是一款以高效
压缩
性能
著称的开源归档工具,其核心优势在于公开的源码架构与对多种格式(如.7z、.zip、.tar等)的支持。它采用LZMA和LZMA2算法,在高
压缩
比与内存占用之间实现了良好平衡。项目整体采用模块化设计,分为
压缩
引擎、I/O抽象层、格式解析器等多个核心组件,便于功能扩展与跨平台移植。其开源许可证为LGPL,部分关键
压缩
代码置于公有领域,允许在商业产品中自由集成与修改,极大促进了二次开发与生态繁荣。
BL618JPEG编码
压缩
摄像头图像数据
BL618通过硬件JPEG编码实现高效图像
压缩
,降低CPU负载,支持低功耗实时视觉处理,适用于AIoT边缘设备。
OV2640
压缩
图像加快传输速度
本文深入分析OV2640图像传感器的采集与传输瓶颈,提出基于硬件JPEG
压缩
、端侧预处理和系统级优化的协同解决方案,显著降低数据负载并提升嵌入式视觉系统的实时性与能效。
小智音箱解码AAC_Decoder高效
压缩
音频流
本文深入解析小智音箱中AAC音频解码技术的原理、架构设计与嵌入式实现,涵盖ADTS头解析、IMDCT逆变换、声道处理及
性能
优化等关键技术,并探讨了与ALSA、后处理模块的协同集成与未来演进方向。
智能音箱语音数据
压缩
编码方案评估
本文系统阐述智能音箱语音
压缩
编码技术,涵盖波形、参数与混合编码原理,分析主流算法及标准化协议,并探讨嵌入式优化、自适应策略与未来神经音频编码发展趋势。
英特尔边缘计算技术
568
社区成员
7,024
社区内容
发帖
与我相关
我的任务
英特尔边缘计算技术
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
复制链接
扫一扫
分享
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章