社区
HUAWEI Code Craft
帖子详情
关于打包代码的O3级优化出错问题(请华为工程师进来看看),请各位高手帮忙看看问题怎么解决
u014761879
2016-05-10 12:26:51
按照复赛的gcc-2.0的编译脚本打包的,gcc-2.0的CMakeLists中的release版本采用的O3级优化,这种优化下我们的代码死活出不来结果,一直是输出NA,提交到官网上也没成绩,但是把优化级别改为O2,就能正常出结果了,想问一下大家这种情况怎么办,按照复赛要求,CMakeLists是不能改的,想问一下华为工程师,一定要用O3优化吗,O3优化很容易遭遇bug吧,这种情况怎么修改代码
...全文
1382
4
打赏
收藏
关于打包代码的O3级优化出错问题(请华为工程师进来看看),请各位高手帮忙看看问题怎么解决
按照复赛的gcc-2.0的编译脚本打包的,gcc-2.0的CMakeLists中的release版本采用的O3级优化,这种优化下我们的代码死活出不来结果,一直是输出NA,提交到官网上也没成绩,但是把优化级别改为O2,就能正常出结果了,想问一下大家这种情况怎么办,按照复赛要求,CMakeLists是不能改的,想问一下华为工程师,一定要用O3优化吗,O3优化很容易遭遇bug吧,这种情况怎么修改代码
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
watercccppp
2016-05-12
打赏
举报
回复
引用 3 楼 zhao4zhong1 的回复:
O3优化遭遇bug的原因还是代码逻辑写的不够严谨。
确实是这样的哦
赵4老师
2016-05-12
打赏
举报
回复
O3优化遭遇bug的原因还是代码逻辑写的不够严谨。
frostbolt
2016-05-10
打赏
举报
回复
跟楼主沟通了,把所有的编译告警清零后问题解决。
Jason7602
2016-05-10
打赏
举报
回复
是啊,我也遇到了这个问题,请问这个编译优化的问题怎么解决啊?
51c大模型~合集86
我自己的原文哦~ https://blog.51cto.com/whaosoft/12772867拆解高复杂运筹
问题
的砖石,打破数据稀缺的瓶颈,中科大提出高质量运筹数据生成方法论文作者刘昊洋是中国科学技术大学 2023
级
硕士生,师从王杰教授,主要的研究方向为强化学习与学习
优化
理论及方法。他曾在 NeurIPS、ICML 和 ICLR 等人工智能顶
级
会议上发表论文三篇,曾获中国科学技术大学黄渝纪念奖学金、
华为
奖学金等荣誉。近日,中科大王杰教授团队(MIRA Lab)提出了矩阵分块分解技术生成数学
优化
问题
运维
工程师
第二阶段linux基础
在Linux操作系统中,其拥有很多压缩工具,如gzip、bzip2、xz等等,但是其有一个缺点:一次只能压缩一个文件(而且无法压缩文件夹)①
打包
,把一个或多个文件打成tar包,并不是压缩,只是把文件合并在一个tar文件中1.txt 5MB
打包
123.tar = 5MB + 10MB + 15MB = 30MB为什么要
打包
,就是为了后期的压缩操作。②
打包
并压缩。
ops-transformer仓揭秘:CANN融合算子的生态与架构
华为
昇腾CANN生态中的ops-transformer仓通过算子融合、内存
优化
和智能调度三大技术,将Transformer模型端到端性能提升3-8倍。该仓库包含六大类重新设计的算子,如MC2通信计算融合和FlashAttention
优化
,通过三层架构实现硬件透明与灵活适配。实战案例显示,在万亿参数MoE模型
优化
中,延迟降低4.1倍,内存占用减少46%。未来将向自动算子融合、跨平台统一和生态平台化发展,成为AI基础设施的关键中间层。开发者可通过昇腾训练营学习相关技术,获得认证和奖励。
51c大模型~合集128
例如,一系列(公认)无法在多项式时间内
解决
却可在多项式空间内
解决
的 NP-Complete(如旅行商等等),对于使用有限精度 Transformer 的 CoT 而言至少需要超越多项式(例如 exp (n))规模的上下文长度,在真实应用中由于内存的限制完全不可行;纵观计算机科学的发展历史,这一「随时清理」的理念早已渗透到几乎所有计算模型之中:从最早的图灵机模型中,已读写的磁带符号可以被覆盖或重写,直到现在高
级
编程语言中,垃圾回收机制会自动清理不再可达的内存单元。随着
问题
规模增加,两者之间的差距愈发明显。
OpenSSL交叉编译进阶:如何不修改Makefile搞定动态库生成?
本文深入探讨了OpenSSL交叉编译的高
级
技巧,重点介绍如何在不手动修改Makefile的情况下,通过正确使用Configure脚本、环境变量和关键参数(如no-asm、shared),精准控制动态库的生成过程。文章以
华为
云ARM服务器为例,提供了可复用的参数组合与最佳实践,帮助嵌入式开发者和系统
工程师
实现优雅、可靠的交叉编译工作流。
HUAWEI Code Craft
127
社区成员
546
社区内容
发帖
与我相关
我的任务
HUAWEI Code Craft
华为软件精英挑战赛(Huawei Code Craft)是华为公司面向全球大学生举办的一年一度的大型软件竞赛,致力于让参赛学生感受软件改变世界魅力,展示软件设计与编程潜力,享受Coding解决问题
复制链接
扫一扫
分享
社区描述
华为软件精英挑战赛(Huawei Code Craft)是华为公司面向全球大学生举办的一年一度的大型软件竞赛,致力于让参赛学生感受软件改变世界魅力,展示软件设计与编程潜力,享受Coding解决问题
开源软件
软件工程
软件构建
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章