关于打包代码的O3级优化出错问题（请华为工程师进来看看），请各位高手帮忙看看问题怎么解决

u014761879 2016-05-10 12:26:51

按照复赛的gcc-2.0的编译脚本打包的，gcc-2.0的CMakeLists中的release版本采用的O3级优化，这种优化下我们的代码死活出不来结果，一直是输出NA，提交到官网上也没成绩，但是把优化级别改为O2，就能正常出结果了，想问一下大家这种情况怎么办，按照复赛要求，CMakeLists是不能改的，想问一下华为工程师，一定要用O3优化吗，O3优化很容易遭遇bug吧，这种情况怎么修改代码

...全文

1382 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

watercccppp 2016-05-12

打赏
举报

回复

引用 3 楼 zhao4zhong1 的回复:

O3优化遭遇bug的原因还是代码逻辑写的不够严谨。

确实是这样的哦

赵4老师 2016-05-12

打赏
举报

回复

O3优化遭遇bug的原因还是代码逻辑写的不够严谨。

frostbolt 2016-05-10

打赏
举报

回复

跟楼主沟通了，把所有的编译告警清零后问题解决。

Jason7602 2016-05-10

打赏
举报

回复

是啊，我也遇到了这个问题，请问这个编译优化的问题怎么解决啊？

我自己的原文哦~ https://blog.51cto.com/whaosoft/12772867拆解高复杂运筹问题的砖石，打破数据稀缺的瓶颈，中科大提出高质量运筹数据生成方法论文作者刘昊洋是中国科学技术大学 2023 级硕士生，师从王杰教授，主要的研究方向为强化学习与学习优化理论及方法。他曾在 NeurIPS、ICML 和 ICLR 等人工智能顶级会议上发表论文三篇，曾获中国科学技术大学黄渝纪念奖学金、华为奖学金等荣誉。近日，中科大王杰教授团队（MIRA Lab）提出了矩阵分块分解技术生成数学优化问题

在Linux操作系统中，其拥有很多压缩工具，如gzip、bzip2、xz等等，但是其有一个缺点：一次只能压缩一个文件（而且无法压缩文件夹）① 打包，把一个或多个文件打成tar包，并不是压缩，只是把文件合并在一个tar文件中1.txt 5MB打包123.tar = 5MB + 10MB + 15MB = 30MB为什么要打包，就是为了后期的压缩操作。② 打包并压缩。

华为昇腾CANN生态中的ops-transformer仓通过算子融合、内存优化和智能调度三大技术，将Transformer模型端到端性能提升3-8倍。该仓库包含六大类重新设计的算子，如MC2通信计算融合和FlashAttention优化，通过三层架构实现硬件透明与灵活适配。实战案例显示，在万亿参数MoE模型优化中，延迟降低4.1倍，内存占用减少46%。未来将向自动算子融合、跨平台统一和生态平台化发展，成为AI基础设施的关键中间层。开发者可通过昇腾训练营学习相关技术，获得认证和奖励。

例如，一系列（公认）无法在多项式时间内解决却可在多项式空间内解决的 NP-Complete（如旅行商等等），对于使用有限精度 Transformer 的 CoT 而言至少需要超越多项式（例如 exp (n)）规模的上下文长度，在真实应用中由于内存的限制完全不可行；纵观计算机科学的发展历史，这一「随时清理」的理念早已渗透到几乎所有计算模型之中：从最早的图灵机模型中，已读写的磁带符号可以被覆盖或重写，直到现在高级编程语言中，垃圾回收机制会自动清理不再可达的内存单元。随着问题规模增加，两者之间的差距愈发明显。

本文深入探讨了OpenSSL交叉编译的高级技巧，重点介绍如何在不手动修改Makefile的情况下，通过正确使用Configure脚本、环境变量和关键参数（如no-asm、shared），精准控制动态库的生成过程。文章以华为云ARM服务器为例，提供了可复用的参数组合与最佳实践，帮助嵌入式开发者和系统工程师实现优雅、可靠的交叉编译工作流。

HUAWEI Code Craft

127

社区成员

546

社区内容

发帖

与我相关

我的任务

开源软件软件工程软件构建技术论坛（原bbs）

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章