1,209
社区成员
Merlin HugeCTR(以下简称 HugeCTR)是 GPU 加速的推荐程序框架,旨在在多个 GPU 和节点之间分配训练并估计点击率(Click-through rate)。
此次 v3.5 更新涉及的模块主要为:
相关介绍:
我们封装了 HPS 的相关接口并将其作为独立库提供。此外,我们提供 HPS Python API 并通过 Jupyter nontebook 演示其用法。更多信息请参考分层参数服务器文档和 HPS 演示。
HPS 后端是一个用于嵌入向量在大规模嵌入表上查找的框架,旨在通过将嵌入表和嵌入缓存与深度推荐模型的端到端推理管道。更多信息请参考分层参数服务器。
用户可以通过 `pip install merlin-sok` 安装 SOK。
我们现已在训练中支持联合损失,以便用户可以使用多个标签和不同权重的任务进行训练。 API 扩展允许用户定义多个标签、损失层和相应的权重。用户可以根据需要在训练迭代之间更改权重。添加了 MMoE 示例以显示用法(https://github.com/NVIDIA-Merlin/HugeCTR/tree/master/samples/mmoe)
现在用户可以访问网页版文档了(https://nvidia-merlin.github.io/HugeCTR/master/)。
我们启用将 MultiCrossEntropyLoss 和 CrossEntropyLoss 层转换为 ONNX 以支持多标签推理。更多信息请参考 HugeCTR to ONNX Converter。
在 HPS 中使用更好的方法来确定数据库后端中的分区号。
简化 DataSourceParams 以便用户在真正需要之前无需提供所有路径。现在用户只需在创建求解器时传递一次 DataSourceParams。后续的路径将根据 DataSourceParams 设置自动判断本地路径或 HDFS 路径。
HugeCTR 输入层现在可以接受维度大于等于 1000 的稠密部分了。
另见 NCCL 的 已知问题。还有 GitHub 问题。
NVIDIA Merlin HugeCTR 团队正在积极招募 C++ 以及 CUDA 工程师(工作地点北京,上海,深圳),详细 JD 请见 https://mp.weixin.qq.com/s/Tg8xtbs0HN7UbtSmRenJ1g。欢迎感兴趣的同学扫描下方小程序二维码进行申请!