在摩尔线程 MTT S80 上使用 llama.cpp 进行 DeepSeek R1 14B蒸馏版模型推理

流水U 2025-03-05 01:13:32

PC配置

主板:B550M
CPU:AMD R7 5700X (官网描述X86支持Intel CPU, 实测AMD CPU也可以)
内存:32GB
SSD:512GB
显卡:MTT S80 (使用650W及以上ATX电源并通过双路PCIE给显卡供电)

OS

Ubuntu 22.04.5
内核版本:6.8.0-52-generic

显卡驱动与SDK

MUSA SDK版本:MUSA SDK rc3.1.1
显卡驱动版本:musa_2.7.1-rc3-0822_Ubuntu_amd64
SDK与驱动官网下载链接:https://developer.mthreads.com/sdk/download/musa?equipment=MTT%20S80&os=Ubuntu&driverVersion=&version=rc3.1.1
根据SDK包内 Installation_guide_for_MUSA_SDK_rc3.1.1.pdf 文档进行显卡驱动和SDK安装(根据官网博客文章描述该版驱动类型为 compute-only,可能存在图形界面无法启动的风险)。

模型文件

从开源社区下载模型文件:DeepSeek-R1-Distill-Qwen-14B-Q8_0.gguf

llama.cpp编译安装与运行

cd ~
#更新包信息并安装,需提前配置好国内的源以保证下载速度
sudo apt update && sudo apt upgrade -y
#安装一些工具方便远程操作,此处省略了samba配置
sudo apt install -y openssh-server samba net-tools curl clinfo
#安装llama.cpp编译依赖,需使用gcc-12和g++-12,否则可能报错cmath.h找不到
sudo apt install -y git build-essential cmake libomp-dev libboost-all-dev gcc-12 g++-12
sudo rm -rf /usr/bin/gcc
sudo rm -rf /usr/bin/g++
sudo ln -s /usr/bin/gcc-12 /usr/bin/gcc
sudo ln -s /usr/bin/g++-12 /usr/bin/g++

#配置好git信息并clone llama.cpp.git
git clone https://gitcode.com/gh_mirrors/ll/llama.cpp.git
#编译并安装llama.cpp
cd ~/llama.cpp
sudo cmake -B build -DGGML_MUSA=ON
sudo cmake --build build --config Release
sudo make -C build install

#创建目录并上传下载好的模型文件DeepSeek-R1-Distill-Qwen-14B-Q8_0.gguf到~/models目录
mkdir ~/models
cd ~/llama.cpp/build/bin/
#以WebUI界面方式运行llama.cpp,可通过浏览器访问http://<PC的IP>:8080进行访问
./llama-server -m ~/models/DeepSeek-R1-Distill-Qwen-14B-Q8_0.gguf -ngl 100 --port 8080 --host 0.0.0.0
#可以再开一个命令窗口对GPU进行监控
watch -n 3 mthreads-gmi
...全文
545 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
lisheng 04-04
  • 打赏
  • 举报
回复

请问你文中的硬件配置和内核,图形界面可以起来吗?我用的5700G,无论是6.8还是5.15的内核,都跑不起图形界面。

流水U 04-13
  • 举报
回复
@lisheng 跑不起来,只能用shell/ssh
aoian5173 04-16
  • 举报
回复
@流水U 最新的驱动 3.0.0您有尝试吗 还是一样的结果吗
  • 举报
回复
@aoian5173 3.0的驱动界面是可以有了,但不确定llama能否运行,因为同样跑官方 ollama 的 docker 失效了。
2条回复

150

社区成员

发帖
与我相关
我的任务
社区描述
摩尔线程成立于 2020 年 10 月,以全功能 GPU 为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的 AI 计算支持。 我们的目标是成为具备国际竞争力的 GPU 领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。
企业社区
社区管理员
  • 摩尔线程
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧