2,861
社区成员




DeepSeek-R1-Distill-Llama-8B 介绍
DeepSeek-R1-Distill-Llama-8B模型部署
在智能商业时代,高效精准的售前服务已成为企业提升竞争力的关键一环。传统客服模式在面对海量商品信息和多样化客户咨询时,往往因算力瓶颈导致响应延迟,而搭载高通 QCS8550 开发板的系统可将这一指标降低。这款采用 4nm 制程工艺的边缘计算平台,以八核 Kryo CPU 架构(1×3.2GHz 超大核 + 4×2.8GHz 性能核 + 3×2.0GHz 效率核)构建起异构计算体系,配合集成的 Hexagon 张量处理器实现 48TOPS INT8 算力,相较上一代产品在持续 AI 推理中能效提升 60%。
这种算力优势直接转化为商业价值:当客户咨询某款 8K 分辨率的家电商品时,QCS8550 不仅能通过 Adreno 740 GPU 实时解码商品详情视频,更能利用 4200MHz LPDDR5x 内存快速调取多维度参数库 —— 其内存带宽较传统方案提升 3 倍,支持同时加载 2000 + 商品 SKU 的图文视频数据。特别在大促峰值场景,平台搭载的 Wi-Fi 7 模块以 5.8Gbps 速率保障多轮对话的低时延交互,而 4nm 工艺带来的功耗控制,使设备在 24 小时连续运行中温度低于 45℃,完美解决传统边缘设备 "高负载降频" 的痛点。
如何借助前沿技术打破这一困局?高通 QCS8550 开发板凭借上述强大的计算性能与低功耗优势,结合 Dify 平台灵活的 AI 开发能力,为我们提供了全新解题思路。其内置的 Hexagon 矩阵扩展单元(HMX)专门针对大语言模型优化,支持 INT4 量化精度,使 80 亿参数模型在端侧推理延迟控制在 1s 以内 —— 这意味着客服助手能像人类专家一样实时响应复杂咨询。本文将深度拆解基于二者构建 AI 驱动的商品知识库与智能售前助手的全流程实践,无论是技术开发者、电商从业者,还是对 AI 应用感兴趣的读者,都能从中获取从硬件选型到业务落地的宝贵经验,探索智能客服领域的无限可能。
DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型。以下是对它的详细介绍:
Dify 是一个面向未来的开源 LLM 应用开发平台,融合了后端即服务与 LLMOps 理念,为开发者和企业提供生产级的生成式 AI 应用构建能力。以下是具体介绍:
AidLux 是成都阿加犀智能科技有限公司自主研发的 AIoT 应用开发和部署平台,具有以下特点:
AidLux 的应用场景广泛,可用于教学领域,支撑教学 + 开发 + 实践全过程,助力 AI 人才培养;也可用于工业场景,如工业视觉少样本缺陷检测等。此外,阿加犀智能科技还携手高通,以人形机器人解决方案推动具身智能产业创新发展,在人形机器人领域取得了一定成果。
将板卡用usb数据线连接到PC端,通过命令行界面adb调试查看本机IP 命令为ifconfig(例:192.168.100.100)
[需含adb相应驱动,自行安装],adb如何安装使用可以通过大模型查询
ssh -p 2222 aidlux@192.168.100.100
登陆到A8550PM2环境
sudo -i
切换到root用户,密码aidlux
首先卸载系统内预装的nginx,使80端口释放:
systemctl stop nginx
systemctl disable nginx
kill -9 nginx
然后安装docker-compose:
apt update
apt install docker-compose
任选一个目录,如/home,下载配置文件
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
Docker-compose up -d
docker启动后,一共会有10个容器运行
之后即可通过192.168.100.100(示例)访问Dify的网页端界面,并创建一个管理员账号
aid-pkg -i -d aidllm_1.2.0_arm64.aid.gpg
aid-pkg是aidlux的包管理工具;
aid-llm是aidlux的大模型推理引擎;
终端执行:
sudo aidllm install api
sudo aidllm remote-list
(上述列表展示当前可下载的全部模型文件,其中Current Soc 表示模型可适配的高通芯片型号)
终端执行:
sudo aidllm pull <Url>
,把指定模型文件拉取到本地
如:sudo aidllm pull aplux/aplux_qwen2-7B
查看本地已下载的模型:
sudo aidllm list
终端执行:
sudo aidllm api start
当提示successfully,则表示API启动成功
当本地存在多个模型文件,则可以指定模型启动
终端执行:sudo aidllm api start -m <Name>
如:sudo aidllm api start -m aplux_qwen2.5-3B
查询状态:
sudo aidllm api status
停止服务:sudo aidllm api stop
重启服务:sudo aidllm api restart
3.1.确认此时模型以正常启动,可在本机或其他设备上测试
curl -X POST ‘http://192.168.111.133:8888/v1/chat/completions’
–header ‘Content-Type: application/json’
–data-raw ‘{“model”: “aplux_qwen2-7b”,“api_key”: “”,“messages”: [{“role”: “system”,“content”: “You are a helpful assistant”},{“role”: “user”,“content”: “给我讲一个笑话”}],“stream”: true}’
3.2.安装插件
3. 3.添加模型,api-key可随意填写
这里我们添加LLM和embedding模型各一个
3. 4.模型添加完成后,即可添加应用、知识库结合使用
商品ID | 商品名称 | 品牌 | 品类 | 规格 | 单位价格(元) | 保质期 | 热卖口味 | 优惠方案 |
SP1001 | 乐事薯片 | 乐事 | 膨化食品 | 104g | 6.5/袋 | 9个月 | 原味;黄瓜味;青柠味 | 【限时特惠】买2送1(同口味)【满减】满30减5【组合装】3袋装仅需15元 |
DR2001 | 可口可乐 | 可口可乐 | 碳酸饮料 | 330ml | 3/罐 | 12个月 | 经典原味 | 【整箱装】24罐装68元(单罐2.8元)【夏日冰爽】购6罐送便携冰袋【组合优惠】可乐+薯片套餐价28元(原价32) |
SP1002 | 奥利奥夹心饼干 | 亿滋 | 饼干 | 116g | 8.9/盒 | 12个月 | 原味;草莓味;巧克力味 | 【家庭装】480g装29.9元(省12元)【满赠】满40元送限量款冰箱贴【早餐组合】牛奶+奥利奥=22元 |
DR2002 | 三得利乌龙茶 | 三得利 | 茶饮料 | 500ml | 5.5/瓶 | 12个月 | 无糖原味 | 【多瓶装】6瓶装28.8元(单瓶4.8元)【新客专享】新用户第一瓶立减3元【办公套餐】乌龙茶+饼干=32元 |
SP1003 | 士力架花生夹心 | 玛氏 | 巧克力 | 51g | 4.5/条 | 14个月 | 花生巧克力 | 【能量套装】5条装19.9元(省4元)【满额赠】满20元送迷你湿巾【运动组合】士力架+运动饮料=15元 |
DR2003 | 蒙牛纯牛奶 | 蒙牛 | 乳制品 | 250ml | 3.2/盒 | 6个月 | 全脂型 | 【月卡】30盒装88元(单盒2.93元)【订阅省】定期购享9折【儿童套餐】牛奶+儿童饼干=25元 |
导入文件后点下一步
若选择通用、经济方式,则不调用embedding模型,只用本地环境即可完成
完成后保存
然后即可与机器人对话,大模型会在知识库中寻找答案并思考回答
提示:这类问题比较简单,可以关闭深度思考功能,保证流畅的速度。