昆仑芯 XPU P800 安装说明
飞桨框架 XPU 版支持昆仑芯 XPU P800 的训练和推理,提供两种安装方式:
通过飞桨官网发布的 wheel 包安装
通过源代码编译安装得到 wheel 包
昆仑芯 XPU P800 系统要求
| 要求类型 | 要求内容 |
|---|---|
| 芯片型号 | 昆仑芯 P800 |
| 操作系统 | Ubuntu |
注意:当前教程适用于『昆仑芯』P800。查看芯片类型请参考如下命令:
# 系统环境下运行如下命令,如果有设备列表输出,且字段为 3686 ~ 3689,则说明芯片为昆仑芯 P800
lspci -d 1d22: -n
lspci -d 2057: -n
运行环境准备
推荐使用飞桨官方发布的昆仑芯 XPU 开发镜像,该镜像预装有昆仑芯基础运行环境库(XRE)。
# 拉取镜像
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-xpu:ubuntu20-x86_64-gcc84-py310
# 参考如下命令,启动容器
docker run -it --privileged=true --net host --shm-size '256gb' --device=/dev/xpu0:/dev/xpu0 --device=/dev/xpu1:/dev/xpu1 --device=/dev/xpu2:/dev/xpu2 --device=/dev/xpu3:/dev/xpu3 --device=/dev/xpu4:/dev/xpu4 --device=/dev/xpu5:/dev/xpu5 --device=/dev/xpu6:/dev/xpu6 --device=/dev/xpu7:/dev/xpu7 --device=/dev/xpuctrl:/dev/xpuctrl --name paddle-xpu-dev -v $(pwd):/work -w=/work -v xxx ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-xpu:ubuntu20-x86_64-gcc84-py310 /bin/bash
选项说明及可调整参数
① --name paddle-xpu-dev
作用:指定容器名称。
可调整:
用户可改为其他名称,例如
paddle-xpu-test,方便区分不同实验。
② -v $(pwd):/work
作用:挂载本地目录到容器内
/work目录。可调整:
可以修改
$(pwd)为实际路径,例如-v /data/projects:/work,让容器访问宿主机的数据。
③ --shm-size '256gb'
作用:设置共享内存大小,影响数据处理和计算效率。
可调整:
若内存有限,可降低,如
--shm-size=32G,但可能影响大规模训练。
# 检查容器内是否可以正常识别昆仑芯 XPU 设备
xpu-smi
安装飞桨框架
注意:当前飞桨 develop 分支仅支持 X86 架构,如需昆仑芯 XPU 的 ARM 架构支持,请提交issue告知我们
安装方式一:wheel 包安装
在启动的 docker 容器中,下载并安装飞桨官网发布的 wheel 包。
# 下载并安装 wheel 包
python -m pip install --pre paddlepaddle-xpu -i https://www.paddlepaddle.org.cn/packages/nightly/xpu-p800/
⚠️ 注意:nightly 版本为每日构建,可能存在不稳定性。如果需要更稳定的版本,建议使用 3.0-rc 版本。
安装方式二:源代码编译安装
在启动的 docker 容器中,下载 Paddle 源码并编译,CMAKE 编译选项含义请参见编译选项表。
# 下载 Paddle 源码
git clone https://github.com/PaddlePaddle/Paddle.git -b develop
cd Paddle
# 创建编译目录
mkdir build && cd build
# cmake 编译命令
cmake .. -DPY_VERSION=3.10 \
-DCMAKE_BUILD_TYPE=Release \
-DWITH_GPU=OFF \
-DWITH_XPU=ON \
-DON_INFER=OFF \
-DWITH_PYTHON=ON \
-DWITH_XPU_XRE5=ON \
-DWITH_MKL=OFF \
-DWITH_XPU_BKCL=ON \
-DWITH_TESTING=ON \
-DWITH_XCCL_RDMA=ON \
-DWITH_XPU_XHPC=ON \
-DBUILD_WHL_PACKAGE=ON \
-DWITH_DISTRIBUTE=ON \
-DARCH_BIN_CONTAINS_90=1
# make 编译命令
make -j$(nproc) TARGET=HASWELL
# 编译产出在 build/python/dist/ 路径下,使用 pip 安装即可
pip install -U paddlepaddle_xpu-3.3.0.dev20251226-cp310-cp310-linux_x86_64.whl
⚠️ 注意:nightly 版本为每日构建,可能存在不稳定性。如果需要更稳定的版本,建议使用 3.0-rc 版本。
基础功能检查
安装完成后,在 docker 容器中输入如下命令进行飞桨基础健康功能的检查。
# 检查当前安装版本
python -c "import paddle; paddle.version.show()"
# 预期得到输出如下
commit: cbf3469113cd76b7d5f4cba7b8d7d5f55d9e9911
cuda: False
cudnn: False
hip: None
nccl: 0
xpu_xre: 5.7.0.0
xpu_xccl: 3.0.4.7
xpu_xhpc: dev/20251213
cinn: False
tensorrt: None
cuda_archs: []
# 飞桨基础健康检查
python -c "import paddle; paddle.utils.run_check()"
# 预期得到输出如下
PaddlePaddle works well on 8 XPUs.
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.