TypechoJoeTheme

MetMan's Blog

网站页面

Windows 11建立PyTorch开发环境

MetMan博 主
2024-07-31
/
0 评论
/
33 阅读
/
378 个字
/
百度已收录
07/31
本文最后更新于 2024年07月31日,已超过 51天没有更新。如果文章内容或图片资源失效,请留言反馈,我会及时处理,谢谢!

本文主要基于知乎文章4步搭建wsl2+cuda+docker解决windows深度学习开发问题内存,通过WSL在Windows 11中安装Ubuntu,并在Ubuntu中安装PyTorch环境以及NVIDIA HPC SDK。

WSL环境建立

  • 在BIOS或UEFI设置中开启虚拟化选项(一般默认已打开)
  • 在Microsoft Store中安装windows subsystem for Linux

  • 启用windows功能

在“控制面板”->“程序”->"启用或关闭Windows功能“中开启以下红框中内容。

如果在后续安装WSL-Ubuntu时出现类似wslregisterdistribution failed with error: 0x80370114错误时确保这一步完成了。

  • PowerShell中执行
bcedit /set hypervisorlaunchtype auto

WSL-Ubuntu安装

在Store中选择一个LTS长期支持版本的Ubuntu进行下载安装。也可以在PowerShell中执行wsl --install ubuntu-20.04

安装时会提示设置管理员账号密码,安装好后进入Ubuntu中更新一下。

sudo apt update

安装Windows版本的NVIDIA GPU驱动

https://www.nvidia.com/Download/index.aspx中选择相应GPU型号驱动下载

CUDA安装

在PyTorch官网查看依赖的CUDA版本: https://pytorch.org/get-started/locally/

下载CUDA 12.1版本

环境变量配置

cuda_version=$(ls /usr/local/ | grep -oP "cuda-\d+\.\d+" | tail -1)
echo "CUDA Version: $cuda_version"
cuda_bin_path="/usr/local/$cuda_version/bin"
cuda_lib_path="/usr/local/$cuda_version/lib64"
echo "export PATH=\"$cuda_bin_path:\$PATH\"" >> ~/.bashrc
echo "export LD_LIBRARY_PATH=\"$cuda_lib_path:\$LD_LIBRARY_PATH\"" >> ~/.bashrc
source ~/.bashrc

奇怪的是指定12.1版本下载,但安装后发现是12.3版本。不过不影响后续Pytorch安装使用。

可以使用nvidia-smi查看NVIDIA GPU详细情况。

Miniconda安装

下载页面: https://docs.conda.io/projects/miniconda/en/latest/index.html

mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh

安装成功后

~/miniconda3/bin/conda init bash 
. ~/.bashrc

PyTorch安装

conda create -n pytorch   # 创建pytorch环境
conda activate pytorch 
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

测试PyTorch是否安装成功

$ python 
Python 3.11.5 (main, Sep 11 2023, 13:54:46) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True
>>> torch.zeros([1]).cuda()
tensor([0.], device='cuda:0')
>>>

NVIDIA HPC SDK安装

访问网页 https://developer.nvidia.com/hpc-sdk-downloads

我选择将安装包下载到本地再安装,也可以使用对应的包安装管理器在线安装。

注意安装时如果要安装到/opt路径,需要使用管理员权限安装

sudo nvhpc_2023_239_Linux_x86_64_cuda_12.2/install

问题汇总

  • 无法配置 networkingMode Nat)(网络。若要禁用网络,请在C:\Users\Administrator.wslconfig中设置“wsl2.networkingMode=None”

确保打开“虚拟机平台”

参考资料

  1. https://zhuanlan.zhihu.com/p/653173679
  2. https://pytorch.org/get-started/locally/
  3. https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=WSL-Ubuntu&target_version=2.0&target_type=deb_network
  4. https://docs.nvidia.com/cuda/wsl-user-guide/index.html#cuda-support-for-wsl-2
  5. https://blog.csdn.net/CurryYe30/article/details/134474777
pytorchMLNVIDIA
朗读
赞(0)
赞赏
感谢您的支持,我会继续努力哒!
版权属于:

MetMan's Blog

本文链接:

https://blog.metman.top/index.php/archives/114/(转载时请注明本文出处及文章链接)

评论 (0)

互动读者

标签云

最新回复

暂无回复

登录
X
用户名
密码