当前位置:首页 > CN2资讯 > 正文内容

自建 GPU 服务器 搭建gpu服务器

1天前CN2资讯

系统信息:

Ubantu18.04,GPU:Tesla P100

1. 使用Xshell 登录服务器

2. 安装nvidia驱动

根据服务器nvidia信息,下载对应版本的驱动(http://www.nvidia.com/Download/index.aspx?lang=en-us)

查看nvidia信息的命令

lspci | grep -i nvidia

将下载好的驱动文件传输到服务器文件夹下,依次输入以下两行命令,根据提示选择accept和yes,安装结束。

sudo apt-get install linux-headers-$(uname -r) sudo sh NVIDIA*.run

3.安装CUDA toolkit

官网下载CUDA toolkit对应版本(https://developer.nvidia.com/cuda-downloads),刚开始我选择的是最新的cuda_10.0,但是TensorFlow-gpu等对应的版本还没有,所以后面一直不成功。后来我选择了比较成熟的cuda_9.0,下载的是runfile本地安装。下载好同样上传到服务器。(ps:虽然我的ubantu是18.04版本,但是这里选16.04也不影响)

 根据官网的提示命令安装,或者使用命令

sudo sh cuda*.run

当出现下图所示情况时候,是CUDA的协议,按着enter往下走,一直到100%

 

接下来,输入accept,yes,注意接下来的一定要选择no,否则会出错(具体为什么出错暂时不知道)。

出现这样的字样,安装结束

 

 

 

 

注:如果第二行出现:toolkit installation failed using unsupported compiler,则将上文的安装命令后面添加-override即可,即

sudo sh cuda*.run -override

 

最后,添加环境变量

sudo vi /etc/profile

在打开的文件最后添加cuda的地址

export PATH=/usr/local/cuda-9.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

保存,退出,通过source命令使更改生效,并检查CUDA是否安装完成

source /etc/profile 使更改生效。 nvcc –V 检查CUDA

4.  安装CUDNN

官网下载和CUDA对应的版本(https://developer.nvidia.com/rdp/cudnn-download ),需要注册。然后解压文件,一次执行以下命令

tar -xvzf cudnn-9.0-linux-x64-v7.1.tgz cd cuda sudo cp include/cudnn.h /usr/local/cuda/include sudo cp lib64/libcudnn.* /usr/local/cuda/lib64

CUDNN安装完成。

5. 安装anaconda

在官网下载anaconda(https://www.continuum.io/downloads)。上传到服务器,使用如下命令安装。

sudo sh Anaconda3-5.2.0-Linux-x86_64.sh

根据提示,如果出现是否添加环境变量选择yes,如果选择了no,可以之后手动添加,方法如下:

sudo vi ~/.bashrc

在最后添加:

export PATH=$PATH:/home/userName/anaconda3/bin:$PATH

保存退出,使用source使命令生效。

source ~/.bashrc

所有这些都做好之后,记得关闭Xshell连接,重新连上才能conda信息。

6.安装TensorFlow-GPU

使用pip 命令,网速不好,耐心等待。也可以直接到官网先下载好,然后本地安装(https://pypi.org/project/tensorflow-gpu/#files)

pip install tensorflow-gpu

测试:

import tensorflow as tf hello = tf.constant('Hello, TensorFlow!') sess = tf.Session() print(sess.run(hello))

出现如下log信息,则说明环境搭建ok.

 

7. 为服务器添加普通用户

sudo useradd -m -s /bin/bash userName sudo passwd userName #为这个用户设置密码

删除用户

sudo userdel -r userName

 

 

 

备注:

服务器环境搭建jupyter可以直观的看到文件夹信息,如何搭建请参看下面链接:

参考网址:

    你可能想看:

    扫描二维码推送至手机访问。

    版权声明:本文由皇冠云发布,如需转载请注明出处。

    本文链接:https://www.idchg.com/info/20760.html

    分享给朋友:

    “自建 GPU 服务器 搭建gpu服务器” 的相关文章

    如何高效购买服务器?全面指南助你轻松选择最佳配置

    在决定购买服务器之前,做好充分的准备是至关重要的。服务器的选择直接影响企业的运营效率和未来发展,因此我们需要从多个角度进行考量。 确定企业需求 企业的需求是选择服务器的核心依据。我们需要明确服务器的主要用途,比如是用于数据存储、网站托管,还是进行大规模计算。不同的应用场景对服务器的性能要求差异很大。...

    使用newcom598优惠码注册域名,享受超值价格

    什么是newcom598优惠码? 我想和大家分享一个超值的优惠信息,那就是newcom598优惠码。这是一个专为Namecheap的新用户设计的优惠码,意在帮助刚开始建立自己在线业务的人以超优惠的价格注册.COM域名。通过这个优惠码,新用户可以以仅$5.98的价格获得首年的.COM域名,这样算下来在...

    Cloudflare 菲律宾节点:提升网络体验与速度的解决方案

    在当今数字化时代,每一个在线体验都至关重要。CloudFlare的出现,正是为了满足这一迫切的需求。作为全球知名的CDN(内容分发网络)服务提供商,CloudFlare不仅致力于加速网站的加载速度,也为用户提供安全防护服务。借助全球分布的节点,CloudFlare能够将用户请求快速而安全地送达目的地...

    连接测试地址的全面解析与故障排查技巧

    在网络管理和故障排查的过程中,连接测试地址扮演了重要角色。这些特定的IP地址并不指向任何实际的网络设备,因此在进行网络测试时,它们能够确保不会对现有的网络结构造成影响。简单来说,连接测试地址允许我们在不干扰现有设备的情况下,检查和验证网络的状态。 说到连接测试地址,我想起两个常见的:127.0.0....

    如何使用restorecon命令恢复Linux系统文件的安全上下文

    在学习Linux或进行系统管理时,可能会听到“restorecon”这个词。简单来说,restorecon是一个用于恢复文件和目录的安全上下文的命令。它的核心作用在于确保系统文件符合安全政策,帮助保持系统的安全性。想象一下,当我们对系统文件进行更改或更新时,这些文件的安全设置可能会被意外改变,这时r...

    搭梯子VPS推荐:最佳选择与使用评测

    Einführung zu VPS und dessen Bedeutung 在这个数字时代,越来越多的人寻求建立一个稳固的网络环境,特别是在搭建梯子方面。VPS,即虚拟专用服务器,成为了许多用户的优先选择。我第一次接触VPS是在寻找一个能稳定访问不同网站的解决方案时。简单来说,VPS允许用户在共享...