之前一直用CPU 跑 caffe
但後來發現實在是太慢了
尤其是遇到跑很大網路的時候
因此小編馬上就去敗一張顯卡(nvidia 1070)回來
小編是參考這篇文章買的 請點我
但買回來後馬上就發生悲劇
我一如往常的安裝一個新的linux 系統
誰知道只能到開始畫面
不管是按第一個 try without install ubuntu
或是第二個 install ubuntu
進去不久後 螢幕馬上就變黑 顯示: out of range
簡直快瘋掉拉~~經過google 後 馬上也發現到一堆人和我有一樣的問題
於是完整安裝方法如下:
環境:
作業系統:Ubuntu 14.04
顯卡: Nvidia 1070
一.安裝顯卡驅動
1.在別的電腦先重灌好 ubuntu14.04 然後輸入以下指令
sudo gedit /etc/default/grub
2.修改文件資料 多加 一行字 nomodeset 如下面
GRUBCMDLINELINUXDEFAULT=”quiet splash nomodeset”
3.儲存後重新讀取
sudo update-grub
4.將灌好的系統換到新的GPU開機看看,這時應該就沒有 out of range 的問題了
5.但進去後會發現 解析度不對,因為我們還沒安裝 Nvidia 驅動程式, 由於這塊GPU太新,所以用apt-get 會找不到符合的驅動,因此要從 ppa 下載
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-367
6.重新開機後 畫面呈現如下 應該就是好了
二.安裝cuda
到官網下載
小編選擇 cuda 8.0 安裝
下載好了後 執行
sudo sh cuda_8.0.27_linux.run
切記 不要再安裝顯卡驅動了 因為我們剛剛已經安裝過了
設置環境:
sudo gedit /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile
檢查path,有進去就對了
echo $PATH
檢查cuda 安裝成功與否:
到 sample 資料夾底下
cd /usr/local/cuda-8.0/samples
編譯
make -j
然後到資料夾中找到程式執行
cd /usr/local/cuda-8.0/samples/bin/x86_64/linux/release
執行程式
./deviceQuery
出現以下圖片代表成功
打 nvcc –version 確認是否如以下
三.安裝 cudnn
也是到官網下載,要註冊
解壓縮資料夾
tar -zxvf cudnn-8.0-linux-x64-v5.0-ga.tgz
裡面是一個cuda 資料夾 包含
複製裏面資料到 local/cuda 裏面
cd ../cuda/lib64
sudo cp ./* /usr/local/cuda/lib64/
cd ../cuda/include
sudo cp cudnn.h /usr/local/cuda/include/
更新他們的軟連結
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5
sudo ln -s libcudnn.so.5.0.5 libcudnn.so.5
sudo ln -s libcudnn.so.5 libcudnn.so
檢查cudnn 安裝成功與否:
到官網下載cudadnn sample
解壓縮
tar -zxvf cudnn-sample-v5.tgz
到目標資料夾
cd mnist CUDNN
編譯
make -j
執行
./mnistCUDNN
有可能會跑出下列錯誤
./mnistCUDNN: error while loading shared libraries: libcudart.so.8.0: cannot open shared object file: No such file or directory
解決方法:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
成功跑出範例:
之後就可以安裝 caffe 囉~~
可以參考我之前做的:caffe 無GPU 安裝
這裡主要的不同就只是 makefile.config 的設定不同
因為我們這裡有安裝GPU 和 cudnn 因此要把 use_cudnn 前面的 # 拿掉
接下來也是一樣的3個步驟:
make all
make test
make runtest
如果出現以下圖案 代表成功囉~~終於~~收工~~好累阿~
參考資料:
1.http://shamangary.logdown.com/posts/773013-install-torch7-cuda-cudnn-nvidia-driver
3.http://blog.csdn.net/xuezhisdc/article/details/48651003
請問你的Caffe和Tensorflow是安裝在同一環境嗎?
我先裝了Tensorflow, 再裝Caffe的話會不會衝突?
版主回覆:(09/14/2016 02:52:46 PM)
恩恩 都是安裝在ubuntu 14.04
應該不會
只是不能同時跑caffe 和 tensorflow而已
如果你用GPU跑的話
你好 想請問一下 為甚麼我在最後make all 的時候
他會出現錯誤
In file included from src/caffe/solvers/sgd_solver.cpp:5:0:
./include/caffe/util/hdf5.hpp:6:18: fatal error: hdf5.h: 沒有此一檔案或目錄
compilation terminated.
Makefile:575: recipe for target ‘.build_release/src/caffe/solvers/sgd_solver.o’ failed
make: *** [.build_release/src/caffe/solvers/sgd_solver.o] Error 1
抱歉 我也沒遇過這問題
我遇到問題時都是google看看有沒有人和我有同樣的問題
https://github.com/BVLC/caffe/issues/3530
這個人好像也出像和你一樣的error
貌似是要修改makefile檔吧? 我猜
請問一下如果我原本電腦就灌好caffe,現在想換更好的顯卡去跑,需不需要重灌新的linux
謝謝
版主回覆:(02/07/2017 10:06:43 AM)
不用,只需要重新安裝顯卡驅動就好了