Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Помогите пожалуйста установить CUDA 8.0  (Прочитано 3584 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн White_Shark

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Здравствуйте! Поставил Ubuntu чтобы реализовать одну идею на Theano+keras. Хочу, чтобы можно было юзать GPU для расчетов. Соответственно ставлю CUDA. Сталкиваюсь с проблемами. Вчера установил CUDA из .run - файла, как было написано в этих инструкциях:
http://techcave.ru/posts/63-ustanovka-cuda-7-5-na-ubuntu-16-04.html
и
https://www.pugetsystems.com/labs/hpc/NVIDIA-CUDA-with-Ubuntu-16-04-beta-on-a-laptop-if-you-just-cannot-wait-775/
Установил дрова для видеокарты, как написано здесь (разумеется, до установки CUDA)
http://vasilisc.com/ppa-proprietary-nvidia-gpu-driver
Всё вроде было нормально, за исключением некоторых проблем... libGLU.so, libX11.so, libXi.so, libXmu.so не находились, они были перенесены разработчиками Ubuntu в папку x86_64-linux-gnu/libGLU.so.1.3.1 и т.д. Исправилось тем, что сделал символьные ссылки туда из /usr/lib. После этого всё установилось, получилось скомпиллить примеры из simple, однако не все, некоторых бенчмарков не хватало. Сегодня утром я решил проверить как Theano подцепляет quda. Получилось, что не подцепляет. В общем, стал копать и наткнулся на то что команда
nvcc --versionработает и выдает всё как надо,
а вот команда
nvidia-smiвыдавала что-то не уже сейчас точно не помню что (просто уже всё по нескольку раз поменялось :) )
Короче нашел официальную инструкцию по установке CUDA из deb пакета.
http://developer.download.nvidia.com/compute/cuda/7.5/Prod/docs/sidebar/CUDA_Installation_Guide_Linux.pdf
удалил вчерашнюю версию установленную из .run и удалил символьные ссылки на libGLU.so, libX11.so, libXi.so, libXmu.so. Короче решил всё установить грамотно, просто насколько я понял .deb пакеты лучше чем .run.
В общем делаю
$ sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb
$ sudo apt-get update
$ sudo apt-get install cuda
и в конце установки получаю
......
......
Настраивается пакет cuda-demo-suite-8-0 (8.0.61-1) …
Настраивается пакет cuda-8-0 (8.0.61-1) …
Настраивается пакет cuda (8.0.61-1) …
Настраивается пакет libx11-doc (2:1.6.3-1ubuntu2) …
Обрабатываются триггеры для libc-bin (2.23-0ubuntu5) …
/sbin/ldconfig.real: /usr/lib/nvidia-375/libEGL.so.1 is not a symbolic link

/sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 is not a symbolic link

После этого проверяю
$ nvcc --version
Программа 'nvcc' на данный момент не установлена. Вы можете установить её, выполнив:
sudo apt install nvidia-cuda-toolkit
$ nvidia-smi
Failed to initialize NVML: Driver/library version mismatch

В общем, так понял, что ничего не поставилось :( Подскажите пожалуйста как поставить CUDA. Всё ставил на ноутбук
http://www.nix.ru/autocatalog/toshiba_notebook_rus/TOSHIBA-Qosmio-X70-A-K2S-i7-4700MQ-16-1TbSSHD-Blu-Ray-GTX770M-WiFi-BT-Win8-173-337-kg_161252.html
И ещё, у меня, насколько я понимаю, используется nvidia optimus, если это только хоть как-нибудь будет полезно.

Уже 2 дня настраиваю себе среду для того, чтобы начать учиться програть на Theano .... Уже хочется побыстрее Helloword написать :))) Подскажите новичку, пожалуйста.

PS А, ещё забыл сказать, что у меня Ubuntu 16.04 c оболочной Uniti
PPS Ещё хотел добавить, что нашел вроде бы похожую ситуацию здесь
https://forum.voidlinux.eu/t/ldconfig-usr-lib-libegl-so-1-is-not-a-symbolic-link/898
но так и не понял, что мне нужно сделать. Что снести одну из конфликтующих библиотек LibEGL (которая opensorce)? Но стрёмно как-то непонимаючи :)

Пользователь добавил сообщение 15 Февраля 2017, 21:43:30:
Пока ждал помощи успел наломать новых дров :)
Прочитал здесь
https://www.linux.org.ru/forum/general/13022434
что дело может быть в линках и это может зависеть от версии видео-дров. Решил поставить старые дрова и заново установить CUDA... В общем, сделал следующее
1) Снес неудачно установленную cuda и удалил лишние пакеты
$ sudo apt-get purge cuda
$ sudo apt-get autoremove
2) Поставил старую версию дров nvidia
$ sudo apt-get install nvidia-currentКстати, почему-то установка текущих дров сделал даунгрейд :) Снесла nvidia-375 и поставила вместо них nvidia-304 и ещё доставила xserver-xorg-legacy. При этом в процессе установки вылезла какая-то системная ошибка. Нажал отправить баг-репор там написано что-то типа:
Package:
nvidia-304 (not installed)
ProblemType:
Package
Title:
nvidia-304 304.135-0ubuntu0~gpu16.04.1:nvidia-304 kernel module failed to build
...
...
xserver.errors:
Faild to load module "nvidia" (module does not exist, 0)
Faild to load module "nvidia" (module does not exist, 0)
NOUVEAU(G0):[XvMC]Failed to initialize extension.
xserver.logfile
/var/log/Xorg.0.log
3) Заново установил cuda
$ sudo apt-get install cudaНа этот раз всё было ОК. Вроде бы. Причем, установились ещё более свежие дрова, чем у меня были. Поставились nvidia-375.39. Пробую
$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61
$ nvidia-smi
nvidia-smi: команда не найдена
nvidia-smi всё равно не работает.

ИТОГО получилось установить CUDA через deb пакет, но добавились ошибки про которые писал в пункте 2). А, и ещё nvidia-settings стали странно работать - не показывают никаких настроек.



РЕШЕНО!!!
Похоже, что решил проблему сам. Снес Ubuntu, поставил заново. Поставил deb пакет с CUDA на чистую систему. Однако, проблемы с "nvcc --version" и "nvidia-smi" повторились. Ситуацию спасло выполнение инструкции от NVIDIA до конца :) Добавил пути в переменные $PATH и $LD_LIBRARY_PATH и всё заработало :) Сейчас попробую ещё сделать "make" файлам-примерам в папке simple. Хотя думаю, что всё должно быть ОК.

Можно считать тему решённой.




« Последнее редактирование: 15 Февраля 2017, 23:57:42 от White_Shark »

 

Страница сгенерирована за 0.026 секунд. Запросов: 22.