Драйвер cuda не найден

Обновлено: 07.07.2024

]$ vblank_mode=0 primusrun blender
ATTENTION: default value of option vblank_mode overridden by environment.
ATTENTION: default value of option vblank_mode overridden by environment.
Read new prefs: /home/fossa/.config/blender/2.72/config/userpref.blend
ATTENTION: default value of option vblank_mode overridden by environment.
ATTENTION: default value of option vblank_mode overridden by environment.
ATTENTION: default value of option vblank_mode overridden by environment.
ATTENTION: default value of option vblank_mode overridden by environment.
CUDA cuInit: Unknown error

Сходу не скажу, надо будет посмотреть. Модуля этого у нас, действительно, нет.

А в R3 что выдает 'vblank_mode=0 primusrun blender' ?

И ещё - 'modinfo nvidia-uvm' (тоже в R3)?

modinfo nvidia-uvm' (тоже в R3) --- modinfo : ERROR : Module nvidia-uvm not found.
vblank_mode=0 primusrun blender R3 --- то же что и в R4, только не говорит про CUDA или nvidia.
Драйвера в R3 были 331. в R4 - 340.

Ясно. Спасибо за информацию.

Я скоро буду готовить обновление для драйверов nvidia340, посмотрю заодно, почему там nvidia-uvm не собирается. Судя по тому, что ребята из NVidia пишут, в версии 331.20 он появился.

Попробуйте, пожалуйста, вот что.
Отредактируйте /var/lib/dkms/nvidia340/340.24-5/source/dkms.conf (под root) так, чтобы в этом файле было следующее:

Старое содержимое dkms.conf перед этим можно удалить.

Затем выполните, тоже под root, такие команды:

Что они выводят?

Если всё прошло хорошо, модуль должен собраться и стать видимым для системы. Проверьте, что он есть, вызвав 'modinfo nvidia-uvm'.

Теперь можно попробовать ещё раз запустить blender. Посмотрим, как сейчас пойдёт.

Fossa писал(а): Модуль собрался. определяется. <. > Спасибо огромное! проблема решена.

В следующем обновлении пакетов с драйверами NVidia я эти изменения в dkms.conf тоже добавлю, чтобы не нужно было с ним вручную возиться.

Fossa писал(а): Модуль собрался. определяется. <. > Спасибо огромное! проблема решена.

В следующем обновлении пакетов с драйверами NVidia я эти изменения в dkms.conf тоже добавлю, чтобы не нужно было с ним вручную возиться.

Добрый день! Хотелось бы узнать - решили ли проблему по установке Bumblebee на ноуты с гибридной графикой Nvidia+Intel? Сейчас тестирую Rosa R4 на виртуалке по причине того,что на R3 плясал с бубном,пока установил драйвера правильно. aboguckiy писал(а): Добрый день! Хотелось бы узнать - решили ли проблему по установке Bumblebee на ноуты с гибридной графикой Nvidia+Intel? Сейчас тестирую Rosa R4 на виртуалке по причине того,что на R3 плясал с бубном,пока установил драйвера правильно.

Я подготовил обновление для драйверов NVidia до версии 340.46. Исправил там и проблему с nvidia_uvm заодно. Сейчас наши ребята из команды QA всё проверяют. Если хотите, можете тоже поставить это обновление и проверить, что nvidia_uvm сейчас собирается автоматически, посмотреть, всё ли при этом работает.

Установить проще всего так: подключить соотв. репозиторий и выполнить обновление:

Все установилось, все работает. но CUDA работают только если запустить карту от root (в дальнейшем она отключается с помощью rmmod nvidia_uvm && systemctl restart bumblebeed.service)

Вероятно, это из-за того, что нужно загружать модуль nvidia-uvm, а права на загрузку модулей ядра имеет только root. Если бы не Optimus, можно было бы просто nvidia_uvm в автозагрузку прописать, но тут это не пройдёт: nvidia_uvm без модуля nvidia340 не загрузится, а тот тоже загружается только спец. образом, когда он нужен.

Вроде можно было с помощью /etc/modprobe.d/*.conf сделать, чтобы если грузится nvidia, грузился и nvidia_uvm заодно. Надо вспомнить, как это делается.

euspectre писал(а): Вроде можно было с помощью /etc/modprobe.d/*.conf сделать, чтобы если грузится nvidia, грузился и nvidia_uvm заодно. Надо вспомнить, как это делается. VictorR2007 писал(а): Я попробовал записать так в modprobe.conf

Этот вариант - deprecated, если не ошибаюсь: modprobe может игнорировать /etc/modprobe.conf. Плюс, как modprobe его читает (если читает) - это вопрос.

Надёжнее так сделать: создать файл /etc/modprobe.d/nvidia_uvm.conf (под root) и вписать туда следующее:

На всякий случай можно перезагрузить систему и проверить, будет ли теперь nvidia_uvm грузиться автоматически при загрузке модуля nvidia340.

Если что, lsmod показывает, какие модули сейчас загружены.

softdep nvidia340 post: nvidia_uvm . Модуль грузится только от root. Fossa писал(а): softdep nvidia340 post: nvidia_uvm . Модуль грузится только от root. Он и будет грузиться от root. Надо проверить, загрузится ли он автоматически вместе с модулем nvidia340 (он же - nvidia). Bumblebee грузит же модуль nvidia от имени root, а теперь, по идее, должен загрузить обоих.

]$ lsmod | grep nvidia
nvidia 10548666 37
drm 302256 10 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

]$ lsmod | grep nvidia
nvidia_uvm 35066 2
nvidia 10548666 46 nvidia_uvm
drm 302256 11 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

c primusrun получше рендер. c optirun не все работает.

]$ lsmod | grep nvidia
nvidia 10548666 37
drm 302256 10 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

]$ lsmod | grep nvidia
nvidia_uvm 35066 2
nvidia 10548666 46 nvidia_uvm
drm 302256 11 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

Не видно от рута.
В обоих сполерах знак $ от пользователя [fossa@Nout-V

]$ lsmod | grep nvidia
У меня от пользователя, при записи softdep nvidia340 post: nvidia_uvm выдает

]$ lsmod | grep nvidia
nvidia_uvm 35066 2
nvidia 10548666 46 nvidia_uvm
drm 302256 11 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

]$ vblank_mode=0 primusrun blender

]$ lsmod | grep nvidia
nvidia 10548666 37
drm 302256 10 ttm,i915,drm_kms_helper,nvidia
i2c_core 40643 7 drm,i915,i2c_i801,drm_kms_helper,i2c_algo_bit,nvidia,videodev

lsmod и от обычного пользователя запускать можно. Но почему nvidia_uvm не грузится автоматически - пока идей нет. Разве что, его не с помощью modprobe загружают, а insmod'ом, например. Да, пока неясно, как быть. Господа, так cuda в блендере починили или нет?
Просто у меня Blender 2.74 не хочет переключаться на GPU (в вариантах только CPU) Vochatrak писал(а): Господа, так cuda в блендере починили или нет? Раз используется только дискретная видеокарта, всё проще. Загрузите модуль nvidia_uvm явно (автоматически он, похоже, не загружается), под root:
Затем запустите Blender и проверьте. Если заработает теперь, можно будет модуль и в автозагрузку добавить. Блендер все равно не видит cuda.
modprobe nvidia_uvm euspectre писал(а): lsmod и от обычного пользователя запускать можно. Но почему nvidia_uvm не грузится автоматически - пока идей нет. Разве что, его не с помощью modprobe загружают, а insmod'ом, например. Да, пока неясно, как быть. Вот поставился пакет автоматом: x11-driver-video-nvidia346 и остальные.
Смотрю: rpm -qa x11-driver-video-nvidia346
И не нахожу файлов:

Вроде всё на месте. Странно. Если есть возможность получить лог работы Blender, может, там какая-то информация будет. Запустить Blender из консоли с какими-нибудь опциями для этого? Не знаю, как именно, т.к. в самом Blender не разбираюсь.


Что происходит после настройки GCP Computing Instance? Запуск пользовательского контейнера Docker с Tensorflow

Введение

Позвольте мне рассказать вам немного о машине, которую я имел,

  • Ubuntu: 16.04
  • GPU: 1 х P100
  • CUDA: 9,1
  • NVIDIA: 387.xx

Но что-то действительно странное случилось со мной, когда я запустил свой экземпляр GCP и попытался запустить докер-контейнер вчера, используя

Нет, это не сработало так, как я хотел, и забрало меня в контейнер. Вместо этого он дал мне следующую ошибку

Хорошо, прежде чем углубляться в детали поиска и устранения неисправностей, позвольте мне кратко изложить, что я собираюсь сделать.

Прежде всего, прежде чем проверять, правильно ли установлены библиотеки, посмотрите, видит ли ваша машина физический GPU, набрав:

Это должно дать что-то вроде

В противном случае это может быть связано с отключением графического процессора или просто выталкиванием из гнезда, потому что вы переместили машину или что-то еще.

Первое, что нужно сделать, этоНЕделать поспешные выводы и строго набирать текст sudo apt-get install <this-and-that> надеюсь на лучшее! На самом деле, лучшая вещь в такой ситуации (и в большинстве случаев игнорируется) состоит в том, чтобы определить, в чем проблема. Сначала давайте посмотрим, что у нас есть. Давай и печатай,

В идеале вы должны получить что-то вроде

Если вы получите что-то вроде,

Это может быть связано с двумя причинами,

  • Вы не вошли в систему как root, поэтому NVIDIA не может общаться (Решение:введите sudo -s войти в систему как root и затем попробовать nvidia-smi опять таки)
  • На самом деле у вас не установлены совместимые драйверы NVIDIA (или конфигурация не работает) (Решение требует больше работы, И это тип вопроса, который я обсуждаю здесь)

Поэтому, чтобы NVIDIA-SMI работала правильно, вам нужно несколько вещей для правильной настройки. Они есть,

  • CUDA (включает в себя , куда-блас- , cuda-nvcc- , cuda-toolkit- , так далее.)
  • Библиотеки NVIDIA (Включает в себя NVIDIA- , nvidia-docker, nvidia-modprobe, nvidia-settings и т. д.)

Давайте проверим, установлены ли они, попробуйте набрать

Вы должны получить


это должно дать


Обратите внимание, что фактический список гораздо длиннее. Но если получить довольно много хитов для CUDA, все должно быть в порядке. Но не становитесь слишком удобными! Я сталкивался с вещами, которые не работали даже с этими установленными.

Давайте еще раз проверим, правильно ли загружаются модули ядра NVIDIA,

В идеале вы должны увидеть,

Если вы ничего не видите, это проблематично! Это означает, что драйверы NVIDIA не были загружены должным образом.

Затем выйдите из текстового редактора и запустите

Перезагрузите машину и посмотрите, все ли работает нормально, попробовав nvidia-smi опять таки. (PS: не забудьте попробовать с sudo привилегии)

Если вы читаете эту часть, вам не повезло, как некоторым из людей там. Хорошо, давайте идти вперед и трудиться на земле! По моему мнению, больше не стоит копать глубже и пытаться найти единственное зерно ошибки в чаше, полной библиотек На самом деле, было бы намного проще, если бы мы удалили текущие поврежденные библиотеки и установили вещи с нуля.

Сначала мы должны выяснить, что и с чем. Под этим я подразумеваю, что мы должны убедиться, что мы загружаем определенные (и правильные) версии драйверов CUDA и NVIDIA, соответствующие вашей графической карте. Итак, давайте продолжим и узнаем, что является последним.

Загрузите драйверы для продуктов NVIDIA, включая видеокарты GeForce, материнские платы nForce, рабочие станции Quadro и…

И введите подробности о,

  • Графическая карта: у меня NVIDIA Tesla P100
  • CUDA: поехали с 9.x

Вот результаты, которые я получил,


Теперь мы будем придерживаться этих конкретных версий при установке, чтобы избежать любых расхождений.

Сначала давайте удалим все существующие библиотеки CUDA / NVIDIA с помощью

Сначала получите инструментарий CUDA .deb с,

Перезагрузите систему и попробуйте,

и вы должны увидеть правильный вывод, как показано на рисунке 2 и рисунке 3.

Я только что понял драйвер NVIDIA387.xxкоторый поставляется с CUDA 9.1, не работает для моего NVIDIA Tesla P100. Поэтому мне пришлось сначала удалить его и установить NVIDIA384.xx, Это может отличаться для вас в зависимости от карты GPU, которая у вас есть в вашем экземпляре.

Вы знаете, что странно! Я прекрасно работал с CUDA 9.1 и NVIDIA 387.xx, как показано на рисунке 1. Но теперь NVIDIA 387.xx больше не был совместим с CUDA 9.1. Я не уверен, почему, но, надеюсь, смогу докопаться до сути!

Давайте сделаем это,

Теперь давайте установим драйвер NVIDIA 384.xx вручную,

Тебе понадобится nvidia-modprobe для nvidia-docker , Теперь сделайте быструю проверку переменных пути, чтобы увидеть, правильно ли они установлены

Сейчас попробуй nvidia-smi и вы должны увидеть нечто похожее на рисунок 1, означающее, что все вернулось к норме (надеюсь!).

Еще одна вещь, не забывайте, с чего все это началось. Это были автоматические обновления. Обновления важны для защиты вашей машины от внешних угроз и всего остального, но если она будет ломать мою машину каждые 5 секунд, которые я обновляю, НЕТ, СПАСИБО! Я сам обновлю его вручную. Чтобы сделать это, откройте следующий файл в текстовом редакторе,

Это должно остановить эти «надоедливые» (но важные) автоматические обновления. Но не забывайте регулярно обновлять свою ОС, потому что вы не хотите, чтобы кто-то взломал вашу машину.


Итак, в этом посте мы обсудили, как устранить неполадки в экземпляре GCP, если у вас возникнут проблемы с поврежденной конфигурацией, отсутствующими драйверами и т. Д. И процесс, который я рекомендую, -

Для TensorFlow я хотел бы установить CUDA. Как это сделать на Ubuntu 16.04?

Установить CUDA для Ubuntu

Существует руководство по установке Linux. Тем не менее, это в основном только те шаги:

Примечания: Да, есть возможность установить это через apt-get install cuda. Я настоятельно рекомендую не использовать его, поскольку он изменяет пути и затрудняет установку других инструментов.

Вас также может заинтересовать Как установить CuDNN на Ubuntu 16.04?. [! ​​D25]

*: Не устанавливайте драйверы дисплея с помощью этого скрипта. Они старые. Загрузите последние из Как установить CuDNN на Ubuntu 16.04?

Проверить установку CUDA

Следующая команда показывает текущую версию CUDA (последняя строка) :

$ nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2016 NVIDIA Corporation Built on Sun_Sep__4_22:14:01_CDT_2016 Cuda compilation tools, release 8.0, V8.0.44

Следующая команда показывает версию вашего драйвера и количество памяти GPU:

См. также: Проверка установки CuDNN

Справка ! Новый драйвер не работает!

Не паникуйте. Даже если вы ничего не видите на своем компьютере, следующие шаги должны вернуть вас в состояние до:

Графические драйверы

Установка графических драйверов немного сложна. Это необходимо сделать без поддержки графики.

Установить CUDA для Ubuntu

Существует руководство по установке Linux. Тем не менее, это в основном только те шаги:

Примечания: Да, есть возможность установить это через apt-get install cuda. Я настоятельно рекомендую не использовать его, поскольку он изменяет пути и затрудняет установку других инструментов.

Вас также может заинтересовать Как установить CuDNN на Ubuntu 16.04?. [! ​​D25]

*: Не устанавливайте драйверы дисплея с помощью этого скрипта. Они старые. Загрузите последние из Как установить CuDNN на Ubuntu 16.04?

Проверить установку CUDA

Следующая команда показывает текущую версию CUDA (последняя строка) :

$ nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2016 NVIDIA Corporation Built on Sun_Sep__4_22:14:01_CDT_2016 Cuda compilation tools, release 8.0, V8.0.44

Следующая команда показывает версию вашего драйвера и количество памяти GPU:

См. также: Проверка установки CuDNN

Справка ! Новый драйвер не работает!

Не паникуйте. Даже если вы ничего не видите на своем компьютере, следующие шаги должны вернуть вас в состояние до:

Графические драйверы

Установка графических драйверов немного сложна. Это необходимо сделать без поддержки графики.

Это ответ на looooong, так как я несколько раз вворачивал свой ноутбук во время написания. Тем не менее, я предпочитаю держать это долго, так как это может быть полезно для других людей тоже;) Большая часть моего ответа начинается с Edited-updated

Sooooo, я прочитал все ответы здесь и в других местах, я не знайте почему, но каждый из них вызывает у меня проблему: (

Через 4 дня повторная установка Linux назад и вперед здесь - это способ, который работал для меня.

Прежде чем перейти к Основная процедура Я хочу упомянуть альтернативный метод.

Edited-updated

Таким образом, вы можете переключаться между nvidia и вашим intel gpu на свой ноутбук, используя

sudo prime-select intel sudo prime-select nvidia

Другими словами, вы можете переключиться на intel и установить nvidia и переключиться обратно в Intel для нормального использования и всякий раз, когда вы хотите использовать глубокий обучающий переход к nvidia one.

позвольте мне рассказать о главном методе, который, наконец, работает для меня (информация здесь в основном захвачена ссылкой):

В любом случае,

sudo apt-get remove --purge nvidia-* sudo apt-get purge nvidia-cuda* sudo apt-get purge nvidia-* sudo /usr/bin/nvidia-uninstall sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl sudo rm -rf /etc/modprobe.d/blacklist-nouveau.conf

Затем мы просто обновляем все:

sudo apt-get update sudo apt-get upgrade sudo apt-get dist-upgrade sudo reboot

Теперь будет возможность вы не можете войти в систему, и вы застряли в цикле .

Не беспокойтесь, я столкнулся с этим более чем в 50 раз .

нажмите ctr+alt+F2 введите свое имя пользователя и password

теперь введите эти:

sudo service lightdm stop

Дополнительно, некоторые люди также должны ввести это, честно говоря, что это такое: sudo init 3

sudo nano /etc/modprobe.d/blacklist-nouveau.conf

blacklist nouveau options nouveau modeset=0

к нему и сохранить его и выйти.

sudo update-initramfs -u

Sooo, если вам повезет, вы должны войти в систему сейчас. Как вы можете догадаться, мне не повезло, и я все еще не мог войти в систему. Поэтому мне пришлось снова нажать ctr+Alt+F2 и сделать следующее:

sudo ubuntu-drivers autoinstall sudo reboot

Теперь я могу войти в систему наконец.

Теперь настало время установить пути и проверить установки .

export PATH=/usr/local/cuda-8.0/bin$> export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64 $> nvidia-smi nvcc -V

он должен показать вам, что у вас есть cuda 8.

Также на всякий случай вы также можете сделать это:

export PATH=$PATH:/usr/local/cuda-8.0/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64 gedit

добавить их в конец:

/bin:$PATH export PATH

Сохранить и выйти из gedit. Тип:

sudo ldconfig /usr/local/cuda-8.0/lib64

Вопрос для людей, которые знают больше, чем я:

Итак, все звучит как работа, но когда я закрою / перезагружу свою систему на несколько секунд, ! d35]

Угадайте, я снова ввернул.

Но на этот раз я пришел с гораздо более легким соусом. и вот главный момент: иногда нам нужно сказать НЕТ

Вот что действительно работает для меня. после того, как вы очистите и удалите все и перезагрузите sudo, выполните следующее:

sudo ubuntu-drivers autoinstall sudo reboot

нажмите ctr+alt+F2 введите свое имя пользователя и пароль

теперь введите их:

Иногда во время установки нам нужно указать NO , первый вопрос требует повторной установки драйвера снова, НЕ СКАЖИТЕ НЕТ этой матери f **** вопрос Скажите «да» остальным из них: D после окончания.

sudo service lightdm start press `alt+ctr+F7`

регистрация на ваш дорогой PC

. Работало? Ваше приветствие:)

Сначала я попытался сделать это sudo lightdm stop, но это привело к циклу входа. Итак, я нашел новый метод:

/ .bashrc и запустите source

/.bashrc, чтобы сделать путь постоянным, чтобы после перезагрузки он не исчез, подтвердите его, закрыв текущий терминал и запустив вторую команду в шаг 12 снова в другом терминале. См. «Перейти к 7. Действия после установки». Чтобы проверить, правильно ли установлен CUDA или не выполняются обе указанные ниже команды, и проверьте, выдают ли nvcc -V выходные данные или нет cat /proc/driver/nvidia/version nvcc -V Перейдите к

/NVIDIA_CUDA-9.0_Samples/1_Utilities/deviceQuery, затем выполните следующие действия: make ./deviceQuery и сопоставить выходные данные с этим изображением, может отличаться, но формат вывода должен совпадать. Поздравляем, что вы успешно установили CUDA Toolkit. После этого перейдите сюда и попробуйте несколько примеров. Перейдите к 7.2 Рекомендуемые действия.

Все проги, использующие сабж, падают с ошибкой unknown error.

Запускаю один из примеров:

На более старых дровах (396.24) ошибка не проявляется.



Пробовал как тут написано?


Ребут? Конечно пробовал.


nvidia_uvm модуль есть:

Однако девайса /dev/nvidia-uvm нет.

Есть какой то не костыльный способ создавать его при загрузке (Gentoo OpenRC)?


Если создать девайс вручную

Проблема остается прежней: unknown error.

И на карточках Titan XP новые драйвера не работают для Cuda 9.2, потому использую 396.24 PS. А чем 396.54 лучше 396.24 - тем, что с Cuda 9.2 не работают ?


Собственно, я не обновлял 396.24, до тех пор, пока их не удалили из репы генты.

Вроде куды нужен включеный в ядре numa, если он самосбор.


На старых дровах то все работало, несмотря на

А на новых стало нужно, вроде как.

Это они опрометчиво сделали, но мне все равно, я использую копию рабочего ебилда 396.24 перепиленный на свое усмотрение.

PS. 37 и 51 не смотрите, они тоже не взлетают с моими карточками на CUDA, но при этом как видеодрайвер работают отлично, ровно как и 54. Если захотите использовать мой вариант 24го, то не забудьте забрать и каталог files.

А clinfo что выдает на 54м драйвере у Вас? У меня он не находит устройств на 37,51 и 54 - 0, при этом на 24м находит и на 24м все работает, в том числе и CUDA. Напомню, у меня Titan Xp карточки.

Deleted ( 09.09.18 19:39:57 )
Последнее исправление: Deleted 09.09.18 19:48:51 (всего исправлений: 3)


Собрал ядро с CONFIG_NUMA=y и CONFIG_CPUSETS=y. CUDA работает на последних драйверах.

Читайте также: