-3
голосов
0ответы
18 просмотров

Параллельный запуск функции python на графическом процессоре Nvidia [закрыто]

У меня есть функция на Python, которая использует графический процессор Nvidia: Myfunction (Input) Я запускаю эту функцию для разных входов: Myfunction (Input1) Myfunction (Input2) Myfunction (Input3) Как я могу выполнять вышеуказанные вызовы ...
0
голосов
0ответы
18 просмотров

Градиенты Pytorch Gpu вычисляются неправильно

У меня есть модель, которая тренируется только на определенных машинах: Машина 1: только на CPU, сломана на GPU Машина 2: Работает на CPU и GPU Машина 3: только на CPU, сломана на GPU Машина 4: Работает на CPU и GPU ...
0
голосов
0ответы
10 просмотров

Остановить работу CuPy при выполнении условия?

Рассмотрим следующий код, который умножает две матрицы, заполненные только нулями и единицами: import cupy as cp import numpy as np A = cp.array (np.random.randint (2, size = (10000, 10000), dtype = 'uint8') )) B = cp ....
0
голосов
0ответы
16 просмотров

Как заставить процессор использовать CuPy?

Это немного странный вопрос, поскольку CuPy предназначен для GPU. Однако, в зависимости от ввода моей программы, я действительно хочу использовать ЦП, поскольку он быстрее. Я уже пробовал, если DISABLE_GPU: ...
0
голосов
0ответы
15 просмотров

Эффективное умножение диагонали (блока низкого ранга) на вектор в Pytorch (GPU)

У меня есть векторы v и w длины n и целочисленный вектор x длины n с k различными значениями от i_0 до i_ {k-1}. (Например, x = [0,0,3,6,6,0,5,3,3]). Мне нужен вектор y, где y [x == i_j] ...
0
голосов
0ответы
8 просмотров

Импорт dlib на Jetson NX получил недопустимую инструкцию (дамп ядра)

Версия JetPack: 4.6 Я пытаюсь использовать dlib (GPU) на Jetson Xavier NX, вот мои шаги по установке dlib dowload repo: https://github.com/davisking/dlib cd dlib-master mkdir build cd build / .. .
0
голосов
1отвечать
Просмотров: 22

Модель Keras на GPU: использование Pandas в настраиваемой функции потерь

Я пытаюсь определить следующую (игрушечную) функцию пользовательских потерь в Keras: def flexed_distance_loss (y_true, y_pred): y_true_df = pd.DataFrame (y_true, columns = my_columns) # сделать что-нибудь с ...
1
голосование
0ответы
9 просмотров

Что сообщает графическому процессору, где хранить результат операции рендеринга контекста определенного приложения?

Как следует из названия, мне любопытно, какая часть системы отвечает за то, чтобы графический процессор выводил рассчитанное изображение в правильный буфер кадра, чтобы диспетчер окон композитинга мог использовать ...
0
голосов
0ответы
12 просмотров

Почему, когда я запускаю модель TensorFlow, она использует только ЦП в качестве среды выполнения?

Когда я обучаю простую нейронную сеть и проверяю использование графического процессора, я заметил, что мои скрипты TensorFlow выполнялись в CPU. И это моя конфигурация: введите здесь описание изображения
0
голосов
0ответы
15 просмотров

Проблема с барьером перехода изображения SwapChain

Я пытаюсь написать Deferred Renderer в своем игровом движке с комбинацией типичного графического конвейера и вычислительного конвейера. Теоретически это довольно просто: ГРАФИЧЕСКИЙ ТРУБОПРОВОД: Рендеринг (запись) ...
0
голосов
0ответы
11 просмотров

MATLAB .exe отключает предупреждения. Для перемещения IMAGE_REL_AMD64_ADDR32NB требуется упорядоченный макет раздела.

Я унаследовал проект кодирования, который работает с машинным обучением в MATLAB. Когда код компилируется, он выдает странное предупреждение / ошибку, в которой говорится: «Для перемещения IMAGE_REL_AMD64_ADDR32NB требуется ...
0
голосов
1отвечать
23 просмотра

Свободная память графического процессора в Google Colab

Я хотел знать, есть ли способ освободить память графического процессора в Google Colab. Я тренирую несколько CNN в цикле с набором данных eurosat / rgb / из tf.datasets. Модели не такие большие, как и набор данных. ...
-3
голосов
0ответы
12 просмотров

как запустить вложенный цикл for в графическом процессоре с использованием языка Python?

Вложенный цикл for - это трудоемкие процессы обработки изображений. Есть ли способ эффективно использовать гнездо для цикла в графическом процессоре или процессоре, чтобы сократить время вычислений?
1
голосование
0ответы
18 просмотров

Как использовать Pytorch и Huggingface для постепенного выделения памяти GPU

Мой код Pytorch выделяет одинаковый объем памяти на каждом графическом процессоре. Это происходит, даже если память устройства не исчерпывается. Я могу контролировать размер пакета для каждого устройства, которое определяет память / устройство ...
0
голосов
0ответы
13 просмотров

Перезапуск графического процессора во время обучения CNN с использованием Tensoflow Keras Ubuntu 20.04

Я тренирую простую архитектуру CNN на 33874 обучающих и 9683 проверочных изображениях, принадлежащих 5 классам, в эпоху 6 перезагрузка компьютера, и мое обучение так и не завершилось. Архитектура CNN выглядит так: ...