Обучение модели Inception V3 с использованием Keras с бэкендом Tensorflow

Question 1

В настоящее время я обучаю несколько пользовательских моделей, которые требуют примерно 12 ГБ видеопамяти в лучшем случае. В моей системе около 96 ГБ видеопамяти, и Python/Jupyter все равно умудряется забивать всю видеопамять до такой степени, что я получаю ошибку “Исключение ресурса”. Я уже несколько времени сталкиваюсь с этой странной проблемой, и поэтому буду признателен за любую помощь.

Теперь, когда я загружаю модель на основе VGG, похожую на эту:

from keras.applications.vgg16 import VGG16
from keras.models import Model

import keras

from keras.models import Model, Sequential
from keras.models import Input
input_shape = (512, 512, 3)
base_model = VGG16(input_shape=input_shape, weights=None, include_top=False)

pixel_branch = base_model.output
pixel_branch = Flatten()(pixel_branch)

new_model = Model(inputs=base_model.input, outputs=pixel_branch)

text_branch = Sequential()
text_branch.add(Dense(32, input_shape=(1,), activation='relu'))

# merged = Merge([new_model, text_branch], mode="concat")
merged = keras.layers.concatenate([new_model.output, text_branch.output])

age = Dense(1000, activation='relu')(merged)
age = Dense(1000, activation='relu')(age)
age = Dense(1)(age)

# show model
# model.summary()
model = Model(inputs=[base_model.input, text_branch.input], outputs=age)

Когда я просто запускаю ячейку jupyter с этим кодом и мониторю использование GPU с помощью nvidia-smi, оно составляет 0%. Однако, если я заменяю код в вышеназванной ячейке Jupyter на следующий:

from keras.applications.inception_v3 import InceptionV3
from keras.models import Model
import keras
from keras.models import Model
from keras.models import Sequential

from keras.models import Input
input_shape = (512, 512, 3)
base_model = InceptionV3(input_shape=input_shape, weights=None, include_top=False)

pixel_branch = base_model.output
pixel_branch = Flatten()(pixel_branch)

new_model = Model(inputs=base_model.input, outputs=pixel_branch)

text_branch = Sequential()
text_branch.add(Dense(32, input_shape=(1,), activation='relu'))

# merged = Merge([new_model, text_branch], mode="concat")
merged = keras.layers.concatenate([new_model.output, text_branch.output])

age = Dense(1000, activation='relu')(merged)
age = Dense(1000, activation='relu')(age)
age = Dense(1)(age)

# show model
# model.summary()
model = Model(inputs=[base_model.input, text_branch.input], outputs=age)

Использование GPU начинает зашкаливать, и внезапно почти вся память занята на всех GPU, даже до того, как я выполню model.compile() или model.fit() в Keras!

Я также пробовал как allow_growth, так и per_process_gpu_memory_fraction в TensorFlow. Я все равно получаю ошибку исчерпания ресурсов в момент, когда запускаю model.fit, используя модель на основе Inception. Пожалуйста, обратите внимание, что я не думаю, что это ошибка памяти GPU, так как у меня около 96 ГБ видеопамяти на экземпляре с 8 Tesla K80.

Также имейте в виду, что мой размер пакета составляет 2.

Question 2

Похоже, ваша проблема связана с вашей аппаратной конфигурацией.

Мне удалось выполнить следующий код на Google Colab, используя GPU, без каких-либо проблем:

import keras
from keras.applications.inception_v3 import InceptionV3
from keras.layers import Dense, Flatten
from keras.models import Model, Sequential, Input

input_shape = (512, 512, 3)
base_model = InceptionV3(input_shape=input_shape, weights=None, include_top=False)

pixel_branch = base_model.output
pixel_branch = Flatten()(pixel_branch)

new_model = Model(inputs=base_model.input, outputs=pixel_branch)

text_branch = Sequential()
text_branch.add(Dense(32, input_shape=(1,), activation='relu'))

# merged = Merge([new_model, text_branch], mode="concat")
merged = keras.layers.concatenate([new_model.output, text_branch.output])

age = Dense(1000, activation='relu')(merged)
age = Dense(1000, activation='relu')(age)
age = Dense(1)(age)

# show model
# model.summary()
model = Model(inputs=[base_model.input, text_branch.input], outputs=age)

Обучение модели Inception V3 с использованием Keras с бэкендом Tensorflow

Вопрос или проблема

Ответ или решение

Обучение модели Inception V3 с использованием Keras и TensorFlow: Решение проблемы с исчерпанием ресурсов GPU

Введение

Проблема

Подходы к решению

Пример кода

Заключение