Пользовательская функция потерь в Tensorflow для UNet

Question 1

Я работаю над задачей сегментации, где я планировал использовать U-Net

для входного изображения формы (224,224,3), выходом должна быть маска изображения формы (224,224,1)

Маска изображения содержит два уникальных значения – черный [0] и белый [1]

выходной слой из UNet имеет тензор формы (None, 224, 224, 1)

Я использовал функцию активации softmax для выходного слоя

Формы и типы для обучающих данных

print(trainX.shape) # (200, 224, 224, 3)
print(testX.shape) # (50, 224, 224, 3)
print(trainY.shape) # (200, 224, 224, 1)
print(testY.shape) # (50, 224, 224, 1)

print(trainX.dtype) # float64
print(testX.dtype) # float64
print(trainY.dtype) # int16
print(testY.dtype) # int16

В маске изображения черных пикселей гораздо больше, чем белых пикселей. Для балансировки черных и белых пикселей я планировал использовать веса классов [для черного - 0.53083749, для белого - 8.60701406] в обучении. Поэтому я написал эту функцию

def lossFunc(true, pred):
  weightsList = K.constant([0.53083749, 8.60701406])
  true = K.reshape(true, [-1])
  pred = K.squeeze(pred, axis=3)
  sample_weightsList = K.gather(weightsList, true)
  loss = keras.losses.sparse_categorical_crossentropy(true,pred)
  loss*sample_weightsList

  return loss

Но когда я начал обучение, я получил эту ошибку

InvalidArgumentError                      Traceback (most recent call last)
<timed exec> in <module>

/usr/local/lib/python3.10/dist-packages/keras/utils/traceback_utils.py in error_handler(*args, **kwargs)
     68             # Чтобы получить полный стек вызовов, вызовите:
     69             # `tf.debugging.disable_traceback_filtering()`
---> 70             raise e.with_traceback(filtered_tb) from None
     71         finally:
     72             del filtered_tb

/usr/local/lib/python3.10/dist-packages/tensorflow/python/eager/execute.py in quick_execute(op_name, num_outputs, inputs, attrs, ctx, name)
     50   try:
     51     ctx.ensure_initialized()
---> 52     tensors = pywrap_tfe.TFE_Py_Execute(ctx._handle, device_name, op_name,
     53                                         inputs, attrs, num_outputs)
     54   except core._NotOkStatusException as e:

InvalidArgumentError: Не зарегистрирован ни один OpKernel для поддержки Op 'GatherV2', используемого {{node lossFunc/GatherV2}} с этими атрибутами: [Tparams=DT_FLOAT, Tindices=DT_INT16, batch_dims=0, Taxis=DT_INT32]
Зарегистрированные устройства: [CPU, GPU]
Зарегистрированные ядра:
  device="XLA_CPU_JIT"; Taxis in [DT_INT32, DT_INT64]; Tindices in [DT_INT32, DT_INT16, DT_INT64]; Tparams in [DT_FLOAT, DT_DOUBLE, DT_INT32, DT_UINT8, DT_INT16, 930109355527764061, DT_HALF, DT_UINT32, DT_UINT64, DT_FLOAT8_E5M2, DT_FLOAT8_E4M3FN]
  device="XLA_GPU_JIT"; Taxis in [DT_INT32, DT_INT64]; Tindices in [DT_INT32, DT_INT16, DT_INT64]; Tparams in [DT_FLOAT, DT_DOUBLE, DT_INT32, DT_UINT8, DT_INT16, 930109355527764061, DT_HALF, DT_UINT32, DT_UINT64, DT_FLOAT8_E5M2, DT_FLOAT8_E4M3FN]
  device="CPU"; Tparams in [DT_QINT16]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_QINT16]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_QUINT16]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_QUINT16]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_QINT32]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_QINT32]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_QUINT8]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_QUINT8]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_QINT8]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_QINT8]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_VARIANT]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_VARIANT]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_RESOURCE]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_RESOURCE]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_STRING]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_STRING]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_BOOL]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_BOOL]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_COMPLEX128]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_COMPLEX128]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_COMPLEX64]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_COMPLEX64]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_DOUBLE]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_DOUBLE]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_FLOAT]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_FLOAT]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_BFLOAT16]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_BFLOAT16]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_HALF]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_HALF]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_INT32]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_INT32]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_INT8]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_INT8]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_UINT8]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_UINT8]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_INT16]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_INT16]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_UINT16]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_UINT16]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_UINT32]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_UINT32]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_INT64]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_INT64]; Tindices in [DT_INT32]
  device="CPU"; Tparams in [DT_UINT64]; Tindices in [DT_INT64]
  device="CPU"; Tparams in [DT_UINT64]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_BOOL]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_BOOL]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_COMPLEX128]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_COMPLEX128]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_COMPLEX64]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_COMPLEX64]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_DOUBLE]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_DOUBLE]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_FLOAT]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_FLOAT]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_BFLOAT16]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_BFLOAT16]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_HALF]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_HALF]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_INT64]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_INT64]; Tindices in [DT_INT32]
  device="GPU"; Tparams in [DT_INT32]; Tindices in [DT_INT64]
  device="GPU"; Tparams in [DT_INT32]; Tindices in [DT_INT32]

     [[lossFunc/GatherV2]] [Op:__inference_train_function_6870]

В чем проблема и как это решить

Спасибо

Question 2

Согласно документации, функция gather требует индексы int32 или int64, в то время как вы, похоже, предоставляете int16. В основном попробуйте привести их к int32:

def lossFunc(true, pred):
  weightsList = K.constant([0.53083749, 8.60701406])
  true = K.cast(K.reshape(true, [-1]), "int32")  # или tf.cast(..., tf.int32)
  pred = K.squeeze(pred, axis=3)
  sample_weightsList = K.gather(weightsList, true)
  loss = keras.losses.sparse_categorical_crossentropy(true,pred)
  loss*sample_weightsList

  return loss

Пользовательская функция потерь в Tensorflow для UNet

Вопрос или проблема

Ответ или решение

Ошибка, возникающая в вашем коде

Как исправить ошибку

Объяснение кода

Проверка модели

Заметки по улучшению