【625】keras.utils.Sequence 制作生成集

tensorflow.keras.utils.Sequence的使用

keras 官网 - Sequence

Unet Xception Keras for Pneumothorax Segmentation

  用于拟合数据序列的基对象,例如一个数据集。

  每一个 Sequence 必须实现 __getitem__ 和 __len__ 方法。 如果你想在迭代之间修改你的数据集,你可以实现 on_epoch_end。 __getitem__ 方法应该范围一个完整的批次。

  例子

from skimage.io import imread
from skimage.transform import resize
import numpy as np

# 这里,`x_set` 是图像的路径列表
# 以及 `y_set` 是对应的类别

class DataGenerator(Sequence):

    # 初始化类
    def __init__(self, x_set, y_set, batch_size):
        self.x, self.y = x_set, y_set
        self.batch_size = batch_size

    # 返回batch_size的个数,也就是完整跑一遍数据要运行模型多少次
    def __len__(self):
        return int(np.ceil(len(self.x) / float(self.batch_size)))

    # 返回一个batch_size的数据 (data, label)
    # 直接输入到模型的形式
    # input: (2, 512, 512, 3)
    # label: (2, 512, 512, 1)
    def __getitem__(self, idx):
        batch_x = self.x[idx * self.batch_size:(idx + 1) * self.batch_size]
        batch_y = self.y[idx * self.batch_size:(idx + 1) * self.batch_size]

        # 获取一个批次的全部数据,并构建为x_arr
        x_arr = []
        for file_name in batch_x:
            img = resize(imread(file_name), (200, 200))
            x_arr.append(np.array(img))

        x = np.array(x_arr)
        y = np.array(batch_y)

        return x, y 
原文地址:https://www.cnblogs.com/alex-bn-lee/p/15071507.html