用于拟合数据序列的基对象,例如一个数据集。
每一个 Sequence
必须实现 __getitem__
和 __len__
方法。 如果你想在迭代之间修改你的数据集,你可以实现 on_epoch_end
。 __getitem__
方法应该范围一个完整的批次。
例子
from skimage.io import imread from skimage.transform import resize import numpy as np # 这里,`x_set` 是图像的路径列表 # 以及 `y_set` 是对应的类别 class DataGenerator(Sequence): # 初始化类 def __init__(self, x_set, y_set, batch_size): self.x, self.y = x_set, y_set self.batch_size = batch_size # 返回batch_size的个数,也就是完整跑一遍数据要运行模型多少次 def __len__(self): return int(np.ceil(len(self.x) / float(self.batch_size))) # 返回一个batch_size的数据 (data, label) # 直接输入到模型的形式 # input: (2, 512, 512, 3) # label: (2, 512, 512, 1) def __getitem__(self, idx): batch_x = self.x[idx * self.batch_size:(idx + 1) * self.batch_size] batch_y = self.y[idx * self.batch_size:(idx + 1) * self.batch_size] # 获取一个批次的全部数据,并构建为x_arr x_arr = [] for file_name in batch_x: img = resize(imread(file_name), (200, 200)) x_arr.append(np.array(img)) x = np.array(x_arr) y = np.array(batch_y) return x, y