Python keras.preprocessing.image 模块，ImageDataGenerator() 实例源码

我们从Python开源项目中，提取了以下50个代码示例，用于说明如何使用keras.preprocessing.image.ImageDataGenerator()。

项目：Digit-Classifier 作者：ardamavi | 项目源码 | 文件源码

def train_model(model, X, X_test, Y, Y_test):

    batch_size = 100
    epochs = 2

    checkpoints = []
    if not os.path.exists('Data/Checkpoints/'):
        os.makedirs('Data/Checkpoints/')
    checkpoints.append(ModelCheckpoint('Data/Checkpoints/best_weights.h5', monitor='val_loss', verbose=0, save_best_only=True, save_weights_only=True, mode='auto', period=1))
    checkpoints.append(TensorBoard(log_dir='Data/Checkpoints/./logs', histogram_freq=0, write_graph=True, write_images=False, embeddings_freq=0, embeddings_layer_names=None, embeddings_metadata=None))

    # Creates live data:
    # For better yield. The duration of the training is extended.

    # If you don't want, use this:
    # model.fit(X, Y, batch_size=batch_size, epochs=epochs, validation_data=(X_test, Y_test), shuffle=True, callbacks=checkpoints)

    generated_data = ImageDataGenerator(featurewise_center=False, samplewise_center=False, featurewise_std_normalization=False, samplewise_std_normalization=False, zca_whitening=False, rotation_range=0,  width_shift_range=0.1, height_shift_range=0.1, horizontal_flip = True, vertical_flip = False)
    generated_data.fit(X)

    model.fit_generator(generated_data.flow(X, Y, batch_size=batch_size), steps_per_epoch=X.shape[0]/6, epochs=epochs, validation_data=(X_test, Y_test), callbacks=checkpoints)

    return model

项目：geom_rcnn 作者：asbroad | 项目源码 | 文件源码

def data_augmentation(self):
        if self.verbose:
            print 'enhancing training set with data augmentation... '
            start_time = time.time()

        self.datagen = ImageDataGenerator(
            rotation_range=20,
            width_shift_range=0.3,
            height_shift_range=0.3,
            shear_range=0.2,
            fill_mode='nearest',
            horizontal_flip=True,
            vertical_flip=True
            )
        self.datagen.fit(self.xs_train)

        if self.verbose:
            end_time = time.time()
            self.print_time(start_time,end_time,'data augmentation')

项目：geom_rcnn 作者：asbroad | 项目源码 | 文件源码

def data_augmentation(self):
        if self.verbose:
            print 'enhancing training set with data augmentation... '
            start_time = time.time()

        self.datagen = ImageDataGenerator(
            rotation_range=30,
            width_shift_range=0.2,
            height_shift_range=0.2,
            shear_range=0.2,
            fill_mode='nearest',
            horizontal_flip=True,
            vertical_flip=True
            )
        self.datagen.fit(self.xs_train)

        if self.verbose:
            end_time = time.time()
            self.print_time(start_time,end_time,'data augmentation')

项目：dogsVScats 作者：prajwalkr | 项目源码 | 文件源码

def ms_valgen():
    validation_datagen = ImageDataGenerator().flow_from_directory(
        VAL_DIR,
        target_size=(max([w1,w2,w3]), max([h1,h2,h3])),
        batch_size=mini_batch_sz,
        class_mode='binary'
        )
    meanstdev = [pickle.load(open('meanSTDDEV320')), pickle.load(open('meanSTDDEV240')),
            pickle.load(open('meanSTDDEV400'))]

    while 1:
        X,y = validation_datagen.next()
        quad1, quad2 = sample(np.random.permutation(4),2)
        x1, y1 = getXY(quad1, w1)
        x2, y2 = getXY(quad2, w2, imsize=w1)
        X1 = submean(cropX(X, x=x1, y=y1, size=w1), meanstdev[0])
        X2 = submean(cropX(resizeX(X, w1), x=x2, y=y2, size=w2), meanstdev[1])
        X3 = submean(X, meanstdev[2])

        yield ([X1, X2, X3], y)

项目：dogsVScats 作者：prajwalkr | 项目源码 | 文件源码

def DataGen():
    train_datagen = ImageDataGenerator(zoom_range=0.25, rotation_range=15.,
         channel_shift_range=25., width_shift_range=0.02, height_shift_range=0.02, 
         horizontal_flip=True, fill_mode='constant')

    validation_datagen = ImageDataGenerator(horizontal_flip=True)

    train_generator = train_datagen.flow_from_directory(
        TRAIN_DIR,
        target_size=(img_width, img_width),
        batch_size=mini_batch_sz,
        class_mode='binary')

    validation_generator = validation_datagen.flow_from_directory(
        VAL_DIR,target_size=(img_width, img_height),
        batch_size=mini_batch_sz,
        class_mode='binary', shuffle=False)

    return (standardized(train_generator, training=True, inception=False), 
        standardized(validation_generator, inception=False))

项目：Kaggle-Sea-Lions-Solution 作者：mrgloom | 项目源码 | 文件源码

def train():
    model= get_model()

    x_train,y_train= load_data('kaggle_data/train_images_512x512')

    datagen = ImageDataGenerator(
        horizontal_flip=True,
        vertical_flip=True)

    model.fit_generator(datagen.flow(x_train, y_train, batch_size=batch_size),
                steps_per_epoch=len(x_train) / batch_size, epochs=epochs)


    model.save(model_name+'_model.h5')

项目：aetros-cli 作者：aetros | 项目源码 | 文件源码

def get_image_data_augmentor_from_dataset(dataset):
    from keras.preprocessing.image import ImageDataGenerator
    dataset_config = dataset['config']

    augShearRange = float(get_option(dataset_config, 'augShearRange', 0.1))
    augZoomRange = float(get_option(dataset_config, 'augZoomRange', 0.1))
    augHorizontalFlip = bool(get_option(dataset_config, 'augHorizontalFlip', False))
    augVerticalFlip = bool(get_option(dataset_config, 'augVerticalFlip', False))
    augRotationRange = float(get_option(dataset_config, 'augRotationRange', 0.2))

    return ImageDataGenerator(
        rotation_range=augRotationRange,
        shear_range=augShearRange,
        zoom_range=augZoomRange,
        horizontal_flip=augHorizontalFlip,
        vertical_flip=augVerticalFlip
    )

项目：ml-tools 作者：triagemd | 项目源码 | 文件源码

def test_n_images_total(sample_dataset_dir):
    n_images_train = 18
    data_path = os.path.join(sample_dataset_dir, 'Training')

    # From Path
    n_total_images = cds.compute_n_images(data_path)
    assert n_images_train == n_total_images, 'N_images from data path fail'

    # From Generator
    train_datagen = image.ImageDataGenerator()

    generator = train_datagen.flow_from_directory(
        data_path,
        target_size=(10, 10),
        batch_size=10,
        shuffle=False,
        class_mode='sparse')
    n_total_images = cds.compute_n_images(data_path, generator)

    assert n_images_train == n_total_images, 'N_images from generator fail'


# Test to see if mean and std have 3 components (BGR) / They are np.float64 values

项目：cancer_nn 作者：tanmoyopenroot | 项目源码 | 文件源码

def getDataGenObject(directory):

    datagen = ImageDataGenerator(
        rescale=1. / 255,
        # rotation_range = 40,
        # width_shift_range = 0.1,
        # height_shift_range = 0.1,
        # shear_range = 0.1,
        # zoom_range = 0.1,
        # horizontal_flip = True,
        # fill_mode = "nearest"
    )

    datagen_generator = datagen.flow_from_directory(
        directory,
        target_size=(img_height, img_width),
        batch_size=batch_size,
        class_mode=None,
        shuffle=False
    )

    return datagen_generator

项目：cancer_nn 作者：tanmoyopenroot | 项目源码 | 文件源码

def getDataGenObject(directory):

    datagen = ImageDataGenerator(
        rescale=1. / 255,
        # rotation_range = 40,
        # width_shift_range = 0.1,
        # height_shift_range = 0.1,
        # shear_range = 0.1,
        # zoom_range = 0.1,
        # horizontal_flip = True,
        # fill_mode = "nearest"
    )

    datagen_generator = datagen.flow_from_directory(
        directory,
        target_size=(img_height, img_width),
        batch_size=batch_size,
        class_mode=None,
        shuffle=False
    )

    return datagen_generator

项目：cancer_nn 作者：tanmoyopenroot | 项目源码 | 文件源码

def getDataGenObject ( directory, class_mode ):

    datagen = ImageDataGenerator(
        rescale = 1./255,
        # rotation_range = 40,
        # width_shift_range = 0.1,
        # height_shift_range = 0.1,
        # shear_range = 0.1,
        # zoom_range = 0.1,
        # horizontal_flip = True,
        # fill_mode = "nearest"
    )

    datagen_generator = datagen.flow_from_directory(
        directory,
        target_size = ( data["img_height"], data["img_width"] ),
        batch_size = data["batch_size"],
        class_mode = class_mode,
        shuffle = False
    )

    return datagen_generator

项目：cancer_nn 作者：tanmoyopenroot | 项目源码 | 文件源码

def getDataGenObject(directory):

    datagen = ImageDataGenerator(
        rescale=1. / 255,
        # rotation_range = 40,
        # width_shift_range = 0.1,
        # height_shift_range = 0.1,
        # shear_range = 0.1,
        # zoom_range = 0.1,
        # horizontal_flip = True,
        # fill_mode = "nearest"
    )

    datagen_generator = datagen.flow_from_directory(
        directory,
        target_size=(img_height, img_width),
        batch_size=batch_size,
        class_mode=None,
        shuffle=False
    )

    return datagen_generator

项目：bdcloud 作者：hanghang2333 | 项目源码 | 文件源码

def get_generator(featurewise_center=False, featurewise_std=False,
                  rotation=10, width_shift=0.05, height_shift=0.05,
                  zoom=[0.95, 1.05], horizontal=False, vertical=False):
    '''
    ???????????????????keras??
    '''
    datagen = ImageDataGenerator(
        featurewise_center=featurewise_center,
        featurewise_std_normalization=featurewise_std,
        rotation_range=rotation,
        width_shift_range=width_shift,
        height_shift_range=height_shift,
        zoom_range=zoom,
        horizontal_flip=horizontal,
        vertical_flip=vertical)
    return datagen

项目：bdcloud 作者：hanghang2333 | 项目源码 | 文件源码

def get_generator(featurewise_center=False, featurewise_std=False,
                  rotation=10, width_shift=0.05, height_shift=0.05,
                  zoom=[0.95, 1.05], horizontal=False, vertical=False):
    '''
    ???????????????????keras??
    '''
    datagen = ImageDataGenerator(
        featurewise_center=featurewise_center,
        featurewise_std_normalization=featurewise_std,
        rotation_range=rotation,
        width_shift_range=width_shift,
        height_shift_range=height_shift,
        zoom_range=zoom,
        horizontal_flip=horizontal,
        vertical_flip=vertical)
    return datagen

项目：dem 作者：hengyuan-hu | 项目源码 | 文件源码

def train_with_data_augmentation(self, batch_size, num_epoch, lr_schedule):
        datagen = ImageDataGenerator(
            width_shift_range=0.125, # randomly shift images horizontally, fraction
            height_shift_range=0.125, # randomly shift images vertically, fraction
            horizontal_flip=True)

        opt = keras.optimizers.SGD(lr=lr_schedule(0), momentum=0.9, nesterov=True)
        callback_list = [LearningRateScheduler(lr_schedule)]
        self.ae.compile(optimizer=opt, loss='mse')
        assert False, 'seems that y is not augmented.'
        # history = self.ae.fit_generator(
        #     datagen.flow(
        #         self.dataset.train_xs,
        #         self.dataset.train_xs,
        #     nb_epoch=num_epoch,
        #     batch_size=batch_size,
        #     validation_data=(self.dataset.test_xs, self.dataset.test_xs),
        #     shuffle=True, callbacks=callback_list)
        self.history = history.history

项目：mnist-competition 作者：kkweon | 项目源码 | 文件源码

def train_generator():
    """Train Generator for Keras

    Returns
    ----------
    train_gen : generator
        Yield augmented images

    val_gen : generator
        Yield non-augmented images
    """
    train_gen = ImageDataGenerator(
        rotation_range=30,
        shear_range=0.1,
        zoom_range=0.1,
        width_shift_range=0.2,
        height_shift_range=0.2,
    )

    val_gen = ImageDataGenerator()
    return train_gen, val_gen

项目：Sacred_Deep_Learning 作者：AAbercrombie0492 | 项目源码 | 文件源码

def test_images_generator(test_path):
    '''
    Creates a generator that pulls images from a test directory that contains
    shade vs sunny subdirectories.
    '''
    from keras.utils.np_utils import to_categorical
    from keras.preprocessing import image
    from keras.preprocessing.image import ImageDataGenerator
    from keras.applications.resnet50 import preprocess_input
    from sklearn.model_selection import train_test_split
    from image_utilities import load_images_from_directory, preprocess_input_resnet
    import numpy as np

    #load_images from from the train and val directories
    test_datagen = ImageDataGenerator(preprocessing_function=preprocess_input_resnet)
    test_generator = test_datagen.flow_from_directory(directory=test_path,
                                                target_size=[224, 224],
                                                batch_size=26,
                                                class_mode='categorical')

    return test_datagen, test_generator

项目：five-video-classification-methods 作者：harvitronix | 项目源码 | 文件源码

def get_generators():
    train_datagen = ImageDataGenerator(
        rescale=1./255,
        shear_range=0.2,
        horizontal_flip=True,
        rotation_range=10.,
        width_shift_range=0.2,
        height_shift_range=0.2)

    test_datagen = ImageDataGenerator(rescale=1./255)

    train_generator = train_datagen.flow_from_directory(
        os.path.join('data', 'train'),
        target_size=(299, 299),
        batch_size=32,
        classes=data.classes,
        class_mode='categorical')

    validation_generator = test_datagen.flow_from_directory(
        os.path.join('data', 'test'),
        target_size=(299, 299),
        batch_size=32,
        classes=data.classes,
        class_mode='categorical')

    return train_generator, validation_generator

项目：dogsVScats 作者：prajwalkr | 项目源码 | 文件源码

def ms_traingen():
    train_datagen = ImageDataGenerator(rotation_range=30.,
        horizontal_flip=True, fill_mode='reflect').flow_from_directory(
        TRAIN_DIR,
        target_size=(max([w1,w2,w3]), max([h1,h2,h3])),
        batch_size=mini_batch_sz,
        class_mode='binary'
        )
    meanstdev = [pickle.load(open('meanSTDDEV320')), pickle.load(open('meanSTDDEV240')),
            pickle.load(open('meanSTDDEV400'))]

    while 1:
        X,y = train_datagen.next()
        for i in xrange(len(X)):    
            if randint(0, 4)//4:
                X[i] = random_bright_shift(X[i])
            if randint(0, 4)//4:
                X[i] = random_contrast_shift(X[i])

        quad1, quad2 = sample(np.random.permutation(4),2)
        x1, y1 = getXY(quad1, w1)
        x2, y2 = getXY(quad2, w2, imsize=w1)
        X1 = submean(cropX(X, x=x1, y=y1, size=w1), meanstdev[0])
        X2 = submean(cropX(resizeX(X, w1), x=x2, y=y2, size=w2), meanstdev[1])
        X3 = submean(X, meanstdev[2])

        yield ([X1, X2, X3], y)

项目：Convolution-neural-networks-made-easy-with-keras 作者：mingruimingrui | 项目源码 | 文件源码

def image_generator():
    return ImageDataGenerator(
        featurewise_center=False,  # set input mean to 0 over the dataset
        samplewise_center=False,  # set each sample mean to 0
        featurewise_std_normalization=False,  # divide inputs by std of the dataset
        samplewise_std_normalization=False,  # divide each input by its std
        zca_whitening=False,  # apply ZCA whitening
        rotation_range=0,  # randomly rotate images in the range (degrees, 0 to 180)
        zoom_range=0.1, # randomly zoom in on images by (percentage as fraction)
        width_shift_range=0.05,  # randomly shift images horizontally (fraction of total width)
        height_shift_range=0.05,  # randomly shift images vertically (fraction of total height)
        horizontal_flip=True,  # randomly flip images
        vertical_flip=False
    )

项目：keras-retinanet 作者：fizyr | 项目源码 | 文件源码

def __init__(self, annotations_group, num_classes=0, image=None):
        self.annotations_group = annotations_group
        self.num_classes_      = num_classes
        self.image             = image
        super(SimpleGenerator, self).__init__(ImageDataGenerator(), group_method='none', shuffle_groups=False)

项目：painters 作者：inejc | 项目源码 | 文件源码

def _train_generator():
    return ImageDataGenerator(
        featurewise_center=True,
        featurewise_std_normalization=True,
        rotation_range=180,
        zoom_range=0.2,
        width_shift_range=0.2,
        height_shift_range=0.2,
        shear_range=0.3,
        horizontal_flip=True,
        vertical_flip=True,
        fill_mode='reflect')

项目：painters 作者：inejc | 项目源码 | 文件源码

def _val_generator():
    return ImageDataGenerator(
        featurewise_center=True,
        featurewise_std_normalization=True)

项目：hyperas 作者：maxpumperla | 项目源码 | 文件源码

def data():
    nb_classes = 10
    # the data, shuffled and split between train and test sets
    (X_train, y_train), (X_test, y_test) = cifar10.load_data()
    print('X_train shape:', X_train.shape)
    print(X_train.shape[0], 'train samples')
    print(X_test.shape[0], 'test samples')

    # convert class vectors to binary class matrices
    Y_train = np_utils.to_categorical(y_train, nb_classes)
    Y_test = np_utils.to_categorical(y_test, nb_classes)

    X_train = X_train.astype('float32')
    X_test = X_test.astype('float32')
    X_train /= 255
    X_test /= 255

    # this will do preprocessing and realtime data augmentation
    datagen = ImageDataGenerator(
        featurewise_center=False,  # set input mean to 0 over the dataset
        samplewise_center=False,  # set each sample mean to 0
        featurewise_std_normalization=False,  # divide inputs by std of the dataset
        samplewise_std_normalization=False,  # divide each input by its std
        zca_whitening=False,  # apply ZCA whitening
        rotation_range=0,  # randomly rotate images in the range (degrees, 0 to 180)
        width_shift_range=0.1,  # randomly shift images horizontally (fraction of total width)
        height_shift_range=0.1,  # randomly shift images vertically (fraction of total height)
        horizontal_flip=True,  # randomly flip images
        vertical_flip=False)  # randomly flip images

    # compute quantities required for featurewise normalization
    # (std, mean, and principal components if ZCA whitening is applied)
    datagen.fit(X_train)

    return datagen, X_train, Y_train, X_test, Y_test