数据分析师养成之路---keras中笔记(上,下采样,数据增强部分) - 代码天地

数据分析师养成之路---keras中笔记(上,下采样,数据增强部分)

编程语言 2018-07-21 07:59:56 阅读次数: 0

上采样:
有两类样本(A,B),A>B数量,若n*B=A(约等于),则B样本数据变为:n*B,A样本数据为:A

def upperSample(df)
    df.index=range(len(df))
    df_A=df[df['class']=='A']
    df_B=df[df['class']=='B']
    len_A=len(df_A)
    len_B=len(df_B)
    index_A=df_A.index
    index_B=df_B.index

    if len_A==len_B:
       return shuffleDF(df)#shuffleDF()为自定义的重排函数,使df中的样本分布打乱
    elif len_A>len_B:
         x=len_A//len_B
         df_B=df.iloc[list(index_B)*x]
         df=pd.concat([df_A,df_B],axis=0)
         df.index=range(len(df))
         return shuffleDF(df)
     else:
        ...(即len_B>len_A,方法同上)

def shuffleDF(df):
    shuffle_index=np.random.permutation(len(df))
    df=df.iloc[shffle_index]
    df.index=range(len(df))
    return df

下采样:
有两类样本(A,B),A>B数量, A,B中皆抽取len(B)数量样本用做训练

def lowerSample(df):
    df.index=range(len(df))
    df_A=df[df['class']=='A']
    df_B=df[df['class']=='B']
    len_A=len(df_A)
    len_B=len(df_B)
    if len_A==len_B:
        return shuffleDF(df)
    elif len_A>len_B:
        df_A=df_A.sample(len_B)
        df=pd.concat([df_A,df_B],axis=0)
        df.index=range(len(df))
        return shuffleDF(df)
    else:
      ...(len_A<len_B,同上)

生成器自定义参数:

from keras.preprocessing.image import ImageDataGenerator
from skimage import io,transform,exposure,util

def Augmentdata(img):
    datagen=ImageDataGenerator(...)
    #随机增强图片img
    img=datagen.random_transform(img)
    #给img添加高斯噪声
    img=utils.random_noise(img,mode='gaussian')
    #调整图像对比度
    theta=np.random.uniform(0.1,1)
    img=exposure.adjust_gamma(img,gamma=theta)
    return img

如上,当然以上增强参数,高斯,gamma等,可随机添加

threshold=20
if np.random.randint(0,50,1)<threshold:
   #添加高斯,gamma

对于一批图片,如何添加增强参数呢?
可由以上代码改写:
如train_generator是数据增强后得到的生成器,next(train_generator)得到每批的值,(data_list和label_list),那么每个data就是一个img,我们获得每个img,就可以对其添加增强参数了

猜你喜欢

转载自blog.csdn.net/lulujiang1996/article/details/81112971

数据分析师养成之路---keras中笔记(上,下采样,数据增强部分)

数据分析师养成之路--keras学习中metrics和callbacks笔记

数据分析师养成之路之keras篇:保存,载入模型笔记

数据分析师养成之路之python篇:(keras 中 roc和混淆矩阵)

数据分析师养成之路之keras篇(sklearn 与keras结合实现调参)

数据分析师养成之路---keras实现自己的数据集

数据分析师养成之路之keras篇,添加auc,costtime

数据分析师养成之路之keras:(Modelcheckpoint,交叉验证等实现篇)

数据分析师养成之路之keras篇:fine-tune学习小结

数据分析师养成之路之keras篇:提取bottleneck

数据分析师养成之路——成长笔记1，计划

数据分析师养成之路--python实战分类案例1

数据分析师养成之路之python:从头学习机器学习(预)

数据分析师养成之路之python偏:(画AUC和混淆矩阵)

数据分析师养成之路之python(机器学习-决策树(完整))

数据分析师的进阶之路

028 《数据分析师养成宝典》读书笔记

数据分析师养成之路--python实战分类案例2（如何调参，选择模型等）

数据分析师养成之路之Python篇:从头学习机器学习之决策树(预)

数据分析师养成之路之python:从头学习机器学习(KNN_1)

数据分析师养成之路之python篇（从头学习机器学习之逻辑回归）

数据分析师

我的数据分析师转行之路

数据分析师之路--Excel（1）

年薪50万的大数据分析师养成记

数据分析师养成之路之python篇:从头学习机器学习(决策树(熵,信息增益,创建树的代码实现))

某易数据分析师课程笔记

数据分析师要求

数据分析师面试准备

数据分析师必备利器

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)