tensorflow中如何average checkpoint - 代码天地

tensorflow中如何average checkpoint

其他 2021-02-09 08:27:32 阅读次数: 0

首先获取checkpoint的状态以及每个参数的值：

ckpt_state = tf.train.get_checkpoint_state(model_dir)
ckpts = (ckpt_state.all_model_checkpoint_paths)

avg_model_dir = os.path.join(model_dir, "avg_ckpts")
tf.gfile.MakeDirs()

var_list = tf.contrib.framework.list_variables(ckpts[0])

然后对checkpoint里的每个参数求平均：

var_values, var_dtypes = {}, {}

for (name, shape) in var_list:
    var_values[name] = np.zeros(shape)

for ckpt in ckpts:
    reader = tf.contrib.framework.load_checkpoint(ckpt)
    for name in var_values:
        tensor = reader.get_tensor(name)
        var_dtypes[name] = tensor.dtype
        var_values[name] += tensor

for name in var_values:
    var_values[name] /= len(ckpts)

接下来将平均后的参数保存在一个新的checkpoint里面：

tf_vars = [tf.get_variable(name, dtype=var_dtypes[name], initializer=var_values[name]) for name in var_values]

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    saver = tf.train.Saver(tf.global_variables())
    saver.save(sess, os.path.join(avg_model_dir, "qe.ckpt"))

猜你喜欢

转载自blog.csdn.net/bonjourdeutsch/article/details/102662437

tensorflow中如何average checkpoint

tensorflow中checkpoint总结

TensorFlow 中的checkpoint与saver

Pytorch中的checkPoint: torch.utils.checkpoint.checkpoint

tensorflow的checkpoint文件的版本

tensorflow checkpoint报错

Spark Streaming中的checkpoint

sparkstreaming中的checkpoint

Flink中CheckPoint原理

CheckPoint

tensorflow saver和checkpoint总结

Tensorflow－GraphDef、MetaGraph、CheckPoint

tensorflow Restoring from checkpoint failed

1、Tensorflow 之 saver与checkpoint

认识MySQL中的Checkpoint技术

RDD中的cache() persist() checkpoint()

Spark Streaming的checkpoint（更新中）

Spark中cache、persist、checkpoint

Flink中的Checkpoint和Savepoint

spark中的checkpoint，持久化和checkpoint的区别

修改tensorflow checkpoint内容 TensorFlow 输出checkpoint 中的变量名与变量值

[Tensorflow] 如何从pb文件生成标准的tensorflow checkpoint文件？

读取tensorflow的checkpoint里保存的参数

tensorflow之train.get_checkpoint_state

tensorflow 1.6 修改checkpoint的saver机制

【tensorflow】tf.train.get_checkpoint_state

TensorFlow 输出checkpoint 中的变量名与变量值

tensorflow中设置保存checkpoint的最大数量

理解CheckPoint及其在Tensorflow & Keras & Pytorch中的使用

Spark Streaming如何使用checkpoint容错

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

如何在ORACLE CLOUD中创建和访问容器集群丨内附官方文档链接

大数据从何而来?不得不知的7个数据源供应平台

mybatis抽取基类BaseMapper

[IJKPLAYER]初识

TREE KERNELS IN SVM-LIGHT---在svm-light中树核的使用（翻译）

UVa 11825 - Hackers' Crackdown DP, 枚举子集substa = (substa - 1)&sta 难度: 2

微信页面通过LocalID预览图片,getlocallmgdata

敏捷测试中的Web测试优秀实践

Spring MVC中日期转换的错误

【转】你真的了解延时队列吗

每日归档

更多

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)