tensorflow分布式报错:tensorflow.python.framework.errors_impl.UnknownError: Could not start gRPC server

在学习tensorflow分布式的过程中遇到一些错误,多方查找之后终于解决,在此记录,希望能帮助其他遇到该问题的人解决问题。

前提描述:

在同一服务器下的三台虚拟机上进行实验tensorflow分布式,其中一台用作参数保存,另外两台用作计算,如下:
{“ps”:"192.168.0.163,“worker”,"192.168.0.164,192.168.0.165}

错误:

在192.168.0.163节点运行以下代码:

python distributed.py --job_name=ps --task_index=0

报错提示:

tensorflow.python.framework.errors_impl.UnknownError: Could not start
gRPC server
在这里插入图片描述

解决办法

解决方法: 出现该问题是由于在第一次运行该程序后,后台仍保留进程,可通过”ps -aux grep python”命令,查找进程,并kll掉后台进程,再次运行,即可解决;如果还是出现该错误,可重新启动虚拟机,再次运行,即可。

猜你喜欢

转载自blog.csdn.net/weixin_39589455/article/details/132046218
今日推荐