栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

windows版本的多智能体MADDPG

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

windows版本的多智能体MADDPG

安装

maddpg依赖的环境是: Python (3.5.4), OpenAI gym (0.10.5), tensorflow (1.8.0), numpy (1.14.5),

GitHub源码分为环境和算法两个部分:

环境

openai/multiagent-particle-envs: Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/multiagent-particle-envs算法

openai/maddpg: Code for the MADDPG algorithm from the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/maddpg

1.解压缩maddpg-master.zip和multiagent-particle-envs-master.zip
2.在maddpg-master文件夹外层目录运行命令pip install -e maddpg-master
3.在multiagent-particle-envs-master文件夹外层目录运行命令pip install -e multiagent-particle-envs-master
4.设置系统环境变量,把multiagent-particle-envs-master所在路径加入系统path中

出错:


1. 运行:python train.py --scenario simple时出错:importError: cannot import name ‘prng’ from ‘gym.spaces’。

gym版本问题,解决方案:pip install gym==0.10.5
2.错误:ModuleNotFoundError: No module named ‘tensorflow.contrib’,

解决方案pip install tensorflow==1.14.0

3.训练结束,写文件时出错

Traceback (most recent call last):
File “train.py”, line 193, in
train(arglist)
File “train.py”, line 182, in train
rew_file_name = arglist.plots_dir + arglist.exp_name + ‘_rewards.pkl’
TypeError: can only concatenate str (not “NoneType”) to str
解决方案:修改train.py第182行为rew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_rewards.pkl'
第185行为agrew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_agrewards.pkl'
4.显示图形界面,修改train.py第32行为

parser.add_argument("--display", action="store_true", default=True)

5.将环境测试指令中的 simple 改为 multiagent/scenarios 文件夹中的其他场景进行实验。

能够跑通simple场景的程序,但是代码14行换其他场景,就出错

解决方法:将程序所在根目录(D盘、E盘...)找到tmp文件夹,打开会看到policy文件夹,将policy文件夹清空,并将程序恢复默认设置(display为False,跑通后再变True)

6.训练完之后报错

FileNotFoundError: [Errno 2] No such file or directory: ‘./learning_curves/_rewards.pkl’

在跟experiments同级目录下,手动创建一个learning_curves文件夹,当然也可以注释掉这几行数据保存的代码,毕竟不影响训练的结果

原理及使用介绍:

MADDPG算法代码分析

翻译

MADDPG 论文翻译

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/498938.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号