2025年强化学习ferm复现

强化学习ferm复现复现代码地址 https github com PhilipZRH ferm 在 c user Administrato 下新建 mujoco 文件夹 https www roboti us license html 这里申请 license https www roboti us index html 这里下载 windows 版 mujoco200

大家好,我是讯享网,很高兴认识大家。

复现代码地址:https://github.com/PhilipZRH/ferm

在c:\user\Administrator下新建.mujoco文件夹


讯享网

https://www.roboti.us/license.html 这里申请license

https://www.roboti.us/index.html  这里下载 windows版mujoco200

然后把mujoco200_win64解压到.mujoco文件夹中,重命名完为mujoco200

把申请的license和mjkey放在.mujoco文件夹和bin中,如下图:

配置环境变量:

 

依次执行指令: conda create -n ferm python=3.6 pip install gym==0.17.2 imageio==2.9.0 imageio-ffmpeg==0.4.2 numpy==1.19.1 tensorboard==2.3.0 scikit-image==0.17.2 absl-py==0.9.0 pillow==6.1 termcolor==1.1.0 cffi==1.14.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/ conda install pytorch=1.7 torchvision cudatoolkit=10.2 

讯享网

 然后用我修改后适配win10的代码:

 

讯享网pip install -r requirements.dev.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ python setup.py install

 

执行测试指令测试: 

python train.py --domain_name FetchPickAndPlace-v1 --reward_type sparse --cameras 8 10 --frame_stack 1 --num_updates 1 --observation_type pixel --encoder_type pixel --work_dir ./data/FetchPickAndPlace-v1 --pre_transform_image_size 100 --image_size 84 --agent rad_sac --seed -1 --critic_lr 0.001 --actor_lr 0.001 --eval_freq 1000 --batch_size 128 --save_tb --save_video --demo_model_dir expert/FetchPickAndPlace-v1 --demo_model_step  --demo_samples 500 --demo_special_reset grip --change_model --bc_only

 如果出现开始计算loss,如下图:则OK

 

小讯
上一篇 2025-02-10 07:51
下一篇 2025-03-17 08:04

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/30623.html