2025年强化学习ferm复现

科技前沿 • 2025-02-18 14:37 • 阅读 32

大家好，我是讯享网，很高兴认识大家。

复现代码地址：https://github.com/PhilipZRH/ferm

在c:\user\Administrator下新建.mujoco文件夹

讯享网

https://www.roboti.us/license.html 这里申请license

https://www.roboti.us/index.html 这里下载 windows版mujoco200

然后把mujoco200_win64解压到.mujoco文件夹中，重命名完为mujoco200

把申请的license和mjkey放在.mujoco文件夹和bin中，如下图：

配置环境变量：

依次执行指令： conda create -n ferm python=3.6 pip install gym==0.17.2 imageio==2.9.0 imageio-ffmpeg==0.4.2 numpy==1.19.1 tensorboard==2.3.0 scikit-image==0.17.2 absl-py==0.9.0 pillow==6.1 termcolor==1.1.0 cffi==1.14.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/ conda install pytorch=1.7 torchvision cudatoolkit=10.2

讯享网

然后用我修改后适配win10的代码：

讯享网pip install -r requirements.dev.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ python setup.py install

执行测试指令测试：

python train.py --domain_name FetchPickAndPlace-v1 --reward_type sparse --cameras 8 10 --frame_stack 1 --num_updates 1 --observation_type pixel --encoder_type pixel --work_dir ./data/FetchPickAndPlace-v1 --pre_transform_image_size 100 --image_size 84 --agent rad_sac --seed -1 --critic_lr 0.001 --actor_lr 0.001 --eval_freq 1000 --batch_size 128 --save_tb --save_video --demo_model_dir expert/FetchPickAndPlace-v1 --demo_model_step  --demo_samples 500 --demo_special_reset grip --change_model --bc_only

如果出现开始计算loss，如下图：则OK

2025年强化学习ferm复现

相关推荐