# mindrlhf_pcl **Repository Path**: yingtonghu/mindrlhf_pcl ## Basic Information - **Project Name**: mindrlhf_pcl - **Description**: pcl 稳定版本的mindrlhf代码仓库 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 6 - **Created**: 2025-06-04 - **Last Updated**: 2025-07-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # mindrlhf_pcl #### 介绍 pcl现场实验代码 #### 使用说明 1. mindrlhf文件夹为脚本目录; 2. distill 7b模型单机和多机启动脚本yz_run_grpo_7b_p8.sh和yz_run_grpo_7b_p32.sh;注意修改MINDFORMERS_MODEL_CONFIG路径,和对应yaml文件中的并行配置; 3. toolkits文件夹为工具脚本目录,包括画图,中间结果及评测结果转换脚本。 python plot_score_metric.py --log_dir {log路径} --moving_avg {moving窗口大小} python json2csv2.py {中间结果} {保存cvs文件名} python json2csv_eval.py {评测结果} {保存csv文件名}