第4章的标题中 最好点出是什么具体的系统设计与实现。
1.1 中目标没哟一篇参考文献,不合适,至少2篇以上近3年的参考文献。
1.1 “imitation eval评估流程”中eval就是evaluation(评估)的意思,并且不是特殊词汇不需要写英文。后面的都是。
2.3 中描述马尔可夫决策过程的5个因素貌似不是主流说法,一般为:状态、动作、状态转移、奖励和折扣因子,而且和后面描述没有对上。
并且变量在论文中应该是斜体。
2.3 (3) 中第二段有个ppo是小写。
2.4 中公式公式写法都不统一,xi、N_{valid}等都不符合要求且前后不一致。
Actor-Critic论文中多次描述不一致。
3.3(2)Ltotal、wp等都应该和公式中一致,有下标。
图3-4清晰度不够,其他图都是,需要高清的图片。
强化学习的学习算法、训练过程描述过少,这是这篇论文的核心。
4.2.3 中的算法描述应该放到第三章,第四章是实验部分。
图4-1、4-6不能出现桌面等无关内容,而且应该多个不同截图组成一个图。
第四章的量化对比结果太少,至少4页内容。
@mhc-2026 能跑的代码和论文在这里提交,交流也是
第4章的标题中 最好点出是什么具体的系统设计与实现。
1.1 中目标没哟一篇参考文献,不合适,至少2篇以上近3年的参考文献。
1.1 “imitation eval评估流程”中eval就是evaluation(评估)的意思,并且不是特殊词汇不需要写英文。后面的都是。
2.3 中描述马尔可夫决策过程的5个因素貌似不是主流说法,一般为:状态、动作、状态转移、奖励和折扣因子,而且和后面描述没有对上。
并且变量在论文中应该是斜体。
2.3 (3) 中第二段有个ppo是小写。
2.4 中公式公式写法都不统一,xi、N_{valid}等都不符合要求且前后不一致。
Actor-Critic论文中多次描述不一致。
3.3(2)Ltotal、wp等都应该和公式中一致,有下标。
图3-4清晰度不够,其他图都是,需要高清的图片。
强化学习的学习算法、训练过程描述过少,这是这篇论文的核心。
4.2.3 中的算法描述应该放到第三章,第四章是实验部分。
图4-1、4-6不能出现桌面等无关内容,而且应该多个不同截图组成一个图。
第四章的量化对比结果太少,至少4页内容。
@mhc-2026 能跑的代码和论文在这里提交,交流也是