Systematic learning notes on Jason Wei's research, CoT, and LLM reasoning.(系统学习 Jason Wei 及其 LLM 推理研究的笔记)
A simplified, open-source implementation of the AlphaEvolve concept using the DeepSeek API. (一个使用DeepSeek API实现的简化版、开源的AlphaEvolve.) NanoAlphaEvolve 是 AlphaEvolve 方法论的一个 Python 实现,该方法论在论文《AlphaEvolve:
强化学习论文精读仓库:基于OpenAI Spinning Up关键论文清单,提供论文解析、笔记和代码实现,帮助深入理解强化学习核心算法与实战应用。
Ilya Sutskever 推荐的论文清单:30u30。 Ilya Sutskever 是 Hinton 的学生,OpenAI的联合创始人。 以下是他推荐的论文清单,他认为阅读完这些内容之后就可以了解AI领域90%的内容
《强化学习导论》(第二版) (Sutton & Barto)学习笔记、代码实现与习题解答。本仓库记录学习Sutton & Barto经典教材的完整过程,包含详细的章节笔记、算法实现、习题解答及相关资源。