Systematic learning notes on Jason Wei's research, CoT, and LLM reasoning.(系统学习 Jason Wei 及其 LLM 推理研究的笔记)
最近更新: 13天前A simplified, open-source implementation of the AlphaEvolve concept using the DeepSeek API. (一个使用DeepSeek API实现的简化版、开源的AlphaEvolve.) NanoAlphaEvolve 是 AlphaEvolve 方法论的一个 Python 实现,该方法论在论文《AlphaEvolve:
最近更新: 2个月前强化学习论文精读仓库:基于OpenAI Spinning Up关键论文清单,提供论文解析、笔记和代码实现,帮助深入理解强化学习核心算法与实战应用。
最近更新: 3个月前Ilya Sutskever 推荐的论文清单:30u30。 Ilya Sutskever 是 Hinton 的学生,OpenAI的联合创始人。 以下是他推荐的论文清单,他认为阅读完这些内容之后就可以了解AI领域90%的内容
最近更新: 4个月前本仓库收集并解析了Geoffrey Hinton(深度学习之父)的重要论文,旨在帮助研究者和学习者理解深度学习的基础理论和发展历程。
最近更新: 4个月前《强化学习导论》(第二版) (Sutton & Barto)学习笔记、代码实现与习题解答。本仓库记录学习Sutton & Barto经典教材的完整过程,包含详细的章节笔记、算法实现、习题解答及相关资源。
最近更新: 7个月前