# AdvancedCompiler **Repository Path**: candanzg/AdvancedCompiler ## Basic Information - **Project Name**: AdvancedCompiler - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-05 - **Last Updated**: 2025-12-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 程序性能优化理论与方法 & 深度学习编译器设计 先进编译实验室编著的《程序性能优化理论与方法》(实操课程)以及《深度学习编译器设计》两本书籍所配套的文字课程、PPT课件以及配套code将陆续进行更新……同时也欢迎大家关注先进编译实验室的B站账号、知乎,添加微信小助手,加入交流群进行讨论学习,共同进步!!! [B站bilibili个人主页](https://space.bilibili.com/1540261574/) [知乎知乎个人主页](https://www.zhihu.com/people/33-31-35-97) [微信ID微信名片](img/weixin_logo.png) [微信公众号微信公众号](img/公众号二维码.jpg) 先进编译实验室团队长期致力于高性能计算、编译技术、程序优化等方向的科研工作。先后承研国家重大专项、核高基专项、973、863、自然科学基金等相关课题,在高性能计算、并行程序设计与优化、国产自主可控等相关领域已经形成了若干领先成果,曾获国家科技进步一等奖、省部级科技进步一等奖等奖项。在国内外超算及程序优化的竞赛中,多次获PAC全国并行应用挑战赛优化金奖、银奖、铜奖,ASC世界大学生超级计算机竞赛一等奖、二等奖、卓越奖,CPC国产并行应用挑战赛银奖、铜奖,IPCC-ACM中国国际并行计算挑战赛二等奖等。 # 程序性能优化理论与方法 本书及课程从计算机体系结构、编译系统、操作系统、作业管理等多角度,对程序实现中的算法、数据结构、程序设计语言特性、资源占用及程序运行过程等多维度,全面探讨程序性能优化的理论和方法。 本书适用于具备一定程序设计基础并致力于程序性能优化的程序设计人员,也可以作为高等教育计算机程序设计的学习使用,还可作为从事性能优化专业技术人员的参考书。 weixin_logo ## 章节目录 ||||| |---|---|---|---| |章节名称|视频课程|实操课程|课件源码| |1 程序性能优化的意义|[专栏文章程序性能优化的意义(一)](https://www.bilibili.com/read/cv25998686/) [B站bilibili](https://www.bilibili.com/video/BV1LL411B7uW)
[专栏文章程序性能优化的意义(二)](https://www.bilibili.com/read/cv26044608/) [B站bilibili](https://www.bilibili.com/video/BV15g4y1F7QQ) ||[slideslide](slides/Chapter1.pptx) [pdfPDF](slides/Chapter1.pdf) | |2 程序性能的度量指标及优化流程|[专栏文章程序性能的度量指标及优化流程](https://www.bilibili.com/read/cv26110227/) [B站bilibili](https://www.bilibili.com/video/BV1vu411s7Xw) ||[slideslide](slides/Chapter2.pptx) [pdfPDF](slides/Chapter2.pdf) [codecode](code/Chapter2/)| |3 程序性能的分析和测量|[专栏文章程序性能的分析和测量(一)](https://www.bilibili.com/read/cv26284969/) [B站bilibili](https://www.bilibili.com/video/BV1ZV4y1U7wr)
[专栏文章程序性能的分析和测量(二)](https://www.bilibili.com/read/cv26339611/) [B站bilibili](https://www.bilibili.com/video/BV11k4y1p7Bw)
[专栏文章程序性能的分析和测量(三)](https://www.bilibili.com/read/cv26440606/) [B站bilibili](https://www.bilibili.com/video/BV1Wm4y1v7yZ) ||[slideslide](slides/Chapter3.pptx) [pdfPDF](slides/Chapter3.pdf) [codecode](code/Chapter3/)| |4 系统配置优化|[专栏文章系统配置优化(一)](https://www.bilibili.com/read/cv26465284/) [B站bilibili](https://www.bilibili.com/video/BV1go4y1K72Y)
[专栏文章系统配置优化(二)](https://www.bilibili.com/read/cv26465434/) [B站bilibili](https://www.bilibili.com/video/BV12o4y1P7kW)
||[slideslide](slides/Chapter4.pptx) [pdfPDF](slides/Chapter4.pdf) [codecode](code/Chapter4/)| |5 编译与运行优化|[专栏文章编译与运行优化(一)](https://www.bilibili.com/read/cv26593897/) [B站bilibili](https://www.bilibili.com/video/BV1KN4y1L7XT)
[专栏文章编译与运行优化(二)](https://www.bilibili.com/read/cv26902172/) [B站bilibili](https://www.bilibili.com/video/BV1KN4y1L7XT)
[专栏文章编译与运行优化(三)](https://www.bilibili.com/read/cv26728595/) [B站bilibili](https://www.bilibili.com/video/BV1KN4y1L7XT)
|[专栏文章编译器前端](https://www.bilibili.com/read/cv33246459/) [B站bilibili](https://www.bilibili.com/video/BV1NC411Y7A8)
[专栏文章编译器中端](https://www.bilibili.com/read/cv33260788/) [B站bilibili](https://www.bilibili.com/video/BV1Xr421H7t3)
[专栏文章编译器后端](https://www.bilibili.com/read/cv33311872/) [B站bilibili](https://www.bilibili.com/video/BV1gi421d7Hc)
[专栏文章编译选项](https://www.bilibili.com/read/cv33367074/) [B站bilibili](https://www.bilibili.com/video/BV1Nr421n7Pd)
[专栏文章循环展开](https://www.bilibili.com/read/cv33543228/) [B站bilibili](https://www.bilibili.com/video/BV13f421f7ip)
[专栏文章循环分布](https://www.bilibili.com/read/cv33612582/) [B站bilibili](https://www.bilibili.com/video/BV1pj421d793)[zhihu知乎](https://zhuanlan.zhihu.com/p/690497025)
[专栏文章循环剥离](https://www.bilibili.com/read/cv33666036/) [B站bilibili](https://www.bilibili.com/video/BV1AD421W7A1)[zhihu知乎](https://zhuanlan.zhihu.com/p/691358792)
[专栏文章过程间优化](https://www.bilibili.com/read/cv33477201/) [B站bilibili](https://www.bilibili.com/video/BV15m411d7gH)
[专栏文章循环级向量化](https://www.bilibili.com/read/cv33760861/) [B站bilibili](https://www.bilibili.com/video/BV19M4m1X7PU)[zhihu知乎](https://zhuanlan.zhihu.com/p/692201250)
[专栏文章基本块级向量化](https://www.bilibili.com/read/cv33867227/) [B站bilibili](https://www.bilibili.com/video/BV1wp421y7k2)[zhihu知乎](https://zhuanlan.zhihu.com/p/693050648)
[专栏文章数据预取优化](https://www.bilibili.com/read/cv33889311/) [B站bilibili](https://www.bilibili.com/video/BV1Dz421k72n)[zhihu知乎](https://zhuanlan.zhihu.com/p/693262484)
[专栏文章浮点优化](https://www.bilibili.com/read/cv34001479/) [B站bilibili](https://www.bilibili.com/video/BV1BZ421e7t6)
[专栏文章反馈优化](https://www.bilibili.com/read/cv34126648/) [B站bilibili](https://www.bilibili.com/video/BV1xx421S74X)[zhihu知乎](https://zhuanlan.zhihu.com/p/694742133)
[专栏文章链接时优化](https://www.bilibili.com/read/cv34218862/) [B站bilibili](https://www.bilibili.com/video/BV1ZD421p7Gy)[zhihu知乎](https://zhuanlan.zhihu.com/p/695380833)
[专栏文章编译指示](https://www.bilibili.com/read/cv34219036/) [B站bilibili](https://www.bilibili.com/video/BV1jZ421v791)[zhihu知乎](https://zhuanlan.zhihu.com/p/695382596)
[专栏文章数学库优化](https://www.bilibili.com/read/cv34325212/) [B站bilibili](https://www.bilibili.com/video/BV12D421p79o)[zhihu知乎](https://zhuanlan.zhihu.com/p/695468331)
[专栏文章运行时优化](https://www.bilibili.com/read/cv34372946/) [B站bilibili](https://www.bilibili.com/video/BV1ax4y167hV)[zhihu知乎](https://zhuanlan.zhihu.com/p/696635381)|[slideslide](slides/Chapter5.pptx) [pdfPDF](slides/Chapter5.pdf) [codecode](code/Chapter5/)| |6 程序编写优化|[专栏文章程序编写优化(一)](https://www.bilibili.com/read/cv26728808/) [B站bilibili](https://www.bilibili.com/video/BV1gX4y1q7Ms)
[专栏文章程序编写优化(二)](https://www.bilibili.com/read/cv26902172/) [B站bilibili](https://www.bilibili.com/video/BV1Aj411S7kJ)
[专栏文章程序编写优化(三)](https://www.bilibili.com/read/cv26937568/) [B站bilibili](https://www.bilibili.com/video/BV1sg4y1N763)
[专栏文章程序编写优化(四)](https://www.bilibili.com/read/cv27020337/) [B站bilibili](https://www.bilibili.com/video/BV1rh411A79q)
[专栏文章程序编写优化(五)](https://www.bilibili.com/read/cv27090785/) [B站bilibili](https://www.bilibili.com/video/BV1mz4y1E7rb)
|[专栏文章算法优化](https://www.bilibili.com/read/cv34416011/) [B站bilibili](https://www.bilibili.com/video/BV1C142197zL)[zhihu知乎](https://zhuanlan.zhihu.com/p/697039107)
[专栏文章典型数据结构的性能分析](https://www.bilibili.com/read/cv34506282/) [B站bilibili](https://www.bilibili.com/video/BV1ew4m127sJ)[zhihu知乎](https://zhuanlan.zhihu.com/p/697747139)
[专栏文章选择合适的数据类型](https://www.bilibili.com/read/cv34673418/) [B站bilibili](https://www.bilibili.com/video/BV11t421c7N1)[zhihu知乎](https://zhuanlan.zhihu.com/p/698185460)
[专栏文章选择合适的数据结构](https://www.bilibili.com/read/cv34704402/) [B站bilibili](https://www.bilibili.com/video/BV1vi421C7mB)[zhihu知乎](https://zhuanlan.zhihu.com/p/699074220)
[专栏文章别名消除](https://www.bilibili.com/read/cv34838624/) [B站bilibili](https://www.bilibili.com/video/BV1tx4y1B75k)[zhihu知乎](https://zhuanlan.zhihu.com/p/700160135)
[专栏文章常数传播](https://www.bilibili.com/read/cv34933167/) [B站bilibili](https://www.bilibili.com/video/BV1Cw4m1C7t3)[zhihu知乎](https://zhuanlan.zhihu.com/p/700774860)
[专栏文章传参优化](https://www.bilibili.com/read/cv35032486/) [B站bilibili](https://www.bilibili.com/video/BV1NM4m1o7oH)[zhihu知乎](https://zhuanlan.zhihu.com/p/701450224)
[专栏文章内联优化](https://www.bilibili.com/read/cv35096886/) [B站bilibili](https://www.bilibili.com/video/BV1CC411j7Zz)
[专栏文章过程克隆](https://www.bilibili.com/read/cv37323940/) [B站bilibili](https://www.bilibili.com/video/BV17y411Y7Wo)[zhihu知乎](https://zhuanlan.zhihu.com/p/715444386)
[专栏文章全局变量优化](https://www.bilibili.com/read/cv37380397/) [B站bilibili](https://www.bilibili.com/video/BV1vf421m7RY)
[专栏文章循环展开和压紧](https://www.bilibili.com/read/cv37729212/) [B站bilibili](https://www.bilibili.com/video/BV1mx4y1H7ch)
[专栏文章循环不变量外提]() [B站bilibili](https://www.bilibili.com/video/BV1nw4m1D7np/)
[专栏文章循环合并]() [B站bilibili](https://www.bilibili.com/video/BV1k7421f77W/)
[专栏文章循环分段]() [B站bilibili](https://www.bilibili.com/video/BV18z421Y7eR/)
[专栏文章循环分块]() [B站bilibili](https://www.bilibili.com/video/BV1sJ4m137o2/)
[专栏文章循环交换]() [B站bilibili](https://www.bilibili.com/video/BV1zx4y1n7fe/)
[专栏文章循环分裂]() [B站bilibili](https://www.bilibili.com/video/BV1Et421N7E5/)
[专栏文章循环倾斜]() [B站bilibili](https://www.bilibili.com/video/BV1Et421N7E5/)
[专栏文章循环分布]() [B站bilibili](https://www.bilibili.com/video/BV16S411K7Zv/)
[专栏文章删除冗余语句]() [B站bilibili](https://www.bilibili.com/video/BV1Bx4y1J7Uq/)
[专栏文章代数变换]() [B站bilibili](https://www.bilibili.com/video/BV1G7421d7FB/)
[专栏文章公共子表达式优化]() [B站bilibili](https://www.bilibili.com/video/BV1Nr421w7DW/)
[专栏文章合并判断条件]() [B站bilibili](https://www.bilibili.com/video/BV1n4421Q7H8/)
[专栏文章生成选择指令]() [B站bilibili](https://www.bilibili.com/video/BV1px4y1J7mR/)
[专栏文章分支语句优化之运用条件编译]() [B站bilibili](https://www.bilibili.com/video/BV18Z421T7Tx/)
[专栏文章分支语句优化之移除分支语句]() [B站bilibili](https://www.bilibili.com/video/BV1Bb421E7yE/)|[slideslide](slides/Chapter6.pptx) [pdfPDF](slides/Chapter6.pdf) [codecode](code/Chapter6/)| |7 单核优化|[专栏文章指令级并行(一)](https://www.bilibili.com/read/cv27182155/) [B站bilibili](https://www.bilibili.com/video/BV1iV4y1h7wm)
[专栏文章指令级并行(二)](https://www.bilibili.com/read/cv27239182/) [B站bilibili](https://www.bilibili.com/video/BV1ym4y1E783)
[专栏文章数据级并行(一)](https://www.bilibili.com/read/cv27244340/) [B站bilibili](https://www.bilibili.com/video/BV1M94y1q7B4)
[专栏文章数据级并行(二)](https://www.bilibili.com/read/cv27319972/) [B站bilibili](https://www.bilibili.com/video/BV1Wj411R74A)
[专栏文章数据级并行(三)](https://www.bilibili.com/read/cv27410580/) [B站bilibili](https://www.bilibili.com/video/BV1Kk4y1G77z) |[专栏文章指令流水]() [B站bilibili](https://www.bilibili.com/video/BV1dx4y147fD/)
[专栏文章超长指令字]() [B站bilibili](https://www.bilibili.com/video/BV1Nf421z7Yy/)
[专栏文章函数的向量化]() [B站bilibili](https://www.bilibili.com/video/BV1Uw4m1e7PE/)
[专栏文章基本块的向量化]() [B站bilibili](https://www.bilibili.com/video/BV1A4421X7ov/)
[专栏文章循环的向量化]() [B站bilibili](https://www.bilibili.com/video/BV1gZ421M7UP/)
[专栏文章分支向量化]() [B站bilibili](https://www.bilibili.com/video/BV1ES421R7BC/)
[专栏文章归约向量化]() [B站bilibili](https://www.bilibili.com/video/BV1Q4421U7UR/)
[专栏文章不对齐访存]() [B站bilibili](https://www.bilibili.com/video/BV1cZ421u7oX/)
[专栏文章不连续访存]() [B站bilibili](https://www.bilibili.com/video/BV1yS411c7nC/)
[专栏文章向量重用]() [B站bilibili](https://www.bilibili.com/video/BV1Pw4m1Y7nH/)
[专栏文章向量运算融合]() [B站bilibili](https://www.bilibili.com/video/BV1gy411i7cL/)
[专栏文章循环完全展开]() [B站bilibili](https://www.bilibili.com/video/BV12H4y1w7cK/)|[slideslide](slides/Chapter7.pptx) [pdfPDF](slides/Chapter7.pdf) [codecode](code/Chapter7/)| |8 访存优化|[专栏文章访存优化(一)](https://www.bilibili.com/read/cv27540566/) [B站bilibili](https://www.bilibili.com/video/BV1yz4y1s7qp)
[专栏文章访存优化(二)](https://www.bilibili.com/read/cv27540566/) [B站bilibili](https://www.bilibili.com/video/BV1fM4y1H7Ba)
[专栏文章访存优化(三)](https://www.bilibili.com/read/cv27610451/) [B站bilibili](https://www.bilibili.com/video/BV18m4y1W7fH)
[专栏文章访存优化(四)](https://www.bilibili.com/read/cv27666011/) [B站bilibili](https://www.bilibili.com/video/BV1Np4y1776Z)
[专栏文章访存优化(五)](https://www.bilibili.com/read/cv27759411/) [B站bilibili](https://www.bilibili.com/video/BV1gw411D7Bw)
[专栏文章访存优化(六)](https://www.bilibili.com/read/cv27917259/) [B站bilibili](https://www.bilibili.com/video/BV1cp4y1j7ga)
|[专栏文章寄存器分配]() [B站bilibili](https://www.bilibili.com/video/BV1kr421M7mc/)
[专栏文章寄存器重用]() [B站bilibili](https://www.bilibili.com/video/BV1p142187Vu/)
[专栏文章缓存分块]() [B站bilibili](https://www.bilibili.com/video/BV1o4421Z7Ld/)
[专栏文章减少伪共享]() [B站bilibili](https://www.bilibili.com/video/BV1cZ421K7fz/)
[专栏文章数据预取]() [B站bilibili](https://www.bilibili.com/video/BV1Jb421J7Fx/)
[专栏文章减少内存读写]() [B站bilibili](https://www.bilibili.com/video/BV1amW8edE7Q/)
[专栏文章数据对齐]() [B站bilibili](https://www.bilibili.com/video/BV1KCste1EQN/)
[专栏文章多线程操作]() [B站bilibili](https://www.bilibili.com/video/BV1TksteLErP/)
[专栏文章数组重组]() [B站bilibili](https://www.bilibili.com/video/BV1TksteLErM/)
[专栏文章数组转置]() [B站bilibili](https://www.bilibili.com/video/BV18BHaeXECN/)
[专栏文章结构属性域调整]() [B站bilibili](https://www.bilibili.com/video/BV1hqHaeWETX/)
[专栏文章结构体拆分]() [B站bilibili](https://www.bilibili.com/video/BV18qHaeWEkd/)
[专栏文章结构体数组转换]() [B站bilibili](https://www.bilibili.com/video/BV1wG4henEyc/)|[slideslide](slides/Chapter8.pptx) [pdfPDF](slides/Chapter8.pdf) [codecode](code/Chapter8/)| |9 OpenMP程序优化|[专栏文章OpenMP编程简介](https://www.bilibili.com/read/cv27917453/) [B站bilibili](https://www.bilibili.com/video/BV1Zw411U7a8)
[专栏文章并行区重构](https://www.bilibili.com/read/cv28098570/) [B站bilibili](https://www.bilibili.com/video/BV1eu411A79T)
[专栏文章向量化指导命令](https://www.bilibili.com/read/cv28275663/) [B站bilibili](https://www.bilibili.com/video/BV12h4y1Y7vH)
[专栏文章避免伪共享](https://www.bilibili.com/read/cv28352985/) [B站bilibili](https://www.bilibili.com/video/BV1Gw411i7rS)
[专栏文章负载均衡优化](https://www.bilibili.com/read/cv28353034/) [B站bilibili](https://www.bilibili.com/video/BV1XN4y1o7NQ)
[专栏文章避免隐式同步](https://www.bilibili.com/read/cv28464268/) [B站bilibili](https://www.bilibili.com/video/BV19u4y1x7CS)
[专栏文章流水并行优化](https://www.bilibili.com/read/cv28623151/) [B站bilibili](https://www.bilibili.com/video/BV1LB4y1Z74v)
|[专栏文章OpenMP程序编写]() [B站bilibili](https://www.bilibili.com/video/BV19ntJeMEpD/)
[专栏文章OpenMP版矩阵乘]() [B站bilibili](https://www.bilibili.com/video/BV1hstJeeEpc/)
[专栏文章并行区扩张]() [B站bilibili](https://www.bilibili.com/video/BV1its8eYEQh/)
[专栏文章并行区合并]() [B站bilibili](https://www.bilibili.com/video/BV1qts8eYEiH/)
[专栏文章数据填充避免伪共享]() [B站bilibili](https://www.bilibili.com/video/BV1Z4s8eAEp9/)
[专栏文章循环向量化]() [B站bilibili](https://www.bilibili.com/video/BV1hjxWe6EDy/)
[专栏文章循环嵌套合并调度]() [B站bilibili](https://www.bilibili.com/video/BV13jxWe6EAP/)
[专栏文章线程调度配置策略]() [B站bilibili](https://www.bilibili.com/video/BV1bh2tYJEq3/)
[专栏文章串并行切换]() [B站bilibili](https://www.bilibili.com/video/BV1ub2tYDEXm/)
[专栏文章线程数设置优化]() [B站bilibili](https://www.bilibili.com/video/BV1qM2ZY2EwV/)
[专栏文章分析隐式同步]() [B站bilibili](https://www.bilibili.com/video/BV1K9yGYaEAs/)
[专栏文章消除隐式同步]() [B站bilibili](https://www.bilibili.com/video/BV1N9yGYhEea/)
[专栏文章流水并行示例]() [B站bilibili](https://www.bilibili.com/video/BV1sUS8YxEJ3/)
[专栏文章流水并行粒度]() [B站bilibili](https://www.bilibili.com/video/BV1qNShYyE4f/)|[slideslide](slides/Chapter9.pptx) [pdfPDF](slides/Chapter9.pdf) [codecode](code/Chapter9/)| |10 CUDA程序优化|[专栏文章CUDA程序优化(一)](https://www.bilibili.com/read/cv28626902/) [B站bilibili](https://www.bilibili.com/video/BV1pB4y1f7Md)
[专栏文章CUDA程序优化(二)](https://www.bilibili.com/read/cv28755607/) [B站bilibili](https://www.bilibili.com/video/BV1C94y187iq)
[专栏文章CUDA程序优化(三)](https://www.bilibili.com/read/cv28755625/) [B站bilibili](https://www.bilibili.com/video/BV1Kw411z7Wd)
[专栏文章CUDA程序优化(四)](https://www.bilibili.com/read/cv28815789/) [B站bilibili](https://www.bilibili.com/video/BV1G84y1R7Ak)
|[专栏文章CUDA程序编写]() [B站bilibili](https://www.bilibili.com/video/BV1j8DSYPEpp/)
[专栏文章线程结构优化]() [B站bilibili](https://www.bilibili.com/video/BV1aoDUYoEoq/)
[专栏文章分支优化]() [B站bilibili](https://www.bilibili.com/video/BV1unmDYEELs/)
[专栏文章访存优化(1)](https://www.bilibili.com/video/BV1unmDYEEMA/) [B站bilibili]()
[专栏文章访存优化(2)]() [B站bilibili](https://www.bilibili.com/video/BV1AGBxYLEjh/)
[专栏文章数据预取]() [B站bilibili](https://www.bilibili.com/video/BV11PBxYSEot/)
[专栏文章循环展开]() [B站bilibili](https://www.bilibili.com/video/BV1mABxYHEim/)
|[slideslide](slides/Chapter10.pptx) [pdfPDF](slides/Chapter10.pdf) [codecode](code/Chapter10/)| |11 MPI程序优化|[专栏文章MPI程序简介(一)](https://www.bilibili.com/read/cv29026871/) [B站bilibili](https://www.bilibili.com/video/BV1cj411a7Sb)
[专栏文章MPI程序简介(二)](https://www.bilibili.com/read/cv29589746/) [B站bilibili](https://www.bilibili.com/video/BV1ra4y1m7JP)
[专栏文章数据划分优化](https://www.bilibili.com/read/cv30127910/) [B站bilibili](https://www.bilibili.com/video/BV1Lc411b7Fw)
||[slideslide](slides/Chapter12.pptx) [pdfPDF](slides/Chapter12.pdf) [codecode](code/Chapter11/)| |12 多层次并行程序优化|||[codecode](code/Chapter12/)| |||| ## 附录 ### LLVM编译器入门 |||| |---|---|---| |章节名称|视频课程|PPT| |1 LLVM整体设计|[B站bilibili](https://www.bilibili.com/video/BV18j411B7TF)|[zhihu知乎](https://zhuanlan.zhihu.com/p/689182997)| |2 Clang前端|[B站bilibili](https://www.bilibili.com/video/BV11j411B7XZ)|[zhihu知乎](https://zhuanlan.zhihu.com/p/689603871)| |3 IR优化|[B站bilibili](https://www.bilibili.com/video/BV1fX4y1x79Y)|[zhihu知乎](https://zhuanlan.zhihu.com/p/20119958394)| |4 代码生成(上)|[B站bilibili](https://www.bilibili.com/video/BV1tN411B71r)|[zhihu知乎](https://zhuanlan.zhihu.com/p/20121961367)| |5 代码生成(下)|[B站bilibili](https://www.bilibili.com/video/BV1YG411o7AQ)|[zhihu知乎](https://zhuanlan.zhihu.com/p/20123645994)| ### 循环优化专题 |||| |---|---|---| |章节名称|视频课程|课件文章| |1 循环展开和压紧|[B站bilibili](https://www.bilibili.com/video/BV1HB4y1x7zv)|[slideslide](slides/1循环展开.pptx) [pdfPDF](slides/1循环展开.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/720113750)| |2 循环合并|[B站bilibili](https://www.bilibili.com/video/BV1CD4y1B7H2)|[slideslide](slides/2循环合并.pptx) [pdfPDF](slides/2循环合并.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/720117194)| |3 循环分布|[B站bilibili](https://www.bilibili.com/video/BV1Z8411t7dC)|[slideslide](slides/3循环分布.pptx) [pdfPDF](slides/3循环分布.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/568326883)| |4 循环交换|[B站bilibili](https://www.bilibili.com/video/BV13d4y1C7ca)|[slideslide](slides/4循环交换.pptx) [pdfPDF](slides/4循环交换.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/603088713)| |5 循环不变量外提|[B站bilibili](https://www.bilibili.com/video/BV1Ud4y1b7Zc)|[slideslide](slides/5循环不变量外提.pptx) [pdfPDF](slides/5循环不变量外提.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/720156712)| |6 循环分段|[B站bilibili](https://www.bilibili.com/video/BV1Zs4y1s7zn)|[slideslide](slides/6循环分段.pptx) [pdfPDF](slides/6循环分段.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/603106704)| |7 循环分块|[B站bilibili](https://www.bilibili.com/video/BV1gv4y1Y7ed)|[slideslide](slides/7循环分块.pptx) [pdfPDF](slides/7循环分块.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/609700144)| |8 循环分裂|[B站bilibili](https://www.bilibili.com/video/BV1mb411f7wK)|[slideslide](slides/8循环分裂.pptx) [pdfPDF](slides/8循环分裂.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/612902532)| |9 循环倾斜|[B站bilibili](https://www.bilibili.com/video/BV1uV4y1f7cJ)|[slideslide](slides/9循环倾斜.pptx) [pdfPDF](slides/9循环倾斜.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/622604808)| ### 其他 |||| |---|---|---| |章节名称|视频课程|课件文章| |HIP代码自动生成工具C2HIPC|[B站bilibili](https://www.bilibili.com/video/BV1Jg411Q7z6/)|| # 深度学习编译器设计 随着大模型的发展与应用,深度学习编译器的内涵和外延逐步扩展,本书分析对比了多种深度学习编译器的特性,并整理概括出深度学习编译器的整体设计作为核心内容,分章节对深度学习编译器的功能模块进行介绍,同时也对深度学习模型、深度学习硬件平台等前置理论知识进行概括总结。 本书旨在通过循序渐进、由上而下的方式,让读者了解深度学习编译器的来龙去脉,从深度学习编译器产生背景到设计理念,从深度学习编译器的模型输入到代码生成,为深度学习编译器的研发和优化提供理论支持。同时,本书在对深度学习编译器各功能模块进行介绍时,也综合了计算图优化、内存分配与优化、算子选择与生成、代码生成与优化、自动并行及模型推理等领域的最新研究成果,这部分内容可以为读者的论文写作及科研分析提供思路。

深度学习编译是一个博大精深且正在快速发展的领域,下面内容旨在分享先进编译实验室团队在学习深度学习编译领域过程中的对顶会论文、主流编译器等的学习心得。 ## 分享目录 |||| |---|---|---| |内容板块|分享视频|课件文章| |1 深度学习概述|[B站深度学习的产生与发展](https://www.bilibili.com/video/BV1AM411P7JG/)
[B站深度神经网络的结构](https://www.bilibili.com/video/BV1bD4y1G7oV/)
[B站神经网络的运行机制](https://www.bilibili.com/video/BV1xs4y1b7nt/)
[B站CNN-卷积神经网络(一)](https://www.bilibili.com/video/BV1iL411o7iz/)
[B站CNN-卷积神经网络(二)](https://www.bilibili.com/video/BV1bL411o74W/)|[pdf深度学习概述PDF](slides/2-1深度学习概述.pdf)[zhihu深度学习的产生与发展 知乎](https://zhuanlan.zhihu.com/p/605627284)[zhihu深度神经网络的结构 知乎](https://zhuanlan.zhihu.com/p/608212097)[zhihu神经网络的运行机制 知乎](https://zhuanlan.zhihu.com/p/608221436)[zhihuCNN-卷积神经网络 知乎](https://zhuanlan.zhihu.com/p/613894668)| |2 深度学习编译基础|[B站深度学习框架发展(一)](https://www.bilibili.com/video/BV1iD4y117td)
[B站深度学习框架发展(二)](https://www.bilibili.com/video/BV1dt4y1F7Cn)
[B站深度学习框架发展(三)](https://www.bilibili.com/video/BV1Qe4y1z78o)
[B站深度学习硬件平台](https://www.bilibili.com/video/BV1JY411Q72M)
[B站深度学习编译发展概述](https://www.bilibili.com/video/BV1kS4y1t7JH)
[B站深度学习编译系统概述](https://www.bilibili.com/video/BV1kS4y1t7JH)
[B站深度学习自动微分](https://www.bilibili.com/video/BV1fs4y197km)
|[pdf深度学习框架发展PDF](slides/2-3深度学习框架发展3.pdf)[pdfslides](slides/2-3深度学习框架发展3.pdf)[zhihu知乎](https://zhuanlan.zhihu.com/p/573649638)
[pdf深度学习硬件平台PDF](slides/2-4深度学习硬件平台.pdf)[pdfslides](slides/2-4深度学习硬件平台.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/601837693)
[zhihu深度学习编译发展概述 知乎](https://zhuanlan.zhihu.com/p/573632566)
[pdf深度学习编译系统概述PDF](slides/2-6深度学习编译系统.pdf)[pdfslides](slides/2-6深度学习编译系统.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/573626535)
[pdf深度学习自动微分PDF](slides/2-7自动微分.pdf)[pdfslides](slides/2-7自动微分.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/624451377)
| |3 深度学习编译基础架构MLIR|[B站深度学习编译基础架构MLIR](https://www.bilibili.com/video/BV1Hd4y1U7mb)
[B站论文分享:基于MLIR的GPU代码生成](https://www.bilibili.com/video/BV1ga411N736)
|[pdf深度学习编译基础架构MLIR PDF](slides/3-1MLIR_PPT.pdf)[pdfslides](slides/3-1MLIR_PPT.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/651886385)
| |4 深度学习编译器TVM|[B站TVM概述](https://www.bilibili.com/video/BV14N4y1c7zq)
[B站TVM编译流程与中间表示分析(一)](https://www.bilibili.com/video/BV1v3411U7fM)
[B站TVM编译流程与中间表示分析(二)](https://www.bilibili.com/video/BV1624y1v7wx)
[B站TVM自动调度算法AutoTVM](https://www.bilibili.com/video/BV1114y1e7FK)
[B站TVM自动调优工具Ansor](https://www.bilibili.com/video/BV1m14y1Y7LN)
[B站Ansor优化算子代码解读(一)](https://www.bilibili.com/video/BV1ih4y127fX)
[B站Ansor优化算子代码解读(二)](https://www.bilibili.com/video/BV1C44y1c7WL)
[B站Ansor优化算子代码解读(三)](https://www.bilibili.com/video/BV1e94y167Qy)
[B站Ansor优化算子代码解读(四)](https://www.bilibili.com/video/BV1C8411X7BS)
[B站TVM量化框架(一)](https://www.bilibili.com/video/BV1ph4y1U7Dy)
[B站TVM量化框架(二)](https://www.bilibili.com/video/BV1aN4y1R7MY)
[B站TVM量化框架(三)](https://www.bilibili.com/video/BV1ur4y197zj)
[B站TVM量化框架(四)](https://www.bilibili.com/video/BV18w411S7Mh)|[pdfTVM编译流程与中间表示分析PDF](slides/4-2TVM%20IR流程.pdf)[pdfslides](slides/4-2TVM%20IR流程.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/596526031)
| |5 OpenAI Triton编译器|[B站Triton概述](https://www.bilibili.com/video/BV1Kr421M7rt)
[B站Triton安装](https://www.bilibili.com/video/BV1b9W8eQEW3)
[B站Triton程序编写](https://www.bilibili.com/video/BV154421S7TE)
[B站Triton源码结构](https://www.bilibili.com/video/BV1SHxWeTEMe/)
[B站Triton调试方法及工具(上)](https://www.bilibili.com/video/BV1aY2CYAEhy/)
[B站Triton调试方法及工具(下)](https://www.bilibili.com/video/BV1m6C1YsEn1/)
[B站Triton编译流程](https://www.bilibili.com/video/BV1Di2CYcEba/)
[B站Triton IR剖析(上)](https://www.bilibili.com/video/BV1EwzyYZELz/)
[B站Triton IR剖析(下)](https://www.bilibili.com/video/BV1AHCJYkESY/)
|[pdfTriton概述slides](slides/5-1Triton概述.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/750277836)
[pdfTriton安装PDF](slides/5-2Triton安装方式.pdf)[pdfslides](slides/5-2Triton安装方式.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/751581417)
[pdfTriton程序编写PDF](slides/5-4Triton程序编写.pdf)[pdfslides](slides/5-4Triton程序编写.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/3836664295)
[pdfTriton源码结构PDF](slides/5-3Triton源码结构.pdf)[pdfslides](slides/5-3Triton源码结构.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/2764427002)
[pdfTriton调试方法及工具PDF](slides/5-5Triton调试.pdf)[pdfslides](slides/5-5Triton调试.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/2440320343)
[pdfTriton编译流程PDF](slides/5-6Triton编译流程.pdf)[pdfslides](slides/5-6Triton编译流程.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/2768070031)
[pdfTriton IR 剖析PDF](slides/5-7TritonIR剖析.pdf)[pdfslides](slides/5-7TritonIR剖析.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/14987459468)
| |6 深度学习编译优化
|[B站论文分享:图算融合Apollo](https://www.bilibili.com/video/BV1Do4y1L7Xd)
[B站论文分享:计算密集型算子融合Chimera](https://www.bilibili.com/video/BV1Y6421G7kL)
[B站论文分享:机器学习访存密集计算编译优化框架Astitch](https://www.bilibili.com/video/BV1Ev4y1Q7L4)
[B站论文分享:算子调度优化Rammer](https://www.bilibili.com/video/BV1LM411u7nE)
[B站论文分享:计算图访存调度优化Welder](https://www.bilibili.com/video/BV1Tu4y1y7hN)
[B站论文分享:动态控制流编译优化Cocktailer](https://www.bilibili.com/video/BV1Kh4y1P7Rg)
[B站论文分享:动态神经网络编译优化BrainStorm](https://www.bilibili.com/video/BV1FC4y1R7pu)
[B站论文分享:动态shape深度学习算子自动调优DietCode](https://www.bilibili.com/video/BV1RP4y167P4)
[B站论文分享:动态shape深度学习编译器DISC](https://www.bilibili.com/video/BV16R4y1U7J5)
[B站论文分享:深度学习编译接口FreeTensor](https://www.bilibili.com/video/BV1uV4y1M7dQ)
|[pdf论文分享:图算融合Apollo PDF](slides/6-1Apollo.pdf)[pdfslides](slides/6-1Apollo.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/622494022)
[pdf论文分享:机器学习访存密集计算编译优化框架Astitch PDF](slides/6-3AStitch.pdf)[pdfslides](slides/6-3AStitch.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/593171346)
[pdf论文分享:算子调度优化Rammer PDF](slides/6-4Rammer.pptx)[pdfslides](slides/6-4Rammer.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/616050345)
[pdf论文分享:动态控制流编译优化Cocktailer PDF](slides/6-6动态控制流优化.pdf)[pdfslides](slides/6-6动态控制流优化.pptx)
[pdf论文分享:动态shape深度学习算子自动调优DietCode PDF](slides/6-8DietCode.pdf)[pdfslides](slides/6-8DietCode.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/601937783)
[pdf论文分享:动态shape深度学习编译器DISC PDF](slides/6-9动态模型编译.pdf)[pdfslides](slides/6-9动态模型编译.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/595830878)
| |7 自动并行|[B站并行划分概述](https://www.bilibili.com/video/BV1wo4y1L7WJ)
[B站论文分享:自动并行Alpa](https://www.bilibili.com/video/BV11j41177TQ)
[B站论文分享:自动并行AlpaServe](https://www.bilibili.com/video/BV1wc411m7ki)
[B站论文分享:自动并行AvgPipe](https://www.bilibili.com/video/BV1rw41137QG)
[B站论文分享:并行程序自动转换](https://www.bilibili.com/video/BV1sa4y1C7p7)
[B站论文分享:高性能计算领域大语言模型HPC-Coder](https://www.bilibili.com/video/BV1e4421c7Gk)
[B站论文分享:自动并行FlexFlow](https://www.bilibili.com/video/BV1wg411H78v)
[B站论文分享:自动并行CoCoNet](https://www.bilibili.com/video/BV1Nv4y1j78t)
[B站论文分享:新型注意力算法FlashAttention](https://www.bilibili.com/video/BV1zs4y1J7tb)
[B站论文分享:数据并行通信优化MG-WFBP](https://www.bilibili.com/video/BV1hj411Z7SS)
[B站论文分享:自动并行Merak](https://www.bilibili.com/video/BV1T94y1C7i4)
|[pdf并行划分概述PDF](slides/7-1自动并行-并行划分.pdf)[pdfslides](slides/7-1自动并行-并行划分.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/624687216)
[pdf论文分享:高性能计算领域大语言模型HPC-Coder PDF](slides/7-6HPC大模型.pdf)[pdfslides](slides/7-6HPC大模型.pptx)
[pdf论文分享:自动并行CoCoNet PDF](slides/7-8overlapping.pdf)[pdfslides](slides/7-8overlapping.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/615806751)
[pdf论文分享:新型注意力算法FlashAttention PDF](slides/7-9FlashAttention.pdf)[pdfslides](slides/7-9FlashAttention.pptx)[zhihu知乎](https://zhuanlan.zhihu.com/p/618533434)
| |8 深度学习模型压缩|[B站深度学习模型压缩概述](https://www.bilibili.com/video/BV1ht4y1P73i)
[B站论文分享:无数据模型量化ZeroQ](https://www.bilibili.com/video/BV1614y1T7FS)
[B站模型压缩方法:模型蒸馏](https://www.bilibili.com/video/BV1eb411971p)
[B站模型压缩方法:剪枝](https://www.bilibili.com/video/BV1pg4y1J73p)
[B站模型压缩方法:量化](https://www.bilibili.com/video/BV1bL411U747)
|[zhihu论文分享:无数据模型量化ZeroQ 知乎](https://zhuanlan.zhihu.com/p/598849539)
[pdf模型压缩方法PDF](slides/8-3压缩方法.pdf)[pdfslides](slides/8-3压缩方法.pptx)[zhihu知识蒸馏 知乎](https://zhuanlan.zhihu.com/p/608197552)[zhihu剪枝 知乎](https://zhuanlan.zhihu.com/p/609126518)[zhihu量化 知乎](https://zhuanlan.zhihu.com/p/619914824)
| # AI基础设施实操培训系列课程 AI基础设施实操培训系列课程涵盖大模型的训练、微调、部署、优化四大模块,系统讲解从大模型构建到高效上线的全流程实战技巧。结合实际案例,通过一站式人工智能课程,帮助大家全面提升AI工程实践能力。 ## 分享目录 |||| |---|---|---| |内容板块|分享视频|课件文章| |训练篇|[B站大模型训练:从零手搓第一个GPT](https://www.bilibili.com/cheese/play/ss188556314)
01 神经网络基础
02 深度学习的进化
03 大语言模型
04 faster-RCNN算法原理
05 faster-RCNN实战
06 YOLOv11实战
06 文本情感分类实战-1
07 文本情感分析实战-2
09 大模型预训练基础-1
10 大模型预训练基础-2
11 数据准备-1
12 数据准备-2
13 模型结构-1
14 模型结构-2
15 预训练任务实现
16 训练优化-1
17 训练优化-2
18 性能评估|| |微调篇|[B站微调工程师通关计划:从调参小白到领域模型架构师](https://www.bilibili.com/cheese/play/ss160199851)
01 大模型微调概述
02 模型数据收集与处理
03 数据预处理理论
04 启发式规则
05 评估模型过滤-1
06 评估模型过滤-2
07 完全匹配去重
08 近似匹配去重-1
09 近似匹配去重-2
10 大模型微调工具与主流框架介绍
11 微调框架实战-1
12 微调框架实战-2
13 微调方法-1
14 微调方法-2
15 人类对齐
16 大模型评估与问题解决-1
17 大模型评估与问题解决-2
18 法律大模型强化学习实战
19 法律大模型评估实战-1
20 法律大模型评估实战-2|| |部署篇|[B站零基础玩转大模型推理:7天工程化入门](https://www.bilibili.com/cheese/play/ss130324601)
01 大模型推理挑战
02 主流推理引擎对比
03 大模型推理瓶颈分析
04 vLLM环境搭建
05 vLLM使用入门
06 vLLM推理分析
07 LoRA模型部署及实操
08 多模态模型部署及实操
09 vLLM量化模型支持
10 模型量化
11 KV Cache量化
12 性能测试指标-1
13 性能测试指标-2
14 性能测试工具
15 性能分析
16 算子优化
17 LLM引擎参数-1
18 LLM引擎参数-2
19 推测解码与PD分离
20 DeepSeek可视化部署-1
21 DeepSeek可视化部署-2
22 RAG本地部署-1
23 RAG本地部署-2
24 vLLM+Dify构建Agent应用-1
25 vLLM+Dify构建Agent应用-2
26 vLLM+Dify构建Agent应用-3 || |优化篇|[B站01 Triton在PyTorch中的角色](https://www.bilibili.com/video/BV1R5odYFEV2/)
[B站02 内核性能分析工具](https://www.bilibili.com/video/BV1ZUQ1YtEwP)
[B站03 Triton编译器及Pass管理器](https://www.bilibili.com/video/BV1VYQdYJEBb)
[B站04 Triton算子关键参数优化](https://www.bilibili.com/video/BV1miotY3E2D)
[B站05 Triton算子开发](https://www.bilibili.com/video/BV193fFYkE7P)
[B站05 Triton访存合并解析](https://www.bilibili.com/video/BV1j6dRY8Erc)
[B站07 Triton布局介绍](https://www.bilibili.com/video/BV1F45HzLEHo)
[B站08 Triton访存合并优化](https://www.bilibili.com/video/BV1gzL2zTEq7)
[B站09 编译优化实践(一):代数变换](https://www.bilibili.com/video/BV1UQEjz4EzX)
[B站10 编译优化实践(二):冗余去除](https://www.bilibili.com/video/BV14TEczGE4i)
[B站11 Triton归约操作解析](https://www.bilibili.com/video/BV16fj8zGEjD)
[B站12 Triton MMA操作解析:Tensor Core & MMA指令](https://www.bilibili.com/video/BV1LnTszhEdY)
[B站13 Triton MMA操作解析:Pipeline & Prefetch](https://www.bilibili.com/video/BV1vyN1zmEVG)
|| # AI应用系列课程 AI应用 ## 分享目录 |||| |---|---|---| |内容板块|分享视频|课件文章| |AI智能创作实战|[B站赋能未来工作流,AI智能创作实战](https://www.bilibili.com/cheese/play/ss147499826)
01 AI+Word:从学术到职场的高效文档革命
02 AI+Excel让你效率飙升!
03 AI驱动的高效PPT创作-1
04 AI驱动的高效PPT创作-2
05 AI辅助创作思维导图与流程图
06 通义万象AI工具介绍与使用
07 即梦AI工具介绍与使用
08 可灵AI工具介绍与使用
09 如何在移动端生成视频
10 SD安装配置指南
11 SD快速作图指南
12 ControlNet:实现精准控图
13 AnimateDiff与SadTalker创新多媒体生成
14 数字创作与设计创新
15 GPT-sovits使用教学
16 语音转文字Whisper模型介绍
17 腾讯混元3D介绍
18 Client AI辅助编程
19 零基础搭建本地知识库-1
20 零基础搭建本地知识库-2|| |AI for Work|[B站拥抱AI Agent~全网最详细的OpenManus本地部署教程](https://www.bilibili.com/video/BV1w4XVY7Eou)
[B站突破常规!Julius 借 “交互式分析”,革新 AI 数据](https://www.bilibili.com/video/BV1c7DfYPEgi)
[B站小白1分钟搞定!全网最详细的Deepseek的神仙级用法](https://www.bilibili.com/video/BV1jb9iYMEBu)
[B站什么???马上开组会了~ PPT 还没做!](https://www.bilibili.com/video/BV19aDfYXETT)
[B站Deepseek+word打造会思考的智能文档](https://www.bilibili.com/video/BV1ALQvY3E9a)
[B站AI+Excel:如何让工作效率原地飞起](https://www.bilibili.com/video/BV1JCQeYAEw8)
|| |AI for Paper|[B站01 规划论文选题与结构](https://www.bilibili.com/video/BV1NddtYvEb4)
[B站02 高效搜集整理文献](https://www.bilibili.com/video/BV1FNdbYbE4b)
[B站03 可视化数据图表制作](https://www.bilibili.com/video/BV1n3dgYrEcf)
[B站04 辅助写作与论文润色](https://www.bilibili.com/video/BV1fKdbYoEm4)
[B站05 自动排版与文献格式规范](https://www.bilibili.com/video/BV1PZdtYPEER)
[B站06 答辩PPT与讲稿生成](https://www.bilibili.com/video/BV1kcdbYcEb6)
[B站07 毕业答辩问答模拟](https://www.bilibili.com/video/BV1g6dAYzEiq)
|| weixin_logo