八维系统化体系
从拓扑、循环、布局、内存到并行、硬件、动态性与全局优化,构建完整的知识图谱。
🚧 持续更新中 (Work in Progress)
本文档处于活跃编写阶段,内容将随着 AI 编译器技术的发展而持续迭代。 最近更新:2026-01-26 | 欢迎在 GitHub 提交 Issue 或 PR 参与贡献。
| 章节 | 标题 | 核心关键词 |
|---|---|---|
| 00 | 全篇概述与阅读建议 | Fusion 本质, 章节概览 |
| 01 | 依赖拓扑 (Topology) | Vertical/Horizontal Fusion, FlashAttention, SwiGLU |
| 02 | 循环与迭代空间 (Loops) | Loop Fusion, Tiling, Software Pipelining |
| 03 | 数据布局与表示 (Layout) | Packing, Padding, Bufferization, Swizzling |
| 04 | 内存层次与分块 (Memory) | Multi-level Tiling, Memory Promotion, Double Buffering |
| 05 | 并行性与分布式 (Parallelism) | SIMD, Tensor Core, SPMD, Comm Overlap |
| 06 | 硬件适配与权衡 (Hardware) | Register Pressure, Rematerialization, Quantization |
| 07 | 控制流与动态性 (Dynamism) | Predication, Symbolic Shape, JIT Specialization |
| 08 | 跨层次全局优化 (Global) | Layout Propagation, Cost Model, Auto-tuning |
| 09 | 实战场景映射 (Scenarios) | LLM, MoE, Sparse, Edge, DLRM |
| 附录 | 主流编译器与参考 | XLA, TVM, Triton, MLIR, CANN |