Index 图解综述合集 May 2026
讲清楚"为什么我们可以从样本里学到分布"、"为什么微调有效"、"为什么 flow matching 比扩散更简单" 这一类前置直觉。每一篇都从最朴素的版本写起,再逐层加复杂度。
从大数定律到高维薄球壳 · ML 入门者的概率论散文 LLN → High-Dim Concentration
从硬币、骰子、蒙特卡洛、mini-batch SGD 的大数定律出发,一路推到 高维正态几乎全部质量都集中在一层薄球壳上—— 再把这件反直觉的事接到 flow matching 与扩散模型里"噪声看起来居然几乎一样"的实践里。 flow-matching 那一篇的前置读物。
SFT 是什么 · 给初学者的可交互讲解 Supervised Fine-Tuning
预训练模型见过整个互联网,但不知道怎么"按指令回答"。 SFT 用几万条 (prompt, answer) 把它扭到对话姿势——本文用可交互玩具讲清这一过程。
从 SFT 到 LoRA · 给入门者的可交互讲解 Low-Rank Adaptation
全量 SFT 要更新几十亿参数。LoRA 只在每一层插两个小矩阵, 就达到几乎一样的效果——把"低秩"这件事拆给你看。
球壳上的散步 · 拆解一句关于 Flow Matching 的话 Flow Matching
一句教科书式的论断 —— "flow matching 学的是从噪声到数据的速度场" —— 听起来简单,落到公式上却处处是坑。 本文沿着一句话拆出概率路径、条件向量场、与扩散的等价性。
从"一颗高斯椭球如何投影到屏幕"开始,逐层讲清 3DGS 的所有构件,以及之后几次对它本体的重大改写: 抗锯齿、压缩、表面化、四面体网格化、ray tracing。
3D 高斯泼溅 · 从第一性原理出发 From First Principles
约 14,000 字的图解长文:Gaussian 原子、协方差的 RSSᵀRᵀ 重参数化、EWA 投影、球谐颜色、瓦片光栅化器、 致密化的克隆/分裂/裁剪 —— 一层一层拆开来讲。Part Ⅱ 把 Mip-Splatting、2DGS、GES、3DGS-MCMC、Scaffold-GS、SuGaR 串成一条线。
How 3DGS got fast · a CUDA story CN/EN Rendering Efficiency
从 2023 年的原版 CUDA 实现,到 2026 年所有提升渲染 / 训练效率的关键工作。 深入瓦片调度、排序、α 合成早终止——把"为什么 3DGS 能 100 倍快过 NeRF"讲到底。中英双语。
3DGS 抗锯齿之路 · A Visual Survey (2023 – 2026) Antialiasing
走过 3DGS 历史上的每一次锯齿/弹跳/膨胀缺陷,以及对应的修复方案: Mip-Splatting 的两道滤波器、Analytic-Splatting、Multi-Scale GS、GES 等。
3DGS 压缩综述 CN/EN Compression Survey
一份 2023 → 2026 的教学型综述:剪枝、量化、球谐、锚点结构、熵编码、工业格式。 把 1 GB 的场景压到 30 MB,每一道杠杆都拆给你看。中英双语。
3DGS × Surface · 表面与几何重建 Surface Reconstruction
2023–2026 三年里所有把"模糊体素"拽回"实体表面"的工作:2DGS、SuGaR、PGSR、GOF、Sugar-Mesh 等。 为什么显式表面对下游应用(仿真、AR、3D 打印)几乎是必须的。
3DGS × 四面体网格 · 入门者的交互式综述 Tetrahedral Grids
高斯椭球与四面体剖分的交叉工作综述:把"散点"和"体网格"两种几何表示拼到一起的尝试。 含可交互 demo。
光线追踪高斯 · 3DGRT / 3DGUT / 3DGRUT 深挖 Gaussian Ray Tracing
从 NeRF 与 3DGS 一路讲到 NVIDIA 把 3D 高斯接到光线追踪管线的 3DGRT 系列工作, 及其衍生宇宙:什么时候必须用 ray tracing 而不是光栅化。
重光照、SLAM、城市级、前馈重建、动画化的人、可变形场景 —— 每一个方向都把"3DGS 必须改成什么样" 和"以前 NeRF 时代是怎么做的"讲清楚。
3DGS Relighting 综述 Relighting — 2023 → 2026
从 2023 年 3DGS 诞生到 2026 年最新前沿的中文长文: GaussianShader / Relightable 3DGS / GS-IR / IRGS / Ref-Gaussian / Spec-Gaussian / GUS-IR … 一篇连续读完——把"为什么 3DGS 烤进去的是颜色而不是材质"和后来如何拆出 BRDF、normal、environment 讲到底。
3DGS SLAM · A Beginner's Survey (2023 → 2026) CN/EN Visual SLAM
相机不知道自己在哪里时,3DGS 当 SLAM 后端是什么样:SplaTAM、MonoGS、Gaussian-SLAM、Photo-SLAM … 位姿与地图的联合优化怎么写,闭环怎么做,含交互式 demo。
大规模 3DGS 综述 · 城市、航拍、自驾 Large-Scale 3DGS
把 3DGS 推过 1 km 时会断在哪里,以及三大类修补方法:空间分块(VastGaussian / Hierarchical-GS)、 锚点 LOD(Octree-GS / CityGaussian)、流式加载。覆盖 2023.7 – 2026.5。
生成式 3DGS 综述 · 2023 → 2026 Generative 3DGS
3DGS 怎么成为现代 3D 生成的输出格式:SDS(DreamGaussian)、前馈大重建模型(LGM/GRM/LRM 系)、 原生 3D 扩散与稀疏体素上的 rectified flow(Trellis 及其后继 TRELLIS.2、Pixal3D)。 含交互式 demo 与代码片段。
Feedforward 3DGS · 从 3DGS 到 VGGT Feedforward Reconstruction
一次前向就吐出整个 3D 场景的家族:pixelSplat、MVSplat、GS-LRM、Splatter Image、再到 VGGT。 为什么"无需 per-scene 优化"这件事在 2024 之后才真正可行。
3DGS · 数字人综述 rewrite Avatars — Heads, Bodies, Hands
3DGS 怎么变成"会动、可驱动、可重光照"的数字人的标准表示——头、身体、手分别有什么坑。 rigged Gaussians 挂在 SMPL / FLAME / MANO 上、LBS 的梯度怎么走、 以及生产级系统(GaussianAvatars、HUGS、Animatable-GS、GART …)的工程细节。
可变形 3DGS · 2023–2026 学术综述 Deformable / 4D 3DGS
静态高斯如何变成"会随时间运动的场景":Deformable 3DGS、4D-GS、Spacetime Gaussians, 以及它们处理拓扑变化和长视频的不同思路。
把大模型推理 / 后训练吃满 HBM 带宽,以及当先验地图已经存在时 SLAM 该怎么改写—— 两份近期写就的、超出 3DGS 本体范畴的综述。
追逐 HBM · 推理与后训练加速综述 LLM / VLM / VLA / Diffusion / World-Model multi-page hub
一份面向有基础 ML 与一点 C++/CUDA 读者的多页教学综述:为什么现代加速几乎都在"追逐 HBM 带宽"。 Primer 起步,依次铺开 attention / KV cache / decoding / quantization / sparse-MoE / serving / tricks, 再走 post-training,最后落到 diffusion、VLM、VLA、world model 各分支上的差异。
数字孪生 SLAM · 当地图已经存在 new Digital-Twin-Anchored SLAM
传统 SLAM 假设"边建图边定位",但工厂、矿场、商场早已扫好一份稠密数字孪生。 这一份综述把"已知地图"这一约束加回 SLAM,看一整族变体如何重写 front-end、loop closure 与 back-end —— 与上面 3DGS-SLAM 互为镜像。