置顶|本站文章索引
关于我
来着何人,报上姓名。俺是牛大帅,是一名三维视觉算法工程师,以前从事SLAM,现在主要从事3dgs重建,神经辐射场,图像和视频的AIGC,目前在自动驾驶领域当牛马,也可以找我交流CSGO和OW(上勾拳!)。
以后会在这边分享一些技术,或者一些杂谈。
联系方式
如果你想要与我交流,可以通过以下方式联系我:
- GitHub: https://github.com/chengYi-xun
- 邮箱: ldq4399@163.com
感谢你的阅读,希望我们可以一起学习和成长!
生成式人工智能
通用理论
- 笔记|生成模型(一):一些概率论的基础概念和理论
- 笔记|生成模型(二):生成模型的技术路线总览
- 笔记|生成模型(三):生成对抗理论
- 笔记|生成模型(四):变分自编码器理论
- 笔记|生成模型(五):DDPM理论
- 笔记|生成模型(六):DDIM理论
- 笔记|生成模型(七):Score-Based理论
- 笔记|生成模型(八):SDE统一DDPM和SMLD
- 笔记|生成模型(九):Classifier Guidance 理论与实现
- 笔记|生成模型(十):Classifier-Free Guidance 理论与实现
- 笔记|生成模型(十一):UIT和DiT架构详解
- 笔记|生成模型(十二):Normalizing Flow理论与实现
- 笔记|生成模型(十三):Flow Matching理论与实现
- 笔记|生成模型(十四):Stable Diffusion 3 架构解析 (MMDiT)
- 笔记|生成模型(十五):Flux 架构解析
强化学习
- 笔记|强化学习(一):强化学习基础与策略梯度
- 笔记|强化学习(二):信任区域与近端策略优化 (从 TRPO 到 PPO)
- 笔记|强化学习(三):大模型对齐的另一条路:DPO (Direct Preference Optimization)
- 笔记|强化学习(四):大模型在线 RL 破局者:GRPO 算法详解
- 笔记|强化学习(五):Flow-GRPO 与图像生成应用(基于 Flux 的代码解析)
- 笔记|强化学习(六):DAPO:从 GRPO 到大规模推理 RL 的工程实践
- 笔记|强化学习(七):GRPO 的三重面孔——从 2-GRPO 到 f-GRPO 与 GIFT
- 笔记|强化学习(八):SuperFlow 与图像生成 RL 前沿(2026)
- 笔记|强化学习(九):DanceGRPO 与 MixGRPO——视觉生成 GRPO 的扩展与加速
- 笔记|强化学习(十):奖励模型基础——从传统 RL 到大模型与视觉生成
世界模型
- 笔记|世界模型(一):什么是世界模型?从认知科学到深度学习
- 笔记|世界模型(二):Dreamer 系列——在想象中学习控制
- 笔记|世界模型(三):JEPA——在嵌入空间预测世界
- 笔记|世界模型(四):视频生成即世界模拟——从 Sora 到 Genie 与 Cosmos
- 笔记|世界模型(五):物理化的视频生成——让模型理解牛顿定律
- 笔记|世界模型(六):自动驾驶世界模型——从视频预测到占用预测
杂谈
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 牛大帅的个人博客!
评论