文章
35
标签
35
分类
2
首页
归档
标签
分类
友链
牛大帅的个人博客
首页
归档
标签
分类
友链
八月 2025
文章总览 - 21
2025
2025-08-20
笔记|强化学习(五):Flow-GRPO 与图像生成应用(基于 Flux 的代码解析)
2025-08-19
笔记|强化学习(四):大模型在线 RL 破局者:GRPO 算法详解
2025-08-18
笔记|强化学习(三):大模型对齐的另一条路:DPO (Direct Preference Optimization)
2025-08-17
笔记|强化学习(二):信任区域与近端策略优化 (从 TRPO 到 PPO)
2025-08-16
笔记|强化学习(一续):从 REINFORCE 到 Actor-Critic
2025-08-16
笔记|强化学习(一):强化学习基础与策略梯度
2025-08-15
笔记|生成模型(十五):Flux 架构解析
2025-08-14
笔记|生成模型(十四):Stable Diffusion 3 架构解析 (MMDiT)
2025-08-13
笔记|生成模型(十三):Flow Matching理论与实现
2025-08-12
笔记|生成模型(十二):Normalizing Flow理论与实现
1
2
3
牛大帅
欢迎来到我的博客
文章
35
标签
35
分类
2
Follow Me
公告
欢迎来到牛大帅的猪舍~(昼伏夜出型)
最新文章
笔记|强化学习(十一):V-GRPO——用变分方法让扩散模型的在线 RL 变得简单
2026-06-11
笔记|世界模型(六):自动驾驶世界模型——从视频预测到占用预测
2026-04-06
笔记|世界模型(五):物理化的视频生成——让模型理解牛顿定律
2026-04-06
笔记|世界模型(四):视频生成即世界模拟——从 Sora 到 Genie 与 Cosmos
2026-04-06
笔记|世界模型(三):JEPA——在嵌入空间预测世界
2026-04-06
分类
Notes
28
Tutorials
7
标签
Vista
Generative models
Generative models theory
RSSM
OccWorld
DriveDreamer
Self-Supervised Learning
Diffusion Models
Survey
Cosmos
自我介绍
Generative Model
Physics-Grounded
Genie
DPO
Diffusion models
Video Generation
Reinforcement Learning
GAIA-1
Stable Diffusion
NewtonGen
thinking
Flow Matching
Deep learning
Autonomous Driving
JEPA
Dreamer
Flux
PhysGen
Sora
Model-based RL
PhysDreamer
Latent Space
World Model
V-JEPA
归档
六月 2026
1
四月 2026
11
八月 2025
21
七月 2025
2
网站资讯
文章数目 :
35
已运行时间 :
本站访客数 :
本站总访问量 :
最后更新时间 :