avatar
文章
42
标签
72
分类
2

首页
归档
标签
分类
友链
AAA高老庄旺铺招租的个人博客
首页
归档
标签
分类
友链

四月 2026

文章总览 - 20
2026
2026-04-06
笔记|多模态融合(三):从 BLIP 到 BLIP-2——Q-Former 与交叉注意力的艺术
2026-04-06
笔记|多模态融合(二):CLIP——对比学习连接视觉与语言
2026-04-05
笔记|多模态融合(一):从特征拼接到注意力融合——多模态学习基础
2026-04-05
笔记|Vision Transformers Need Registers:用 Register Tokens 治愈 ViT 的"注意力伪影"
2026-04-05
笔记|多模态融合(一):VGGT——用一个 Transformer 完成所有 3D 视觉任务
2026-04-05
笔记|MemoryBank:用艾宾浩斯遗忘曲线赋予 LLM 长期记忆
2026-04-05
笔记|生成模型(二十四):DanceGRPO——视频生成的统一强化学习框架
2026-04-05
笔记|生成模型(二十三):SuperFlow 与图像生成 RL 前沿(2026)
2026-04-05
笔记|生成模型(二十二):GRPO 的三重面孔——从 2-GRPO 到 f-GRPO 与 GIFT
2026-04-05
笔记|生成模型(二十一):DAPO:从 GRPO 到大规模推理 RL 的工程实践
12
avatar
AAA高老庄旺铺招租
欢迎来到我的博客
文章
42
标签
72
分类
2
Follow Me
公告
欢迎来到AAA高老庄旺铺招租的猪舍~(昼伏夜出型)
最新文章
笔记|世界模型(七):前沿与统一视角——五条路线的收敛2026-04-06
笔记|世界模型(六):自动驾驶世界模型——从视频预测到占用预测2026-04-06
笔记|世界模型(五):物理化的视频生成——让模型理解牛顿定律2026-04-06
笔记|世界模型(四):视频生成即世界模拟——从 Sora 到 Genie 与 Cosmos2026-04-06
笔记|世界模型(三):JEPA——在嵌入空间预测世界2026-04-06
分类
  • Notes27
  • Tutorials15
标签
Contrastive Learning Video Generation 3D Vision Generative Model Model-based RL Fusion Transformer Multimodal Learning DPO LLaVA Register Tokens Cross-Attention Mamba Vision-Language Model Deep learning InfoNCE LLM AI Companion V-JEPA PhysDreamer Multi-modal Fusion PhysGen DriveDreamer SigLIP Generative models theory Multimodal LLM Perceiver Resampler Stable Diffusion Flamingo Cosmos Flow Matching Flux Physics-Grounded Self-Supervised Learning DINOv2 thinking BLIP-2 Q-Former Multimodal Frontier State Space Model
归档
  • 四月 202620
  • 八月 202520
  • 七月 20252
网站资讯
文章数目 :
42
已运行时间 :
本站访客数 :
本站总访问量 :
最后更新时间 :
©2025 - 2026 By AAA高老庄旺铺招租
框架 Hexo|主题 Butterfly