建立于2025-11-29,用于索引

参见ACT

  • 本来“读论文”这个文件我是希望可以管理很多论文,可以在其中记录简要信息
  • 等到内容太多了再拆分
  • 结果这一篇就需要拆分了

接下来要读的:Diffusion Policy

  • 我靠,我有种不祥的预感,我可能需要先把diffusion的网课看看,或者找一点博客或者看看cs231n 2025的slides
  • 我觉得让ai先把文章完整看一遍,总结一下,然后我再接着读会很好,因为ai会基于全文给出内容,我在读到后面时,一些核心内容可能ai已经提到过了,就感觉很舒服
  • 22点39分 2025-11-29 不错 把introduction看完了
  • ai studio输出的东西不能直接复制到ob,格式有点问题,可以让豆包处理下,生成源代码
  • 23点45分 2025-11-30 4.3 Benefits of Action-Sequence Prediction 还没看
  • 09点48分 2025-12-01 6 Realworld Evaluation 那我觉得有可能今天可以看完,不错
  • 妈的,给干出免费限制了,妈的
  • 10点16分 2025-12-01 6.2 Mug Flipping Task 还没看
    • 感觉后面的real实验都挺有意思的,以及不像之前公式原理讲解那样硬核,应该看起来也比较快
    • 感觉今天还真的有可能差不多看完
  • 17点53分 2025-12-01 太好了,现在哈基米3pro又可以用了
  • 18点44分 看完了 11 Acknowledgement
  • 19点14分 看完了全部19页,真是不容易

然后是RISE

  • 23点44分 2025-12-02 看到了3D感知的Point-based部分,还没看
  • 08点18分 2025-12-03 为什么早上ai studio相应这么快
  • 09点17分 2025-12-03 看到了IV. EXPERIMENTS,还没看
  • 20点46分 2025-12-03 读完了conclusion,进入APPENDIX
  • 21点23分 2025-12-03 彻底看完了,不错

至此,3篇论文已经都看完了,真是不容易

接下来要学习的是rise-policy/RISE: [IROS 2024] 📈 RISE: 3D Perception Makes Real-World Robot Imitation Simple and Effective,关于RISE的源代码

参见Attention Is All You Need

参见VLA相关