<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.10.0">Jekyll</generator><link href="https://weihao-yuan.com/feed.xml" rel="self" type="application/atom+xml" /><link href="https://weihao-yuan.com/" rel="alternate" type="text/html" /><updated>2026-05-15T01:43:38+00:00</updated><id>https://weihao-yuan.com/feed.xml</id><title type="html">Home</title><subtitle>Weihao Yuan&apos;s academic portfolio</subtitle><author><name>Weihao Yuan</name><email>dr.weihao.yuan@gmail.com</email></author><entry><title type="html">EmbodiedAI Start Guide</title><link href="https://weihao-yuan.com/posts/2026/05/EmbodiedAI-Start-Guide/" rel="alternate" type="text/html" title="EmbodiedAI Start Guide" /><published>2026-05-01T00:00:00+00:00</published><updated>2026-05-01T00:00:00+00:00</updated><id>https://weihao-yuan.com/posts/2026/05/blog-post</id><content type="html" xml:base="https://weihao-yuan.com/posts/2026/05/EmbodiedAI-Start-Guide/"><![CDATA[<h1 id="具身智能研究入门指南">具身智能研究入门指南</h1>

<h2 id="深度学习基础课程学习">深度学习基础课程学习</h2>
<p>（*课程学习务必做完相关作业，不然等于没学。。。）</p>

<ol>
  <li>
    <p>斯坦福课程 <a href="https://cs231n.stanford.edu/index.html">CS231n: Deep Learning for Computer Vision</a></p>

    <p>跟随FeiFei Li老师的指导能够整体理解计算机视觉深度学习的基本算法、网络模型和训练技巧，务必做完CS231n的作业</p>
  </li>
  <li>
    <p>伯克利课程 <a href="https://rail.eecs.berkeley.edu/deeprlcourse/">CS185/285: Deep Reinforcement Learning</a></p>

    <p>跟随Sergey Levine老师的指导学习强化学习的知识，很多例子都是在机器人上进行</p>
  </li>
  <li>
    <p>斯坦福课程 <a href="https://cs229.stanford.edu/">CS229: Machine Learning</a></p>

    <p>跟随马腾宇老师学习机器学习的基础方法和整体理论</p>
  </li>
</ol>

<h2 id="机器人基础课程学习">机器人基础课程学习</h2>
<p>（*课程学习务必做完相关作业，不然等于没学。。。）</p>

<ol>
  <li>
    <p>西北大学课程 <a href="https://hades.mech.northwestern.edu/index.php/Modern_Robotics">Modern Robotics: Mechanics, Planning, and Control</a></p>

    <p>跟随Kevin Lynch和Frank Park两位老师可以了解机器人学的基本知识，如正逆运动学、动力学、空间变换等</p>
  </li>
  <li>
    <p>伯克利课程 <a href="https://people.eecs.berkeley.edu/~pabbeel/cs287-fa19/">CS 287: Advanced Robotics</a></p>

    <p>进阶课程，跟随Pieter Abbeel老师学习高等机器人学</p>
  </li>
</ol>

<h2 id="机器人仿真平台">机器人仿真平台</h2>
<p>（*多玩，多熟悉）</p>

<ol>
  <li>
    <p><a href="https://github.com/isaac-sim/IsaacSim">ISAAC Sim</a> 和 <a href="https://isaac-sim.github.io/IsaacLab/main/index.html">ISAAC Lab</a></p>

    <p>NVIDIA的机器人仿真平台，是目前使用最广泛的机器人仿真平台</p>
  </li>
  <li>
    <p><a href="https://mujoco.org/">Mujoco物理引擎</a></p>

    <p>使用最广泛的物理引擎，被很多仿真平台（如ISAAC）使用</p>
  </li>
</ol>

<h2 id="机器人基础代码库">机器人基础代码库</h2>
<p>（*多玩，多熟悉）</p>

<ol>
  <li>
    <p><a href="https://www.ros.org/">ROS2机器人框架</a></p>

    <p>做机器人必须熟悉的框架，大部分的常见机器人系统都是基于ROS开发的</p>

    <p>可以在<a href="https://fishros.com/#/home">鱼香ROS学习平台</a>进行学习</p>
  </li>
</ol>

<h2 id="具身智能代码库">具身智能代码库</h2>

<p>当你掌握了上面的基础知识后，就可以开始在当前火热的具身智能代码库上进行学习、开发、甚至算法改进：
（*当然，如果对自己有自信也可以直接进入到这一环节🐶，遇到不足的地方再返回学习）</p>

<ol>
  <li>
    <p><a href="https://github.com/huggingface/lerobot">Lerobot机器人框架</a>是目前大家做机器人操作使用最多的框架，很多新的算法都是基于这个框架进行开发的。里面已经实现了很多经典算法，如ACT、DiffusionPolicy、Pi系列、GROOT等等，网上也已经有了很多学习文档（官方github已提供一些），可以深入了解当前算法的代码细节，并可以在仿真中进行训练和推理，熟悉之后也可以在上面进行算法改进</p>
  </li>
  <li>
    <p><a href="https://github.com/starVLA/starVLA">StarVLA</a>，也是目前很多人使用的一个机器人代码库，实现了很多最新算法，更新也比较快（虽然问题不少），很多新算法会基于这个代码库里的实现作为baseline，进行改进优化</p>
  </li>
</ol>

<h2 id="具身智能经典算法论文">具身智能经典算法论文</h2>
<ul>
  <li>RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control</li>
  <li>OpenVLA: An Open-Source Vision-Language-Action Model OpenVLA Closed-Loop Robot Control Policy</li>
  <li>Open X-Embodiment: Robotic Learning Datasets and RT-X Models</li>
  <li>ACT: Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware</li>
  <li>
    <p>Diffusion Policy: Visuomotor Policy Learning via Action Diffusion</p>
  </li>
  <li>
    <p>Pi系列：</p>

    <p>Pi0: A Vision-Language-Action Flow Model for General Robot Control</p>

    <p>Pi-0.5: A Vision-Language-Action Model with Open-World Generalization</p>

    <p>Pi-0.6: A VLA That Learns From Experience</p>

    <p>Pi-0.7: A Steerable Generalist Robotic Foundation Model with Emergent Capabilities</p>
  </li>
  <li>
    <p>GR系列：</p>

    <p>GR-2: A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation</p>
  </li>
</ul>

<p>可参考网上的很多list：<a href="https://vapour-x.cn/docs/foundation/paper-list/">list1</a></p>]]></content><author><name>Weihao Yuan</name><email>dr.weihao.yuan@gmail.com</email></author><category term="EmbodiedAI" /><category term="Start Guide" /><category term="Learning" /><summary type="html"><![CDATA[具身智能研究入门指南]]></summary></entry></feed>