Building robust real-time AI for real-world robots

A research notes archive on robot intelligence and real-time inference systems

Currently on a short break between finishing my master's and my next role — traveling and recharging.

(C for "C"hanghyun "C"hoi . "c"om)


New Posts

  • Learning Action Priors for Cross-embodiment Robot Manipulation
    Pretrained VLM에 아직 motor structure를 배우지 못한 action head를 바로 붙여 joint train하는 대신, state-action trajectory만으로 flow-matching action encoder-decoder를 먼저 pretrain한 뒤 decoder initialization, decaying latent distillation, history compression을 통해 VLA에 이식하는 cross-embodiment policy training framework

  • Grounding Generative Policies in Physics: Optimization-Guided Diffusion for Robot Control
    Frozen task-space diffusion policy의 DDIM sampling noise를 무작위로 뽑는 대신, robot reachability·collision·controller trackability를 만족하도록 최적화하여 cross-embodiment deployment를 수행하는 inference-time constrained diffusion method

  • InSight: Self-Guided Skill Acquisition via Steerable VLAs
    기존 demonstration을 자동으로 primitive 단위로 분해해 pretrained π0.5를 primitive-steerable policy로 만들고, novel task에서 VLM이 발견한 missing primitive를 single-axis controller로 자율 수집·검증한 뒤 VLA에 재학습하여 영속적인 skill vocabulary로 편입하는 VLM-guided continual skill acquisition framework

  • PolicyTrim: Boosting Intrinsic Policy Efficiency of Vision-Language-Action Models
    pretrained VLA를 두 단계의 GRPO 기반 RL post-training으로 fine-tuning하여, 한 번의 inference에서 안전하게 실행할 수 있는 action chunk 길이를 늘리고 전체 physical control step은 줄임

  • SPACE: Enabling Learning from Cross-Robot Data Toward Generalist Policies
    VLA가 robot-specific control command 대신 실제로 달성해야 할 6-DoF Cartesian end-effector displacement를 예측하게 하고, target robot마다 선형 Action Adapter를 offline calibration과 online LMS로 적응시켜 cross-embodiment·cross-hardware·deployment dynamics shift에 강한 execution interface를 만든다