๊ฑฐ๋์ธ์ด๋ชจ๋ธ(LLM)์ด ์ด๋ป๊ฒ ๋ก๋ด์ ๋(Vision)๊ณผ ์(Action)์ ์ ์ดํ๊ฒ ๋๋์ง๋ฅผ ๋ค๋ฃจ๋ ๊ฐ์ฅ ํต์ฌ์ ์ธ ๋ถ์ผ์ ๋๋ค.
| ๋ ผ๋ฌธ๋ช | ๊ธฐ๊ด | ํต์ฌ ๋ด์ฉ | ๋น๊ณ |
|---|---|---|---|
| RT-2 | Google DeepMind | VLA(Vision-Language-Action) ๊ฐ๋ ์ ์์ด. LLM์ด ๋ก๋ด ์ ์ด ํ ํฐ์ ์ถ๋ ฅ. | ํ๋ (๊ธฐ๋ณธ์) |
| OpenVLA | Stanford/Berkeley | RT-2์ ์คํ์์ค ๋ฒ์ . Llama 2 + SigLIP ๊ฒฐํฉ. ํจ์ฌ ๊ฐ๋ณ๊ณ ๋น ๋ฆ. | ์ค๋ฌด ํ๋ |
| Octo | Berkeley/Stanford | ํธ๋์คํฌ๋จธ์ ๋ํจ์ ์ ๊ฒฐํฉํ ์คํ์์ค ๋ฒ์ฉ ๋ก๋ด ์ ์ฑ . | ํ์ค ๋ฒ ์ด์ค๋ผ์ธ |
| MobileVLM / VILA | NVIDIA | ์ฃ์ง ๋๋ฐ์ด์ค(๋ก๋ด ๋ด๋ถ) ํ์ฌ๋ฅผ ์ํ ๊ฒฝ๋ํ๋ VLM ๋ชจ๋ธ. | ์จ๋๋ฐ์ด์ค AI |
"์ด๋ป๊ฒ ์์ง์ผ๊น?"์ ๋ํ ๋๋ต์ ๋๋ค. ๊ธฐ์กด ์ ์ด ๋ฐฉ์์์ ์์ฑํ AI ๋ฐฉ์(Diffusion)์ผ๋ก ๋์ด๊ฐ๋ ํ๋ฆ์ ๋ณด์ฌ์ค๋๋ค.
| ๋ ผ๋ฌธ๋ช | ๊ธฐ๊ด | ํต์ฌ ๋ด์ฉ | ๋น๊ณ |
|---|---|---|---|
| Diffusion Policy | Columbia/MIT | ์ด๋ฏธ์ง ์์ฑ ์๋ฆฌ(Diffusion)๋ฅผ ๋ก๋ด ํ๋ ์์ฑ์ ์ ์ฉ. ๋ฉํฐ๋ชจ๋ฌ ๋ถํฌ ํ์ต์ ํ์. | ํ์ฌ ํ์ค (Standard) |
| Open X-Embodiment | Google et al. | "๋ก๋ด๊ณ์ ImageNet". ์๋ก ๋ค๋ฅธ ๋ก๋ด ๋ฐ์ดํฐ๋ฅผ ํตํฉ(RT-X)ํ์ฌ ๋ฒ์ฉ์ฑ ์ฆ๋ช . | ๋ฐ์ดํฐ ์ค์ผ์ผ๋ง |
ํ์ค ๋ฐ์ดํฐ ์์ง์ ์ด๋ ค์์ '๊ธฐ๋ฐํ ํ๋์จ์ด'๋ '์๋ฎฌ๋ ์ด์ '์ผ๋ก ํด๊ฒฐํ๋ ์ ๊ทผ๋ฒ์ ๋๋ค.
| ๋ ผ๋ฌธ๋ช | ๊ธฐ๊ด | ํต์ฌ ๋ด์ฉ | ๋น๊ณ |
|---|---|---|---|
| UMI | Stanford | GoPro์ ๊ทธ๋ฆฝํผ๋ง์ผ๋ก ์ ์ธ๊ณ ์ด๋์๋ ๋ฐ์ดํฐ ์์ง ๊ฐ๋ฅ. | ๋ฐ์ดํฐ ํ๋ช |
| DexCap | Stanford | ๋ชจ์ ์บก์ฒ ์ฅ๊ฐ์ ์ด์ฉํด ์ ๊ตํ ์๋์(Dexterous Hand) ๋ฐ์ดํฐ ์์ง. | ํด๋จธ๋ ธ์ด๋ ์ ์ ์ด |
| Eureka | NVIDIA | LLM(GPT-4)์ด ๊ฐํํ์ต ๋ณด์ ํจ์(Reward Function) ์ฝ๋๋ฅผ ์ง์ ์์ฑ. | ์๋ํ๋ ํ์ต ์ค๊ณ |
| DrEureka | NVIDIA | ์๋ฎฌ๋ ์ด์ ๋ฌผ๋ฆฌ ํ๋ผ๋ฏธํฐ๊น์ง LLM์ด ์กฐ์ ํ์ฌ Sim-to-Real ์ฑ๊ณต. | Eureka์ ํ์ |
๋จ์ ์ ์ด๋ฅผ ๋์ด, ์ธ์์ ์ดํดํ๊ณ ์์ธกํ๊ฑฐ๋ ์ธ๊ฐ์ ๋ฎ์๊ฐ๋ ์ต์ ์ฐ๊ตฌ๋ค์ ๋๋ค.
| ๋ ผ๋ฌธ๋ช | ๊ธฐ๊ด | ํต์ฌ ๋ด์ฉ | ๋น๊ณ |
|---|---|---|---|
| Genie | Google DeepMind | ๋น๋์ค๋ง ๋ณด๊ณ ํ์ตํ์ฌ ์ ์ ์ด๋ฏธ์ง๋ฅผ 'ํ๋ ์ด ๊ฐ๋ฅํ ๊ฒ์'์ผ๋ก ๋ณํ. | World Model์ ์์ |
| V-JEPA | Meta FAIR | ์ ๋ฅด์ฟค์ ๋น์ . ๋น๋์ค์ ํฝ์ ์ด ์๋ ๋ฌผ๋ฆฌ์ ํน์ง(Feature)์ ์์ธก. | ํจ์จ์ ํ์ต |
| HumanPlus | Stanford | ์นด๋ฉ๋ผ ํ๋๋ก ์ฌ๋์ ์๋์ํ์ฌ ํด๋จธ๋ ธ์ด๋ ์์ง์ ํ์ต. | ํด๋จธ๋ ธ์ด๋ ์ ์ด |
| Pi0 / GR00T | Physical Int. / NVIDIA | (๋ ผ๋ฌธ/๋ฆฌํฌํธ) ๋ค์ํ ํ๋์จ์ด๋ฅผ ์์ฐ๋ฅด๋ ๋ฒ์ฉ ๋ก๋ด ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ํ๋ก์ ํธ. | ์ฐ์ ๊ณ ์ต์ ์ |
๊ฐ์ฅ ํจ์จ์ ์ผ๋ก ์ด ๋ถ์ผ๋ฅผ ๋ง์คํฐํ๊ธฐ ์ํ ์์๋ฅผ ์ ์ํฉ๋๋ค.
Step 1. ๊ฐ๋ ์ก๊ธฐ (The Basics)