Home 테크/AI

260515_physical AI_섬네일 — AI로 생성한 이미지입니다.

테크/AI

[IT 트렌드 바로읽기] AI의 몸, Physical

5월 15, 2026

인공지능(AI)이 텍스트와 이미지를 생성하는 수준을 넘어, 이제 마치 인간처럼 현실 세계에서 직접 몸을 움직이며 행동하는 시대가 열리고 있다. 이를 가리켜 ‘피지컬 AI(Physical AI)’라 부른다. 피지컬 AI는 카메라, 라이다(LiDAR), 촉각 센서 등을 통해 물리 환경을 인식하고, 그 정보를 바탕으로 스스로 판단하여 로봇 팔을 움직이거나 두 발로 걷는 등의 행동을 실행하는 기술을 총칭한다. 쉽게 말해 AI에 ‘몸’이 생긴 것이다.

기존의 생성형 AI가 화면 속에서 글을 쓰고 그림을 그리는 존재였다면, 피지컬 AI는 창고에서 박스를 옮기고, 병원에서 환자를 돕고, 도로 위를 달리는 존재가 된 것이다. 이 차이는 단순한 기능의 확장이 아니다. AI와 인간의 관계를 근본적으로 바꾸는 전환점이다. 즉 AI가 디지털 공간을 벗어나 물리적 공간에 발을 내딛는 순간, 그것이 인류 사회에 미치는 영향의 폭과 깊이는 이전과 비교할 수 없이 커진다.

피지컬 AI의 핵심 기술 기반은 크게 세 가지로 나눌 수 있다.

첫째는 대규모 행동 모델(Large Behavioral Model, LBM)로, 이는 언어 모델이 텍스트를 이해하듯 로봇이 물리적 행동을 이해하고 실행하도록 돕는다.

둘째는 시뮬레이션 기반 학습으로, 실제 세계에서 수백만 번의 실험을 하기 어려운 로봇이 가상 환경에서 먼저 무한히 연습할 수 있게 해준다.

셋째는 멀티모달 인식 시스템으로, 시각, 청각, 촉각 데이터를 동시에 처리하여 복잡한 현실 상황에 대응하는 능력이다. 이 세 가지 기술이 결합되면서 피지컬 AI는 불과 몇 년 전까지만 해도 공상과학 영화 속에서나 볼 수 있었던 수준의 범용 로봇 구현을 현실로 끌어당기고 있다.

2025년은 피지컬 AI의 기술적 도약이 가시화된 해로 평가된다.

엔비디아(NVIDIA)가 CES 2025에서 ‘Cosmos’ 플랫폼을 공개하며 ‘피지컬 AI 시대’를 공식 선언했고, 테슬라, Figure AI, 보스턴 다이나믹스 등 주요 기업들이 잇따라 실제 공장 환경에서의 로봇 시범 운용 결과를 발표했다. 2026년에는 이 흐름이 더욱 가속화되어, 전 세계 기업들이 피지컬 AI를 단순한 연구 프로젝트가 아닌 실질적인 비즈니스 전략의 중심으로 편입시키기 시작했다.

딜로이트의 2026년 보고서에 따르면, 현재 물리적 AI의 영향이 제한적이라고 답한 기업 리더가 대다수이지만, 3년 내에 조직을 혁신할 것으로 예상하는 기업의 비율은 현재 5%에서 41%로 급격히 높아질 것으로 전망되었다. 이는 피지컬 AI가 아직 초기 단계이지만, 그 성장 곡선이 매우 가파름을 시사한다. 특히 일본, 한국, 중국, 유럽 등 인구 고령화와 노동력 부족에 직면한 국가들을 중심으로 피지컬 AI 도입에 대한 수요가 급증하고 있다.

피지컬 AI 시장은 현재 테슬라, 보스턴 다이나믹스, Figure AI, 유니트리(Unitree), 어질리티 로보틱스(Agility Robotics) 등이 치열하게 경쟁하는 구도로 형성되어 있다. 각 기업은 기술적 강점과 목표 시장이 다르며, 이들의 경쟁이 산업 전반의 발전 속도를 끌어올리고 있다.

테슬라의 옵티머스는 피지컬 AI 분야에서 가장 주목받는 프로젝트 중 하나다. 키 173cm, 무게 57kg의 이 휴머노이드 로봇은 자유도(Degree of Freedom) 40개와 손가락 11개의 정교한 관절을 갖추고 있으며, 테슬라 자율주행에 적용된 FSD(Full Self-Driving) 소프트웨어 기술을 기반으로 환경을 인식하고 임무를 수행한다. 2.3kWh 배터리를 탑재해 하루 작업 시간 내내 구동이 가능하다.

테슬라 공장에서 실제 자재 운반 임무를 수행하며 실전 데이터를 축적 중인 옵티머스는, 일론 머스크가 ‘2만 달러 이하’의 가격을 목표로 한다고 밝힌 만큼 대중화 가능성이 가장 높은 제품으로 평가받는다. 2026년 현재 Gen 3 버전이 운용 중이며, 테슬라는 연간 5,000대 이상의 생산 목표를 가지고 있다. 자체 AI 칩, 배터리, 제조 인프라를 모두 보유한 테슬라의 수직 계열화 전략은 다른 경쟁자들이 쉽게 따라올 수 없는 강력한 해자(moat)를 형성한다.

현대자동차 그룹이 대주주인 보스턴 다이나믹스는 CES 2026에서 새로운 전기 구동 방식의 아틀라스를 공개하며 이목을 집중시켰다. 기존 유압식에서 전기 모터방식으로 전환된 아틀라스는 에너지 효율이 크게 향상되었으며, 산업 현장에서의 실용적 배치에 초점을 맞춘 설계가 특징이다. 보스턴 다이나믹스의 부사장 재커리 야코프스키는 ‘AI의 급속한 발전이 우리에게 필요했던 마지막 퍼즐 조각’이라며 상용화 시대의 도래를 선언했다.

2026년 아틀라스의 배치 물량은 이미 완전히 예약되었으며, 현대차의 조지아 로봇 메타플랜트(RMAC)와 구글 딥마인드가 초기 도입 기관으로 확정되었다. 2028년까지 연간 3만 대 생산 공장 구축을 목표로 하고 있어, 단순한 연구용 플랫폼을 넘어 본격적인 산업 인프라로의 전환을 예고하고 있다.

Figure AI는 오픈AI 및 마이크로소프트와의 파트너십을 통해 가장 강력한 AI 두뇌를 탑재한 휴머노이드 로봇으로 평가받는다. Figure 02는 키 1.7m, 무게 70kg으로, 손가락 16개의 자유도를 통해 정밀한 조작이 가능하다. 특히 자연어로 작업 지시를 내리면 로봇이 이를 이해하고 실행하는 ‘언어 기반 태스킹’ 능력이 강점으로, 비전문가도 쉽게 운용할 수 있다는 점에서 높은 평가를 받는다.

2025년 10억 달러 규모의 투자를 유치한 Figure AI는 BMW와 공장 배치 계약을 체결하는 등 빠르게 상업화 경로를 확보해 나가고 있다. Figure 03은 연간 1만 2,000대 생산 시설을 갖춘 BotQ 공장에서 제조되며, 2026년을 기점으로 산업 현장 적용 사례가 본격적으로 쌓이고 있다.

이외 중국은 피지컬 AI 분야에서 가장 공격적인 투자를 진행하고 있는 국가다. 유니트리 로보틱스는 이미 판매 가능한 상태의 휴머노이드 모델을 가장 경쟁력 있는 가격에 공급하고 있으며, 미국과 캐나다를 포함한 글로벌 시장으로 판매를 확대하고 있다. 중국 정부 차원의 집중 지원 속에 AgiBot, Fourier Intelligence 등 수십 개의 스타트업이 동시다발적으로 성장하고 있으며, 제조 비용과 공급망 경쟁력 측면에서 서구 기업들을 압박하는 양상이다.

피지컬 AI는 특정 산업에 국한되지 않고, 제조, 물류, 의료, 농업, 서비스 등 거의 모든 산업 영역으로 침투하고 있다. 현재 가장 빠르게 도입이 이루어지고 있는 분야는 제조업과 물류 분야로, 이미 여러 기업이 실제 운용 데이터를 축적하고 있다.

특히, 제조 및 물류분야에서 테슬라, 현대차, BMW 등 대형 자동차 제조사들이 자체 공장에 휴머노이드 로봇을 시범 투입하면서 제조 분야의 도입이 가장 앞서 있다. 단순 반복 작업인 자재 이송, 나사 조립, 품질 검사 등의 임무에 로봇이 투입되고 있으며, 인간이 하기에 위험하거나 열악한 환경에서의 작업도 대체 영역으로 떠오르고 있다. 어질리티 로보틱스의 Digit은 아마존 물류 창고에서 박스 분류 및 이송 임무를 수행하며 가장 많은 실전 경험을 쌓은 플랫폼 중 하나로 꼽힌다.

그리고 의료 분야에서는 수술 보조, 환자 이송, 의약품 조달 등의 영역에서 피지컬 AI의 활용이 논의되고 있다. 특히 고령화 사회에서의 노인 돌봄 서비스는 피지컬 AI의 가장 유망한 적용 분야 중 하나다. 일본과 한국의 일부 호텔과 케어 시설에서는 이미 휴머노이드 컨시어지와 이동 보조 로봇이 시험 운용 중이다. 수술용 로봇 분야에서는 다빈치(da Vinci) 시스템으로 대표되는 기존 원격 조종 방식에서 AI 자율 판단 기반으로의 전환이 서서히 이루어지고 있다.

독자분들도 이미 알다시피, 자율주행 및 모빌리티분야는 피지컬 AI의 가장 성숙한 적용 분야다. 구글의 웨이모(Waymo), 바이두의 아폴로(Apollo) 등이 실제 도로에서 무인 택시 서비스를 운영하고 있으며, 2026년에는 적용 도시와 운행 시간이 크게 확대되었다. 자율주행은 피지컬 AI 기술 중 가장 먼저 대규모 실전 데이터를 축적한 분야로, 다른 로봇 플랫폼의 AI 개발에도 핵심 참고 사례가 되고 있다.

이러한 피지컬 AI의 확산이 인간 사회에 미칠 영향은 경제, 노동, 사회, 윤리 등 모든 층위에서 복잡하고 광범위하게 전개될 것으로 전망된다. 낙관론과 비관론이 첨예하게 대립하는 이 주제는, 단순히 기술의 문제가 아니라 우리 사회가 어떤 가치를 중심에 놓을 것인가라는 본질적 질문을 던진다.

가장 즉각적이고 광범위한 영향은 모든 국가들이 난제라고 생각하는 노동 시장에서 나타날 것이다. 노동분야에서의 피지컬AI는 현재 제조업, 물류, 농업 등 단순 반복 업무를 중심으로 로봇 대체가 빠르게 진행되고 있으며, 이는 저숙련 노동자들의 실업 위험을 높인다는 우려를 낳고 있다. 그러나 동시에 로봇 운용, 유지보수, AI 학습 데이터 생성 등 새로운 일자리가 창출될 것이라는 반론도 존재한다. 2024년 기준으로 AI 에이전트 관련 채용 공고가 전년 대비 985% 급증한 것은 기술 전환이 새로운 수요를 만들어낸다는 사실을 보여준다.

그러나 역사적으로 기술 혁명이 일으킨 노동 시장 변화는 언제나 불균형하게 분배되었다. 새로운 기술을 빠르게 습득할 수 있는 고학력, 고기술 노동자는 혜택을 누리는 반면, 전환 능력이 제한적인 계층은 소외될 위험이 크다. 피지컬 AI 시대에 이 격차가 어떻게 관리될 것인지는 각국 정부와 사회가 해결해야 할 핵심 과제다.

반면, 위에서의 피지컬AI는 대부분 산업현장에서 이루어지지만, 크리에이티브 분야에서는 핵심 질문이 “AI를 쓸까?”가 아니라 “무엇을 AI에 맡기고, 무엇을 인간의 고유 역량으로 남길까?”에 해당된다.

지금 접근을 잘못하면 작업 속도는 빨라져도 결과물은 비슷비슷해지고, 반대로 잘 잡으면 제작량은 늘면서도 자기 스타일은 더 선명해진다. UNESCO와 WIPO도 최근 자료에서 AI가 창작 생산성을 높이는 동시에, 저작권·저자성· 문화적 다양성·예술적 자유 문제를 함께 만든다고 짚고 있다.

실무적으로는 크리에이티브를 3층 구조로 나눠서 접근하는 게 가장 좋은데, 맨 아래층은 반복 제작이다. 리사이즈, 배리에이션, 초안 생성, 레퍼런스 탐색, 카피 초안, 스토리보드 러프, 목업 제작 같은 일이고, 가운데층은 편집과 디렉션이다. 어떤 안을 살릴지, 어떤 톤이 브랜드와 맞는지, 무엇이 식상한지 고르는 일이다. 맨 위층은 관점과 책임이다. 왜 이 작업을 하는지, 누구를 위해 만드는지, 무엇을 표현하고 무엇을 배제할지 결정하는 층이다. 이것은 끝까지 인간이 쥐어야만 하는데, WEF도 AI·빅데이터 역량과 함께 창의적 사고, 분석적 사고, 회복탄력성 같은 인간 중심 역량의 중요성이 더 커진다고 보기 때문이다.

예를 들어 디자인이라면, AI는 시안 20개를 빠르게 뽑는 데 쓰고, 디자이너는 그중 어떤 것이 브랜드 전략과 사용자 맥락에 맞는지 판단해야 한다. 좋은 디자이너는 이제 “직접 한 픽셀씩 만드는 사람”이 아니라, 좋은 문제를 정의하고, 좋은 선택지를 걸러내고, 최종 미감을 책임지는 사람이 된다. Adobe가 공개한 최근 크리에이터 조사와 사례들도 생성형 AI가 콘텐츠 수요 증가에 대응하는 생산성 도구로 널리 쓰이고 있음을 보여주고 있다.

영상·콘텐츠 제작이라면, AI는 콘티 초안, 자막, 썸네일, 클립 분할, 버전별 편집, 번역 현지화에 강하다. 하지만 무엇을 남기고 무엇을 덜어낼지, 감정의 호흡을 어디에 둘지, 한 컷의 여운을 얼마나 끌지 같은 문제는 여전히 인간의 연출 감각 인 것이다. 즉, 제작의 입구와 출구는 인간이 잡고, 중간의 반복 공정은 AI로 압축하는 방식이 맞다고 여겨진다. UNESCO도 예술가와 창작 종사자에 대한 AI 교 육이 문화 다양성과 예술적 자유를 지키는 데 중요하다고 말한다.

아마도 카피라이팅이나 브랜딩이라면 더 분명해진다. AI는 문장을 많이 만들 수 있지만, 브랜드가 어떤 세계관을 갖는지까지는 자동으로 책임지지는 못하기 때문이다. 따라서 접근법은 “AI에게 문장을 쓰게 한다”가 아니라 “AI에게 초안을 다수 생성하게 하고, 인간이 브랜드 어조와 사회적 맥락을 걸러낸다”가 맞다.

한 문장으로 정리하면, 크리에이티브 분야에서 인간은 제작자가 아니라 디렉터·편집자·의미 설계자로 이동해야 하고, AI는 속도를 맡고, 인간은 기준을 맡아야 한다. 기준까지 넘기면 싸고 빠른데 흔한 작업자가 되고, 기준을 지키면 AI를 써도 더 강한 창작자가 되기 때문이다.

즉 크리에이티브 AI는 대체로 “몸이 없는 AI”이고, 피지컬 AI는 “몸이 있는 AI” 이지만, 작동하는 층위가 다르다. 크리에이티브 분야에 쓰이는 AI는 보통 텍스트, 이미지, 영상, 음악처럼 상징과 정보의 세계에서 일하는 화면 안에서만 결과를 만들어내기 때문이다. 카피를 쓰고, 이미지를 만들고, 편집안을 제안하고, 스타일을 변주하고, 실수를 해도 보통은 “이상한 결과물”이 나오는 쪽이지만, 반면 피지컬 AI는 센서, 로봇, 기계 팔, 차량, 드론처럼 현실 공간에서 직접 움직이고 작용하는 시스템이다. 즉 판단이 곧 물리적 행동으로 이어지는 것이고, 실수를 하면 단순히 어색한 결과물이 아니라 충돌, 파손, 사고, 위험으로 이어질 수 있다.

그래서 차이는 이렇게 보면 된다.

크리에이티브 AI: 몸 없음, 상징 조작, 표현 생산
피지컬 AI: 몸 있음, 환경 인식, 물리 행동 실행

그래서 크리에이티브 AI는 주로 생성형AI에 가깝고, 피지컬 AI는 보고, 움직이고, 잡고, 운전하고, 조작함이 기본인 자율주행차, 물류 로봇, 공장 자동화 로봇 쪽이다. 그렇다고 해서, 크리에이티브 분야도 완전히 “몸이 없다”고만 보기는 어렵다. 그것은 AI가 만든 광고 이미지·광고 크리에이티브가 소비 행동에 영향을 주기 때문이다.

출처: (왼쪽부터) Coca-Cola — Holidays Are Coming AI, Volvo — Come Back Stronger, Kalshi — NBA Finals AI 광고

위 세 사례를 한 번에 보면, Coca-Cola는 AI를 써도 전통적 감성 브랜드 자산을 유지하려 했고, 그래서 “진짜 감성인가 가짜 감성인가”가 논란이 되었고, Volvo는AI를 써서 브랜드 이미지 영화를 만들려 했지만, 제품 부재와 어색한 미학 때문에 “브랜드 정체성과 연결이 약하다”는 비판을 받았다. 그리고 Kalshi는 AI의 한계를 감추지 않고 오히려 기괴함 자체를 광고 무기로 삼았고, 그래서 “완성도”보다 “비용·속도·주목도”가 핵심 이슈가 되었었다.

AI 광고의 평가는 단순히 예쁘냐 못생겼냐가 아니라, 사람들은 즉, 소비자들은 더 AI광고를 근본적으로 본다는 것이다. — 이 표현 방식이 브랜드와 맞는가, 인간이 만든 것 같은 진정성이 남아 있는가, AI를 쓴 이유가 창의성 때문인가, 비용 절감 때문인가, 결과가 새로운가, 아니면 싸구려 같은가 와 같은 — 즉, AI 광고는 기술 문제가 아니라 신뢰·미감·노동·브랜드 의미의 문제로 받아들여진다는 말이다. 그래서 피지컬 AI는 기계, 센서, 로봇, 차량처럼 현실 세계에서 행동하는 AI이고, 크리에이티브 AI는 이미지, 언어, 음악, 영상, 인터페이스처럼 의미·표현·해석이 곧 몸이 되는 AI인 것이다.

이처럼 피지컬AI, 크리에이티브 AI의 차이를 이해한다는 것을 전제로, 피지컬 AI는 단순히 일자리를 대체하는 데 그치지 않고, 인간이 ‘몸을 쓰는 것’의 의미 자체를 변화시킬 수 있다.

인간의 손으로 해야만 했던 일들이 로봇에 넘어갈 때, 우리는 무엇을 잃고 무엇을 얻는지, 이런 과정에 장인 정신, 수공예, 육체 노동에 담긴 인간적가치는 어떻게 재정립될 것인지… 와 같은 이 질문은 기술적 문제가 아니라 철학적, 문화적차원의 문제다. 따라서 바로 여기서 크리에이티브AI의 창작이 의미, 표현 등 다양한 문화, 언어적 영역으로 이어질 수 있다는 점도 간과해서는 안될 것이다.

다시 피지컬AI로 돌아와 앞서 짚어본 바, 딜로이트의 조사에서 피지컬 AI 도입의 최대 장애 요인으로 ‘비용 및 자원 요구’를 꼽은 기업이 41%에 달했지만, 그 이면에는 기술적 준비뿐 아니라 법적, 윤리적, 사회적 규범의 미비라는 더 근본적인 문제가 자리 잡고 있다. 로봇이 일으킨 사고의 책임은 누가 지는가, 자율적으로 판단하는 기계에게 어떤 수준의 권한을 부여할 것인가, 인간 노동자의 권리는 어떻게 보호될 것인가 등의 질문에 대한 사회적 합의가 기술의 속도를 따라가지 못하고 있다.

결국 피지컬 AI는 그 자체로 선하거나 악한 기술이 아니다. 어떤 목적으로, 누구의 이익을 위해, 어떤 규칙 아래 운용되는가에 따라 그 결과값은 완전히 달라진다. 즉 인류의 가장 고된 노동을 덜어주고, 위험한 환경에서 인간을 보호하며, 고령화 사회의 돌봄 공백을 메우는 데 기여할 수 있다. 반면 감시와 통제의 도구로 악용되거나, 경제적 불평등을 심화시키거나, 인간의 존엄성 영역을 침범하는 방향으로 흘러갈 수도 있다는 점을 절대 간과해서는 안 된다. 따라서 피지컬 AI 시대를 준비하는 핵심은 기술 그 자체뿐만 아니라 기술을 둘러싼 인간의 선택과 제도 설계에 있다는 것을 명심해야한다. 즉 지금 이 순간이 바로 그 방향을 결정하는 골든 타임이다.

피지컬AI에 대한 인간의 대처법은 막연한 공포나, 무조건적 낙관이 아니라, “협업 가능한 영역은 키우고, 넘기면 안 되는 권한은 끝까지 인간이 쥐어야하는 것”이다. 이는 앞서 설명한 크리에이티브AI의 상황과 같다. 요즘 말하는 피지컬AI는 로봇·자율주행·물류 자동화처럼 AI가 센서와 기계를 통해 현실 세계를 인식하고 실제 행동까지 하는 시스템을 뜻함과 동시에, 이는 크리에이티브AI처럼 글을 쓰는 AI보다 훨씬 직접적으로 사람의 일, 안전, 책임 문제와 맞닿아 있다.

즉 “대체될 일”보다 “감독할 일”로 이동해야 하고, 안전을 최우선 원칙으로 둬야 하며, 직업 역량을 ‘현장+디지털’ 혼합형으로 바꿔야 한다. 권한 위임의 마지노선을 명확히 정해야 함과 동시에 사회 차원에서는 기술 수용보다 규칙 수립이 먼저 따라야 할 것이다. OECD와 NIST 자료도 공통적으로 인간 중심, 안전, 신뢰, 위험관리를 핵심축으로 보고 있다. 즉 인간의 대처법은 ‘피지컬AI를 두려워할 게 아니라, 인간만이 맡아야 할 판단·책임·안전 권한을 더 분명히 붙잡고, 나머지는 협업 도구로 재설계해야 한다.’는 것이다. 이는 크리에이티브AI와 같은 상황을 이해한다면 지금 인류는 무엇을 준비하고 제도화해야 하는지 더욱 선명하게 보일 것이라 여겨진다.

Gil Park님의 브런치에 게재된 글을 모비인사이드가 한 번 더 소개합니다.