기술동향No.08, 2022/09

미국 자율 공중전 알고리즘 시스템 개발과 진행 김봉훈 대표
bonghun@airagent.kr Air Agent Lab 대표, 한국국방기술학회 AI 기술자문위원

최근의 자율 공중전 알고리즘 개발 동향

  현대전에서 기계화, 정보화, 지능화 등 3가지 현대화의 통합 발전 및 진화에 따라 향후 항공전투 장비의 위치, 형태 및 적용에서 근본적인 변화를 겪을 수 있다. 새로운 시대의 공중전 임무가 직면한 복잡한 환경, 강력한 대결, 높아진 실시간 대응, 불완전한 정보, 경계 불확실성 등의 일련의 도전에 대처하기 위해 인공지능 이론과 공중전 기술, 자율 공중전 시스템 개발은 미래 항공우주 전장에서 승리하는 핵심 열쇠가 될 것이다. 전투기의 공중전을 위한 자율 의사결정 기반의 공중전 알고리즘 개발은 현재 전세계 군사 강대국의 다양한 연구 분야 중 가장 민감하고 중요한 부분으로 활발한 연구개발이 진행되고 있다.

  현재 국내·외에서 많은 자율적 공중전 의사결정 방법(학습법)이 제안되고 있으며 각각의 방법들은 설정한 조건에서 좋은 결과를 얻고 있다. 그러나 공중전 상황에서의 역학과 복잡성으로 인해 다양한 공중전 환경과 각종 전투기 유형에 대한 완전하고 강력한 자율적 공중전 의사 결정 방법에 대한 연구결과는 아직 보고된 바 없으며 이 방법에 완전하고 강력함에 가까운 공중전 의사결정 방법은 현재 여러 국가에서 연구 중이다.

<그림> 이기종간 2v2 근거리 자율 공중전 (Air Agent Lab)

  미 항공우주국(NASA)은 1960년대부터 1990년대까지 전문가 규칙을 기반으로 하는 자율 공중 전투시스템 개발에 계속 주력해 왔으며, 공중전 분야에 대한 인간 지식과 경험을 지식 기반으로 구축했다. 정보 시스템은 공중전 결정을 수행하기 위해 전투조종사를 대체하며 이 자율 공중전 분야는 유전자 알고리즘, 유전자 퍼지 트리 등의 휴리스틱 방식이 적용되고 있다. 유전자 퍼지 트리를 활용한 ‘ALPHA 공중전’ 시스템은 의사결정을 검증하는 최초의 시스템이다.

  언론 매체를 통해 자율 공중전이 대중에게 소개된 것은 2020년에 미국 DARPA(국방고등연 구계획국)에서 실행된 ACE 프로젝트, 정식 명칭은 ‘Air Combat Evolution’이다. 전체 프로젝트는 50개월이 소요되며 3단계로 나뉜다. 이 프로젝트는 인공지능 기술을 이용하여 공중 가시범위(WVR; Within Visual Range)내에서 자율 기동 및 전투시스템을 개발하고 자율 전투 시스템에 대한 전투기 조종사의 신뢰를 높이고 미래 전쟁에서 자율 전투시스템을 보다 광범위하게 적용한다는 목표를 가지고 있다. 이를 위해 ACE 프로그램은 먼저 모델링 및 시뮬레이션(M&S)을 사용하여 핵심기술을 시연한 후 점진적으로 핵심기술을 소형 무인 항공기에 통합하고 최종적으로 전투기에서 본격적인 작전을 구현하는 점진적 기술통합 전략계획이다. ACE 프로젝트는 자율 전투시스템의 능력 수준이 미래에 복잡한 유인/무인 협업으로 진화할 수 있도록 계속 추진되고 있다.

  현재 기계지능은 딥 러닝 시대에 진입했으며 인공지능을 기반으로 한 공중전 게임에 대한 연구도 상당한 진전을 이뤘다. 자율 공중전 시대가 도래함에 따라 세계 주요 항공강국 및 관련 연구기관은 차세대 자율 공중전 시스템의 탐색 및 연구에 집중하고 자율 무인시스템 장비 및 지능 기술 항공장비와 인공지능 기술의 통합 개발을 촉진하기 위해 많은 연구를 하고 있다.

  인공지능을 기반으로 한 공중전 메커니즘은 인간 조종사를 이길 수 있는 잠재력이 있다. 최근 몇 년 동안 머신러닝의 출현으로 딥러닝과 심층 강화학습으로 대표되는 자기진화 지능 알고리즘은 공중전에 큰 이점을 보여주고 있으며 이러한 방법을 기반으로 하는 많은 자율 공중전 프로젝트가 점차 제안되고 있다. 대표적인 사례가 미국 DARPA에서 수행한 인공지능 근거리 공중전 프로젝트인 Alpha Dog Trials로서 본 프로젝트 챌린지 챔피언팀은 심층 강화학습 방식을 적용해 지금도 우수한 결과를 내고 있다. 인간 조종사와 알고리즘 간의 가상 공중전에서 알고리즘은 큰 점수차로 인간 조종사를 이겼고 기계 학습과 같은 방법이 공중전 의사결정 문제를 해결하는 데 큰 잠재력을 가지고 있음을 증명했다.

  그럼에도 비록 자율 공중전 분야에서 많은 발전이 이루어지고 있지만 여전히 극복해야 할 기술적인 문제도 많다. 현대 공중전은 매우 역동적이고 실시간적인 전장환경과 불확실하고 불완전한 작전상황에 직면하기 때문에 기존의 규칙 기반 전문가 시스템만으로 공중 작전 운영 요구 사항을 충족할 수 없다. 새로운 기계학습 방법은 강력한 능력을 발휘하고 자기진화 및 자체학습에서 오는 장점들도 있지만 자율 공중전의 불확실성, 해석 가능성, 보안 등은 여전히 극복해야 할 문제이다.

자율 공중전 이론적, 공학적 개념의 등장

  1960년대 이후로 자율 공중전 이론과 공학적 실천에 대한 연구는 전세계 학계와 산업계의 지속적인 관심을 받아왔다. 개발 과정을 돌이켜 보면 외관상으로는 전문가 기동 논리, 자동 규칙 생성, 규칙의 진화, 기계학습 및 시연 검증 등 본질적으로 자율 공중전 연구는 인간 경험이 지배하는 전통적인 전문가 시스템에서 이제는 기계 지능의 자기 진화를 특징으로 하는 새로운 패러다임으로 이동하고 있다.

1. 전문가 기동 논리 단계: NASA LaRC(Lang- ley Research Center)의 AML(Adaptive Maneuvering Logic) 시스템

  미국의 자율 공중전에 대한 연구는 1960년대에 시작되었으며 NASA LaRC 연구센터인 DMS(Differential Maneuvering Simulator)에 대한 자금 지원으로 1969년에 시작했다. 기동 의사결정 소프트웨어인 AML은 IF-ELSE-THEN 논리를 주요 의사결정 알고리즘으로 하는 전문가 시스템이다. AML은 적 전투기와 시뮬레이터를 조종하는 조종사 간의 실시간 전투를 시뮬레이션 할 수 있을 뿐만 아니라 시뮬레이션 된 대결에서 양측의 두 대의 항공기를 조작하여 항공기 및 무기 시스템의 매개변수 연구를 실현할 수 있다.

  AML 시스템은 자율형 공중전 기술을 체계적으로 시도한 최초의 시스템이다. 당시 NASA는 공중전의 기동 의사결정 과정에서 실시간 및 불확실성이 높아 정확한 솔루션 모델을 제공하기 어렵다고 판단하고 있었다. 이에 NASA는 공중 대치 상황에 따라 전문가 시스템을 사용하였고 자율 공중 상황에서 무인 항공기의 기동 의사결정 기능을 실현하기 위해 빠른 결정을 내리도록 하였다.

  AML 시스템의 개발은 거의 20년이 걸렸고, 인류 역사상 최초로 전투조종사를 인공지능으로 대체 하려는 과감한 시도였지만 당시 기술적 여건으로 인해 미흡한 점이 많았다. 예를 들어, AML의 규칙 기반을 개선하는데 시간이 많이 걸리고 의사결정 결과에 대한 조종사의 평가에 매우 의존적이었으며, 시스템은 의사결정 알고리즘으로 기동하기 위한 조종사의 선호도를 하드코딩 했어야 했다.

2. 자동 규칙 생성 단계: NASA LaRC의 PALADIN 시스템

  1990년대에 새로운 고성능 전투기가 도입되면서 NASA LaRC는 크게 확장되었고 빠르게 변화하는 공중전 전술 환경에 대응하기 위하여 TGRES(Tactical Guidance Research and Evaluation System)의 개발을 지원했다. 이 시스템은 TDG(Tactical Decision Generator), TMS(Tactical Maneuvering Simulator) 및 DMS(Differential Maneuvering Simulator) 등 세 가지 주요 부분으로 구성되어 있다. PALADIN 시스템은 TGRES 프로젝트에서 AML을 기반으로 개발된 지식 기반 전술 결정시스템이다. AML과 달리 PALADIN은 지식 기반을 구축하기 위해 조종사의 경험에 의존하지 않고 항공기 자체 데이터와 공중전 전술의 대결 시뮬레이션 결과를 기반으로 풍부한 결정을 제공 한다. 실제 전투 경험이 부족한 새로운 항공기에 대한 지원 및 PALADIN 시스템의 규칙 기반은 모듈식 설계 아이디어를 채택하여 가동률을 90~100배까지 크게 높였다. AML 시스템과 비교하여 록히드 마틴과 에임스 (Ames) 연구센터도 PALADIN 시스템의 연구 프로세스에 적극 참여했는데, 이는 자율 공중전이 초기 이론 연구에서 대규모 크로스 도메인 시스템 엔지니어링 연구로 점진적으로 전환하는 것을 보여줬다. AML과 비교할 때 PALADIN 시스템의 가장 큰 혁신은 공중전 기동역학 및 전략 탐색공간을 수학적으로 모델링하려는 시도 였으며 연구 분야로는 순수한 공중전 기동 결정에서 무기장전 일정 및 무기사용 등에 이르기까지 다양하였다. 가장 중요한 것은 TDG 모듈이 시뮬레이션 방식을 기반으로 규칙 추론 로직을 자동으로 생성할 수 있다는 점이다. 이는 인간의 기존 공중전 지식의 인지적 경계를 허물고 새로운 형식화된 공간지식 표현을 제공할 수 있다는 것을 의미한다.

3. 규칙 진화 단계: “ALPHA Air Combat” 시스템 및 공중 양자 대결 학습 시스템

  2016년 6월, 미국 신시내티 대학교와 미 공군 연구소(AFRL)는 모의 공중전에서 경험 많은 퇴역 미공군 대령을 압도적으로 이긴 “ALPHA Air Combat” 시스템을 공개했다. 이 시스템의 핵심 알고리즘은 유전 퍼지 이론 시스템을 채택하고 인간의 전문 지식을 기반으로 여러 병렬 퍼지 추론엔진을 구축하여 매핑 관계에 따라 입력 및 출력 연결을 결정한 후 실시간 의사결정을 내림으로써 여기에 요구되는 고차원 및 복잡한 문제를 해결하려는 실시간 의사결정 알고리즘이다. “ALPHA Air Combat”시스템의 초기 전략 구조는 주로 인간의 사전 지식 모델링에 의존하였으며 인간의 공중전 메커니즘에 대한 불충분한 이해로 인해 솔루션 공간 탐색 능력은 인간의 설계에 의해 크게 제한된다. “ALPHA Air Combat”시스템은 인공지능 기술을 사용하여 복잡한 공중전 대결 문제를 해결하기 위해 진화된 컴퓨팅을 성공적으로 적용한 사례이다.

  한편 또 다른 사례인 양자적 적대 학습 시스템 (Two-Sided Learning System)은 미 보잉과 영국 UWE(University of the West of En-gland) 대학이 공동 개발한 기동 적대 인공지능 프로그램이며 이 시스템도 AFSIM(Advanced Framework for Simulation, Integration and Modeling)을 기반으로 하고 있다. 연구의 초점은 지능적인 공중전 의사결정이 인간 지식의 제약을 깨고 기계지능에 의존하여 새로운 공중 대결을 생성할 수 있는지 확인하기 위해 대규모 유전 알고리즘을 적용하여 만들어진 자가 게임이다. 양자적 적대 학습 시스템은 “ALPHA Air Combat”시스템과 유사하며 상황 조작 두 개를 유전자 형태로 인코딩하여 수많은 무작위 상황을 통해 대량의 적대 샘플을 생성하여 유전자 알고리즘을 구동한다. “ALPHA Air Combat”시스템과의 차이점은 거대한 적대적 게임 트리 공간에서 적대적 훈련이 특정 시나리오에 대해 수행되지 않고 환경 적응성이 더 강하다는 점이다.

  하지만 1. 전문가 기동 논리 단계, 2. 규칙 자동 생성 단계에 비해 3. 규칙 진화 단계는 지능이 크게 향상되었지만 기술 적용에는 여전히 몇 가지 어려움이 있다. 초기 설계를 위해 인간의 사전지식에 의존하는 것과 같은 문제가 남아 있으며 이는 인간에게 알려진 전술적 전략에 과적합되는 경향이 있는 훈련으로 이어질 수 있다. 또한 규칙 진화 방법은 일반적으로 기존의 유전 알고리즘이나 유전 퍼지 시스템을 기반으로 하며 기계학습 방법과 비교하여 자체학습 능력에서 여전히 일정한 격차가 있다.

4. 기계학습 단계: 공중 전투 적응형 동적 계획 시스템, 헬리콥터 기동 비행 학습 시스템 및 “Alpha Dog Fight”

  지난 2010년 미 MIT는 공중대결 적응형 동적 프로그래밍(ADP; Approximate Dynamic Programming) 시스템을 공개했다. ADP의 주요 기술을 선형 또는 비선형 구조를 통해 상태의 효용 함수를 근사하고 값의 반복 또는 정책 반복을 통해 의사결정 정책을 생성하는 것이다. ADP 시스템은 ‘Raven’ 비행 대결 환경에서 게임 테스트를 거쳐 ADP가 인간이 부여한 전략적 규칙 없이도 효과적이고 완전한 공중전 전술을 스스로 학습할 수 있음을 입증했다. ADP는 환경에서 수많은 효과적인 전략을 탐색하고 학습 할 수 있으며, 모델을 적절하게 추상화하면 인간이 알지 못하는 공중전 전략을 이론적으로 만들 수 있음을 증명하였다. 하지만 ADP 알고리즘은 이상적인 항공기 대결만 적용할 수 있어 실제 공중전 시스템에 직접 적용하기에는 아직 어렵다.

  한편 2010년 Stanford University의 Andrew Y. Ng 팀은 헬리콥터 기동 비행 학습 시스템을 개발했다. 역강화학습 기반으로 무인 헬기의 제어전략 생성을 구현함과 동시에 일정한 환경 하에서 견고함을 가지고 있다. 제어전략 성능은 조종사의 능력보다 우수하고 더 안정적이고 신뢰할 수 있다. 그러나 공중전 대결 문제에 비해 헬리콥터 기동제어 문제는 상대적으로 단순하며 이 방법을 지능형 공중전 시스템에 직접 적용할 수 있다고 보기는 어렵다.

  특히 이번 단계에서 눈여겨 볼 사례는 공중전 응용의 배경과 더 밀접하게 통합되어 있는 인공 지능 근거리 공중전 프로젝트인 “Alpha Dog Fight”이다. DARPA의 전략기술실에서 주최한 이 프로젝트 챌린지는 인공지능 전투 알고리즘을 시연하고 검증하는 것을 목표로 하였다. 최종 인간 대 기계 전투에서 F-16 비행 교관이 패배하 였으며 Heron Systems는 심층 강화학습 기술과 다중 에이전트 분산 교육 시스템 아키텍처를 채택했다. 그런데 테스트 데이터 재생으로 판단하면 인공지능의 승리 비결은 뛰어난 조준 능력과 민첩한 기동 능력에 있지만 반면 창의적인 전술을 이해하는 능력은 상대적으로 부족했다. 요컨대 상태의 정확도와 감각의 속도에서는 인공 지능이 우세하지만 잠재력 판단과 지식의 예측에서는 유리하지 않았다.

  또한 2020년 11월 Red6와 EpiSci는 기술 시뮬레이션을 통해 지능형 알고리즘과 유인 훈련 기간의 공중 대결을 실현하였다. 트레이너는 Red6에서 제공하는 공중 전술증강현실 시스템을 이용하여 조종사의 헬멧 시야에 전장 환경을 투영 형태로 나타내고 이에 따라 지능형 알고리즘은 EpiSci에서 제공하는 전술 인공지능 시스템과 매칭되어 전술적 행동을 선택하였다. 같은 해 말, 미국의 U-2 정찰기에도 인공지능을 이용한 의사결정 시스템인 Artoo가 탑재되어 정찰기의 센서 시스템을 제어하면서 관련 업무를 수행할 수 있는 능력을 가지고 미사일 발사기 탐지 및 식별, 센서 제어, 전술 항법시스템 등에 적용되었다.

5. 시연 검증 단계: 스카이보그(Skyborg) 검증 기계

  2019년 3월 15일 미 공군 전략개발계획실험실 (SDPE; Strategic Development Planning and Experimentation)은 Skyborg 프로젝트에 대한 RFI 요청서를 발표하였고. 2023년에 자율 공중전을 위한 실험적 검증 플랫폼인 Skyborg를 제작할 계획이다. Skyborg는 2018년 미국 인공지능 전략 및 인공지능이 니셔티브를 직접 지원한다. 이를 통해 R2-D2 유형의 인공지능 시스템으로 향후에는 Luke Skywalker와 같은 유인 전투기의 부조종사 역할을 할 예정이다. 그리고 가까운 장래에는 전투기 조종사가 이 지능형 시스템과 통신할 수도 있다.

결언

  AML을 시작으로 거의 50년의 기술 축적 끝에 미 공군은 2019년에 기존 능력으로 통합 지능형 공중전 플랫폼을 개발하기에 충분하다고 예측했지만 실상은 미 공군 전략개발계획실험실에서 여전히 프로토타입 전투 플랫폼을 형성하고 있으며 기존의 지능적 능력과 수준은 여전히 실제 전투 장비에 적용하기 어렵다는 것을 보여 주고 있다. 최근 추진되고 있는 Skyborg 검증 기계에 지능기술을 적용하고 배치하는 것이 자율 공중전의 실제 적용을 촉진하는데 매우 중요 하고 이정표적 가치가 있음에도 불구하고 여전히 많은 문제와 과제가 있음은 부인할 수 없다. 마지막으로 영국 WIRED 2022년 2월 기사 (Ai 전투기 조종사가 하늘을 날면 어떻게 될까요? What Happens When Ai Fighter Pilots Take to the Skies?) 중에 자율공중전 알고리즘 개발에 대한 좋은 내용이 있어 소개한다.

물론, 문제는 미국과 중국 AI 세력이 충돌한다면 누가 이길 것인가 하는 것입니다.
AI 전투기의 우위는 엔진이나 미사일이 아니라 알고리즘에 있습니다. 즉, 경쟁 시스템보다 앞서기 위해 프로그램을 지속적으로 업데이트해야 합니다.
2022년은 미래 전쟁이 용감한 비행이 아니라
숙련된 코딩의 문제가 될 것임을 우리에게 보여줄 것입니다.


1969년 전문적 기동 논리 단계 AML 시스템 • 지능형 공중전투 기술의 첫 번째 체계적인 시도
• 적응형 기동 논리
• 전문적 시스템
1990년대 자율 공중전의 발전 PALADIN 시스템 • 인간의 경험에 의존하지 않고 자체 지식 기반 구축
• 공중전 규칙 자동 생성
• 룰 베이스의 모듈화
2000년대 규칙 진화 단계 양방향 적대적
학습 시스템
• 셀프 게임에 대한 대규모 유전자 알고리즘
• 인간 지식의 한계를 뛰어넘고 새로운 전술을 창조할 수 있음을 증명
2010년 기계학습 단계 ADP 시스템 • 적응형 동적 프로그래밍.
• 탐색을 통한 효과적인 전략 습득
• 항공기의 이산 행동(Discrete Action) 최적화 문제 해결
헬리콥터 조종
비행 학습 시스템
• 헬리콥터 호버 및 기동 제어를 위한 강화 학습
• 강화학습 환경((Environment)이 방해 요인
• 무인 헬리콥터에서 검증
2016년 시뮬레이터와 인간 조종사 대결에서 승리 • 유전자 퍼지 트리
• 진화적 규칙 기반 추론 시스템
• 알파(ALPHA) 공중전 시스템
2019년 근거리 WBR 자율 공중전 프로그램 • 심층 강화 학습
• 큰 점수로 인간에게 승리
• 알파도그 파이트 (Alpha Dog Fight)
2019년 실증 검증 단계 Skyborg 검증 • 인공지능 공중전 테스트 플랫폼
• 프로토타입으로 점진적 운영 시작
2020년 실기와 스마트 머신 간의
세미 시뮬레이션 대결
• 기술적 시뮬레이션으로 세미 시뮬레이션 스마트 머신 생성
• 증강 현실 헬멧 디스플레이 등장
• 전술 인공지능 시스템 탑재

<표> 미국 자율 공중전 알고리즘 시스템 개발과 발전

TOP