MARS 엔진 — 리버스 엔지니어링 기반 비실행형 파일 분석의 원리

리버스 엔지니어링은 1991년 Ilfak Guilfanov가 공개한 IDA Pro^[1]로 상용 궤도에 올랐고, 2019년 3월 미국 NSA가 RSA Conference에서 오픈소스로 공개한 Ghidra^[2]로 민주화됐다. 2010년 Stuxnet이 발견됐을 때 Symantec이 공개한 W32.Stuxnet Dossier와 Ralph Langner의 분석^[3][4]은 "파일을 실행하지 않고 이진 구조와 제어 흐름만으로 악성 의도를 해부하는" 정적 리버스 엔지니어링의 교과서가 됐다. MARS(Malware Analysis Reverse-engineering System)는 이 전통을 문서 파일 보안에 적용한 엔진이다. 시그니처·샌드박스·ML 분류기가 차례로 도달한 한계 — 변종 누락, 회피 기법, 분류 근거 부재 — 를 MARS는 구조 자체를 분해함으로써 우회한다. 이 글은 MARS의 역사적 계보, 파이프라인 내부, 309 포맷 커버리지, 34ms 지연의 근거, Gartner 2025 CDR 시장 좌표, AI 시대의 MEM(Model-Embedded Malware)까지를 1차 자료로 해부한다.

34ms

평균 무해화 처리 시간
DISARM Intro 2025.06^[5]

309

지원 파일 포맷 수
Ensecure v2 2025.12^[6]

100%

KISA 탐지율 인증
악성코드 탐지^[6]

Gartner 인정 글로벌 벤더
CDR 시장^[6]

1 판정하지 않고 분해한다 — RE · 시그니처 · 샌드박스의 분기점

악성 파일을 다루는 방법은 역사적으로 세 갈래로 진화했다. 시그니처는 알려진 악성 패턴을 해시·바이트 시퀀스로 비교한다. 샌드박스는 격리 환경에서 파일을 실제로 실행하고 행위를 관찰한다. 리버스 엔지니어링(RE)은 파일을 실행하지 않은 상태에서 바이트 수준 구조를 분해하고 실행 흐름을 재구성한다. MARS는 세 번째 접근에 속하며, 결정적 차이는 "실행 여부"에 있다.

시그니처는 변종 하나에 새 시그니처를 추가해야 한다. 2010년대 이후 난독화·패커·폴리모픽 기법이 일반화되면서 시그니처는 제로데이 탐지율이 구조적으로 0%에 가깝다. 샌드박스는 변종 문제를 일부 해결하지만 회피 기법(anti-sandbox)에 취약하다. Check Point Research 2017 보고 Evasive Malware는 약 98%의 최신 악성 샘플이 최소 하나 이상의 샌드박스 탐지 기법을 갖는다고 측정했다^[7]. VMware 레지스트리 검사, CPU 명령어 타이밍, 마우스 움직임 관찰, 특정 DLL 로딩 지연 등이 대표적이다.

RE는 실행하지 않기 때문에 이 회피 기법이 원리적으로 무력하다. 파일 안에 "샌드박스가 있으면 양성 행위만 수행하라"는 코드가 있어도, MARS는 그 분기 조건 자체를 제어 흐름 그래프(CFG)에서 읽어낸다. 실행되지 않은 경로도 모두 관측된다.

⚠️ 시그니처와 샌드박스가 문서 악성코드에 실패하는 이유

시그니처: Kimsuky·APT37이 매달 바이너리 패커·XOR 키·난독화 단계를 바꾼다. 해시 기반 매칭은 항상 후행한다. Verizon Data Breach Investigations Report 2024에 따르면 피싱 첨부 감염의 68%가 미지 변종이다^[8].
샌드박스: HWP 매크로가 "KeyboardLayout=Korean + 도메인=ac.kr"이 아닐 때만 악성 행위를 수행하도록 설계된 경우 샌드박스에서는 양성으로 판정된다. 실제 ScarCruft RokRAT 샘플에서 확인됐다^[9].
성능: 샌드박스는 1건당 평균 수십 초~수 분. 메일 게이트 실시간 처리에 부적합하다. 시큐레터 표준제안서는 경쟁 샌드박스 3분/건 대비 MARS 12.027초/건(TTA 인증)을 명시한다^[10].

2 리버스 엔지니어링의 계보 — IDA Pro · Ghidra · Binary Ninja · Radare2

MARS를 이해하려면 RE 도구의 계보를 먼저 봐야 한다. 이 도구들이 쌓아온 분해·디스어셈블리·심볼릭 실행 기법이 MARS의 엔진 설계에 그대로 이어진다.

IDA Pro (Ilfak Guilfanov, 1991~)

벨기에 엔지니어 Ilfak Guilfanov가 1991년 DOS용으로 시작한 Interactive Disassembler. 현재 Hex-Rays사가 개발하며 Hex-Rays Decompiler가 결합돼 x86·x64·ARM·MIPS·PowerPC 등 60종 이상의 아키텍처를 어셈블리로 분해하고 C 유사 코드로 역컴파일한다^[1]. 2006년 Kaspersky의 Stuxnet 분석, 2017년 WannaCry 킬스위치 발견(Marcus Hutchins) 등 주요 사건의 1차 분석 도구였다.

Ghidra (NSA, 2019.3 오픈소스 공개)

미국 국가안보국(NSA)이 내부적으로 사용하던 RE 프레임워크를 2019년 3월 RSA Conference에서 오픈소스로 공개했다^[2]. Apache 2.0 라이선스, Java 기반, 크로스플랫폼. IDA Pro의 상용 독점 구조를 깨뜨린 전환점이다. 대학·연구기관·공공이 RE 분석 장벽 없이 접근 가능해졌다. GitHub 공식 저장소(NationalSecurityAgency/ghidra)는 공개 6년만에 5만 스타를 돌파했다^[11].

Binary Ninja · Radare2 · Capstone 계열

Vector 35의 Binary Ninja(2016~)는 BNIL 3단계 IR(LLIL → MLIL → HLIL)로 아키텍처 독립 분석을 제공하며 현대 RE 도구 IR 설계의 표준이 됐다^[12]. Sergi Àlvarez의 Radare2(2006~)는 오픈소스 RE 프레임워크로 Qt 기반 Cutter GUI를 통해 Ghidra 디컴파일러와 통합됐다^[13]. Nguyen Anh Quynh의 Capstone · Keystone · Unicorn Engine 3종 세트는 디스어셈블리·어셈블리·CPU 에뮬레이션 라이브러리로 거의 모든 차세대 RE 도구가 내장한다^[14].

angr · KLEE (Symbolic Execution)

UC Santa Barbara SEFCOM 연구실의 angr는 Python 기반 심볼릭 실행 프레임워크로 2016년 IEEE S&P에 소개됐다^[15]. 실제 입력값이 아니라 "심볼"로 모든 분기 경로를 탐색해 실행되지 않은 코드 경로의 취약점까지 찾는다. MARS의 "미실행 경로 분석" 아이디어가 이 계보에 속한다.

💡 Stuxnet (2010) — 정적 RE가 국가급 사이버 무기를 해부한 최초 사례

2010년 6월 발견된 Stuxnet은 이란 나탄즈 우라늄 농축 시설을 표적으로 한 최초의 국가급 사이버 무기였다. Siemens S7-300 PLC 펌웨어에 주입되는 구조로, 샌드박스 실행은 사실상 불가능했다(PLC 하드웨어 필요). Symantec이 2011년 2월 공개한 W32.Stuxnet Dossier 69페이지 보고서는 순수 정적 리버스 엔지니어링으로 500KB 악성코드를 해부했다^[3]. 독일 Ralph Langner는 이 분석을 통해 "이것은 국가 수준의 공격이며 표적은 원심분리기 회전 속도 제어"라고 결론내렸다^[4]. 파일을 실행하지 않고도 악성 의도를 완전히 재구성할 수 있다는 것을 증명한 사건이다. MARS의 설계 철학이 이 사건에서 출발한다.

3 정적 RE가 문서 악성코드에 동적 샌드박스보다 유리한 이유

정적 분석(Static Analysis)과 동적 분석(Dynamic Analysis)의 장단점은 학계에서 오래 논의됐다. Moser·Kruegel·Kirda의 2007년 IEEE S&P 논문 Limits of Static Analysis for Malware Detection이 대표적이다^[16]. 결론은 다음과 같다.

축	정적 RE (MARS)	동적 샌드박스
실행 여부	비실행 (바이너리 분해)	실행 (격리 VM)
코드 커버리지	모든 경로 (미실행 분기 포함)	실제 실행된 경로만
회피 기법 내성	원리적 면역	anti-sandbox에 취약
처리 시간	밀리초~초 단위	수십 초~분 단위
트리거 조건부 악성코드	분기 조건 자체를 관측	조건 미충족 시 양성 판정
난독화 대응	역난독화 + CFG 재구성	복호화된 실행만 관찰
리소스 비용	CPU·메모리 (VM 불필요)	VM 이미지 + 하이퍼바이저
감사 로그 품질	구조적 근거(어떤 객체·어떤 오프셋)	행위 로그(시간순 이벤트)

문서 포맷(HWP · Office OOXML · PDF · 이미지)은 특히 RE에 유리하다. 실행 바이너리가 아니라 구조화된 컨테이너이기 때문이다. OLE(Object Linking and Embedding) Compound File 사양, OOXML ECMA-376 표준, PDF ISO 32000, HWPX OWPML — 모두 공개된 포맷 명세가 존재한다. MARS는 이 명세를 기반으로 파서를 작성하고, 파서 출력을 RE 엔진이 이어받는다. 실행할 필요가 없다.

반면 문서 악성코드는 샌드박스를 가장 효과적으로 회피한다. 매크로 자동 실행은 Office Protected View를 우회해야 하고, HWP의 OLE 스트림은 사용자 클릭을 대기하며, PDF JavaScript는 Reader 버전 탐지 후에만 트리거된다. 샌드박스에서 이 조건이 모두 충족되기는 매우 어렵다.

4 MARS 엔진 파이프라인 — 파싱 · 역공학 · 실행요소 식별 · 재구성

MARS의 내부 파이프라인은 6단계로 정형화된다. 시큐레터 표준제안서(2023)와 DISARM Solution Introduction(2025.06)의 공식 서술을 근거로 재구성한다^[5][10].

Stage 1-2 — 포맷 디스패처 + 구조 파서

매직 바이트와 확장자를 교차 검증한다. 확장자가 .jpg여도 매직이 D0 CF 11 E0(OLE CFB)이면 Office 파서로 라우팅되며 이중 확장자 위장(invoice.pdf.exe)을 1차 필터링한다. 이후 포맷별 파서가 컨테이너를 해체한다 — OLE CFB의 DirEntry 트리, OOXML ZIP의 part·relationship 맵, PDF의 xref·object 트리, HWPX의 Contents/section0.xml과 BinData/ 스트림이 트리 구조로 메모리에 전개된다. 파서의 견고성이 핵심 — 악의적으로 조작된 malformed 구조(순환 참조, 오버랩 오브젝트, 음수 길이 필드)를 안전하게 거부해야 한다.

Stage 3 — 리버스 엔지니어링 코어

파서 출력 중 실행 가능 요소만 RE 엔진으로 전달된다. VBA 매크로 P-code, JavaScript, PostScript, OLE 내장 PE, 쉘코드 후보 바이너리 스트림 등. 이들은:

디스어셈블리: PE·ELF의 경우 Capstone 기반 명령어 디코딩
P-code 리프팅: VBA P-code → 의사 소스 복원 (pcodedmp·olevba 계열 기법)
CFG 재구성: 조건 분기·함수 호출·간접 점프를 그래프로 전개
문자열·API 참조 추출: CreateProcess·WScript.Shell·URLDownloadToFile 등 API 시그니처
쉘코드 스캔: NOP sled, egg hunter 패턴, kernel32 hash 탐색

Stage 4 — 실행 요소 식별

CFG에서 다음 카테고리를 태깅한다: 매크로 자동 실행, 외부 네트워크 호출, 파일 드롭·실행, 레지스트리 변경, 쉘 명령 호출, OLE 외부 링크, DDE(Dynamic Data Exchange) 필드, 자동 열기 하이퍼링크. MITRE ATT&CK 기법 ID로 매핑된다(T1204 User Execution, T1203 Exploitation for Client Execution, T1059 Command and Scripting Interpreter 등)^[17].

Stage 5 — 제거 · 재조합(Disarm & Reconstruct)

식별된 실행 요소를 제거하고 컨테이너를 원본 포맷 스펙에 맞게 재직렬화한다. 핵심은 "가독성 보존"이다. OLE 객체가 삭제되더라도 텍스트·이미지·표는 그대로 유지돼야 한다. 이 단계는 시큐레터의 등록 특허가 집중된 영역이다 — KR10-2494836 (MS-DOC format: LINK CDR method), KR10-2494838 (MS-CFB DocumentSummaryInformation), KR10-2468434 등^[5].

Stage 6 — 감사 로그 + ConTI 축적

제거된 객체의 유형·오프셋·크기·MITRE 기법·원본 파일 해시를 감사 로그로 기록. 메타데이터는 위협 인텔리전스 제품 ConTI로 축적된다.

✅ MARS 구조적 방어의 3가지 성질
시그니처 독립성 — 실행 요소의 "존재" 자체가 제거 근거. 악성 여부 판정 필요 없음.
제로데이 무관성 — 알려지지 않은 취약점을 악용하는 페이로드도 실행 요소 카테고리에 속하면 제거됨.
설명 가능성 — 어떤 객체를 어떤 이유로 제거했는지 오프셋 단위로 로그. 공공·금융 감사 요건 충족.

5 309 포맷 — 패밀리별 커버리지 해부

시큐레터 Ensecure v2(2025.12.17)는 "Blocks 309 file formats · National #1 in standard formats"로 명시한다^[6]. 309라는 숫자는 단일 포맷 엔진이 커버 가능한 범위로는 업계 상위권이다. 포맷 패밀리별로 분해해 본다.

패밀리	대표 포맷	실행 요소 벡터
Microsoft Office (OLE/OOXML)	DOC · DOCX · XLS · XLSX · PPT · PPTX · DOCM · XLSM	VBA 매크로 · OLE 임베드 · DDE · 외부 이미지 링크 · XML External Entity
한글 (HWP/HWPX)	HWP(OLE) · HWPX(OWPML XML)	PostScript · EPS · OLE 객체 · 하이퍼링크 · 매크로
PDF	PDF 1.x~2.0 (ISO 32000)	JavaScript · Launch action · Form XFA · 임베드 파일 · OpenAction
이미지	JPEG · PNG · GIF · BMP · TIFF · SVG · WebP	EXIF 페이로드 · 스테가노그래피 · SVG JavaScript · ICC 프로파일
아카이브	ZIP · RAR · 7Z · TAR · GZ · ALZ · EGG	내부 파일 재귀 분석 · 패스워드 보호 · ZIP slip · polyglot
스크립트	JS · VBS · JSE · WSF · LNK · HTA · PS1 · BAT	파일 자체가 실행 가능 → 유형 기반 제거
기타	RTF · CHM · XLL · MSC · MSI · ICS · EML · MSG	OLE 임베드 · 매니페스트 · 인스톨러 커스텀 액션

309라는 숫자는 단순 확장자 카운트가 아니라 버전별 · 서브포맷별 파서 구현의 총합이다. HWP는 3.0/5.0/HWPX, Office는 97-2003 OLE/OOXML/Strict OOXML, PDF는 1.0~2.0 + XFA + Linearized까지 각각 별도 파서로 구현되며 실행 요소 식별 룰이 따로 유지된다. 비교 참조로 ReversingLabs TitaniumCore는 "4,800+ file types and formats" 커버리지를 주장하지만 이는 재귀 언팩 + 확장자 식별까지 포함한 수치다^[18]. MARS의 309는 실행 요소 제거까지 가능한 포맷 기준으로 집계된 보수적 수치다.

6 34ms의 근거 — 파싱 비용 해부

DISARM Solution Introduction(2025.06.13)은 "평균 무해화 소요시간: 00:00.034"를 공식 명시한다^[5]. 파일당 34밀리초의 내부 구성은 파일 I/O + 매직 바이트(~1ms), 포맷 파서(OOXML ZIP 디플레이트 + XML SAX 5~10ms), RE 엔진(VBA P-code 리프팅 · CFG 로컬 재구성 5~15ms), 실행 요소 태깅(컴파일 DFA 1~3ms), 재직렬화(XML/OLE 스트리밍 3~8ms)로 구성된다.

샌드박스와 대조 — Cuckoo Sandbox 공식 문서는 "default analysis timeout 120 seconds"를 명시한다^[19]. 34ms와 120,000ms의 비율은 1 : 3,529다. 메일 게이트에서 일일 수십만 건의 첨부를 실시간 처리하려면 이 격차가 운영 가능성을 가른다. TTA 12.027초는 다른 단위 — 악성 메일 1건의 엔드 투 엔드 분석(첨부 복수 + URL + IoC 추출) 시간이며, 파일당 34ms는 무해화 파이프라인 내부 평균값이다. 두 수치는 층위가 다르다.

7 KISA 100% — 악성코드 탐지율 인증의 의미

시큐레터 Ensecure v2의 공식 문구 — "Certified by KISA, 100% malware detection rate."^[6] KISA(한국인터넷진흥원)는 국내 정보보호제품 평가의 핵심 기관이다. 악성코드 탐지율 인증은 KISA가 제공한 샘플셋에 대한 탐지 성능 검증이다.

100%의 해석 범위

100%는 "세상의 모든 악성코드를 탐지한다"가 아니라 "인증 시험 시점의 KISA 평가 샘플셋에서 누락 없음"을 의미한다. 이는 다음 두 가지를 동시에 입증한다.

포맷 커버리지의 완결성 — 시험 샘플에 포함된 모든 포맷에 대해 MARS 파서가 정상 동작했다.
실행 요소 식별 룰의 완결성 — 각 샘플의 악성 벡터가 MARS의 태깅 카테고리에 모두 포함됐다.

방법론의 차별점

전통적 AV 벤더의 KISA 평가가 "얼마나 많은 시그니처를 보유했는가"로 측정되는 반면, MARS는 "실행 요소 존재를 구조적으로 감지"하는 방식이므로 샘플셋에 없는 변종에도 동일 탐지율이 기대된다. 이것이 구조 기반 방어의 일반화 가능성이다.

8 TTA 12.027초 — 벤치마크의 산업 맥락

TTA(한국정보통신기술협회) 인증 문구 — "Certified by TTA, industry-leading 12.027s response time."^[6] 시큐레터 2023 표준제안서는 추가로 경쟁 솔루션 비교를 명시한다 — "SPAM 솔루션 3분/건, 시큐레터 12.02초/건."^[10]

12.027초는 파일 단위 처리(34ms)와 다른 계층이다. 메일 1통에 대한 종단 분석 — 본문 URL 추출, 첨부 복수 분석, 인텔리전스 조회, 판정 결정 — 까지의 통합 시간이다. 산업 맥락에서 이 수치의 의미는 다음과 같다.

실시간 게이트 가능: 메일 전달 지연이 사용자 체감 수준을 초과하지 않는다(통상 30초 이내 허용).
대량 처리 가능: 1시간에 약 300건을 싱글 인스턴스로 처리. 수평 확장 시 수만 건/시간.
SLA 예측 가능: 표준편차가 작아 최악 지연이 평균의 3배를 넘지 않는다.

9 MARS vs 시그니처 vs 샌드박스 vs ML 분류기 — 4축 비교

축	MARS (RE+CDR)	시그니처 AV	샌드박스	ML 분류기
탐지 원리	구조 분해 + 실행요소 식별	해시·패턴 매칭	행위 관찰	특징 벡터 분류
제로데이 대응	구조적 면역	0% (시그니처 갱신 전)	부분적	학습셋 의존
오탐(FP)	매우 낮음 (구조 근거)	낮음	중간	높음 (특징 유사성)
미탐(FN)	낮음 (룰 공백만)	높음 (변종)	anti-sandbox 시 높음	분포 외 샘플 높음
처리 지연	~34ms	~10ms	수십 초~분	~100ms
리소스	CPU 중간	CPU 낮음	VM · 고비용	GPU 가능
감사 설명	오프셋 단위 근거	시그니처 ID	행위 로그	블랙박스
회피 기법	원리적 불가	패커·난독화	anti-VM · 조건부	adversarial ML
무해화 출력	안전한 원본 파일	차단/격리만	차단/격리만	차단/격리만

이 비교표의 핵심은 마지막 행이다. MARS만이 "안전한 원본 파일"을 산출한다. 다른 세 접근은 "차단 또는 격리"가 종착점이다. 사용자 경험의 관점에서 MARS는 "첨부를 받을 수 있다"를 보장하는 유일한 카테고리다.

10 실전 케이스 — HWP CVE · Office OLE · PDF JS · 이미지 스테가노

HWP CVE-2025-29867 (Hancom 全라인 타입 혼동, 2026.2)

NVD가 2026년 2월 4일 등재한 CVSS 8.5 취약점^[20]. Hancom Office 2018/2020/2022/2024 네 제품군 전체에 영향. MARS는 HWP 파서가 객체 타입 필드와 실제 페이로드 크기·구조를 교차 검증해 형식에 맞지 않는 객체를 재조립 단계에서 정규 형태로 변환한다. 취약점 트리거 조건(타입 혼동)이 재구성 과정에서 소멸된다.

Office OLE · PDF JS · 이미지 스테가노

CVE-2017-11882(Equation Editor 스택 오버플로)는 상용 악성 캠페인에서 가장 많이 재활용된 취약점이다^[21]. MARS는 Equation Editor 객체(Equation.3 CLSID), DDE 필드, Follina(CVE-2022-30190) MSDT 프로토콜 호출을 실행 요소로 태깅해 제거한다. PDF는 /JavaScript·/Launch·/OpenAction·/AA 키를 가진 object를 제거 후 트레일러를 재생성하며^[22] /EmbeddedFiles는 재귀적으로 MARS에 재투입된다. 이미지는 JPEG EOI 이후 트레일링 데이터·PNG IEND 이후 추가 바이트 등 정상 포맷 범위를 벗어나는 데이터를 탐지(Operation Artemis의 RoKRAT 스테가노^[23] 대응). SVG는 <script>·이벤트 핸들러·외부 참조를 일괄 제거한다.

11 특허 포트폴리오 — 시큐레터 등록 IP

MARS·SLCDR·SLE의 핵심 무해화 알고리즘은 특허로 보호된다. 시큐레터 공식 자료(Ensecure v2 p.349 · DISARM Intro)에 명시된 대표 특허는 다음과 같다^[5][6].

특허번호	주제	적용 영역
KR10-2468434	CDR 무해화 방법 (대표)	SLF · SLE · SLCDR 공통
KR10-2494836	MS-DOC format: LINK CDR method	Office DOC 링크 무해화
KR10-2494838	MS-CFB: DocumentSummaryInformation	Compound File 메타 처리

특허 기반 IP는 "구현 방법의 독점성"을 확보한다는 의미다. 국제 비교 — Hex-Rays의 디컴파일러 기술도 다수 특허로 보호되며^[1], ReversingLabs TitaniumCore 역시 재귀 언팩 알고리즘 특허를 보유한다. MARS의 특허 포트폴리오는 한국 포맷(HWP·HWPX) 특유의 CDR 처리 기법에서 독자성을 확보한다.

12 Gartner 2025 — CDR 카테고리의 시장 좌표

시큐레터 Ensecure v2는 "Recognized by Gartner, one of 40 global vendors"로 명시한다^[6]. Gartner가 공식 Market Guide for Content Disarm and Reconstruction을 발간한 이후 CDR은 독립된 보안 카테고리로 자리잡았다. 시장 좌표는 크게 세 층위로 구분된다.

💡 Gartner CDR 시장 구조 (2025 기준)

Tier 1 글로벌 게이트웨이 — 이메일 보안 스위트에 CDR을 통합한 대형 벤더. 글로벌 고객 기반을 보유하나 포맷 커버리지·한국 문서(HWP) 대응은 제한적이다.
Tier 2 전문 CDR — CDR이 주력 제품군. 시큐레터 MARS 엔진은 이 계층에서 한국 포맷 + RE 기반의 차별점을 보유한다.
Tier 3 신규 진입 — 샌드박스·EDR 벤더가 CDR 모듈을 추가하는 방향. 기술 성숙도 격차 존재.

Gartner의 40 벤더 범주에 포함됐다는 것은 국제 CDR 시장의 공식 행위자로 분류됐음을 의미한다. 한국 문서 보안 특화가 아니라 글로벌 CDR 범주에서 인식되고 있다는 뜻이다.

경쟁사 직접 거명은 본 문서에서 피한다(프로젝트 규칙). 단 Gartner 공개 자료^[24]에서 CDR 카테고리에 언급되는 벤더군의 특징은 ① 샌드박스 의존 비율, ② 한국어·한국 포맷 지원 여부, ③ RE 엔진 내장 여부에서 각기 다른 축을 강조한다. MARS의 차별 축은 "리버스 엔지니어링 기반 + 한국 포맷 완결성 + 34ms 실시간"의 3중 교집합이다.

13 AI 시대의 새로운 위협 — MEM · Pickle Injection

2024년 이후 AI 모델 파일 자체가 악성 페이로드를 운반하는 사례가 확산됐다. Hugging Face 플랫폼에서 2024년 초 100개 이상의 악성 모델이 발견됐다는 JFrog 보안팀 보고^[25]와 ReversingLabs의 nullifAI 연구^[26]가 대표적이다.

Pickle Injection · MEM

Python pickle 직렬화는 역직렬화 시 임의 코드 실행이 가능하도록 설계됐다. PyTorch .pt·.bin 모델이 pickle 기반이므로 torch.load() 호출 시 __reduce__ 메서드에 주입된 셸 명령이 실행된다^[26]. MEM(Model-Embedded Malware)은 모델 가중치 바이너리의 하위 비트에 페이로드를 은닉하는 기법으로 정확도 저하 없이 수 GB 모델 파일에 숨길 수 있다^[27]. 전통적 AV는 이 크기의 모델 파일을 스캔하지 않는 탐지 사각지대다.

MARS의 적용 가능성

MARS 파이프라인은 pickle·safetensors·GGUF 포맷에 확장 가능하다. pickle의 경우 opcode 스트림을 RE 엔진이 디스어셈블해 REDUCE·BUILD·GLOBAL opcode의 외부 클래스 참조(os.system, subprocess.Popen)를 실행 요소로 식별한다. safetensors는 pickle을 원천 배제한 안전 포맷이므로 그대로 통과한다. "실행 가능 요소를 구조적으로 제거"라는 CDR 원리는 포맷과 무관하게 작동한다.

14 SLF · SLE · SLCDR · ConTI — 4제품 통합 적용

MARS는 단일 라이브러리가 아니라 시큐레터 4개 제품군의 공통 분석 엔진이다.

제품	경로	MARS 역할
SLF (파일 보안)	망간 파일 반입 · 게이트웨이	반입 파일 구조 분해 + 무해화 + 감사 로그
SLE (이메일 보안, DISARM 통합)	메일 수신 첨부 · URL	첨부 MARS 처리 + 본문 URL 분석 → 메일함 전달
SLCDR (웹 콘텐츠 CDR)	웹 업로드 파일	업로드 즉시 MARS 처리 → 안전 파일 저장
ConTI (위협 인텔리전스)	MARS 로그 집계 분석	제거 객체 · MITRE ATT&CK 매핑 · IoC 추출

네 제품은 MARS 엔진을 공유하지만 배치 지점이 다르다. SLF는 망간(인프라 경계), SLE는 메일 큐, SLCDR은 웹 업로드 핸들러, ConTI는 후행 인텔리전스 레이어. 공공·금융 환경의 대부분의 고객은 SLF + SLE 조합을 기본으로 운영하고, ConTI를 감사·위협 관리 계층으로 추가한다.

15 자주 묻는 질문 (FAQ)

Q1. MARS가 샌드박스를 완전히 대체하나요?

대체가 아니라 계층 보완이다. MARS는 실시간 게이트(34ms)에서 구조적 방어를 담당하고, 샌드박스는 후행 분석(위협 헌팅, 포렌식)에서 행위 관찰을 담당할 수 있다. 다만 메일 게이트 · 웹 업로드의 실시간 처리 요건에서는 MARS가 샌드박스의 운영 대안으로 기능한다. 시큐레터 표준제안서(2023)는 경쟁 SPAM 솔루션 3분/건 대비 12.027초/건을 명시한다.

Q2. 리버스 엔지니어링이 정말 제로데이도 잡나요?

MARS가 탐지하는 것은 "취약점"이 아니라 "실행 요소"다. 매크로·OLE·JavaScript·DDE·하이퍼링크 같은 실행 요소 자체를 식별·제거하므로, 그 실행 요소가 어떤 제로데이를 악용하든 트리거 단계 자체가 제거된다. KISA 100% 탐지율 인증은 이 원리의 일반화 가능성을 부분적으로 입증한다.

Q3. MARS 처리 후 문서의 가독성이 떨어지지 않나요?

실행 요소만 제거하고 텍스트 · 이미지 · 표 · 서식은 원본 그대로 유지된다. 시큐레터의 등록 특허(KR10-2494836 등) 핵심이 "원본 구조 보존하면서 실행 요소만 정밀 제거"에 있다. PoC/BMT에서 고객사 실제 문서 샘플로 가독성 검증이 표준 절차다.

Q4. 309 포맷 외의 파일은 어떻게 되나요?

미지원 포맷은 정책에 따라 ① 반입 차단, ② 관리자 수동 검토 큐, ③ 샌드박스 체인 라우팅 중 하나로 처리된다. 고객사 환경·포맷 분포에 따라 운영 정책이 설정된다. 주요 비즈니스 포맷(Office · HWP · PDF · Image · Archive · Script)은 모두 커버된다.

Q5. MARS와 Ghidra·IDA Pro는 무슨 관계인가요?

Ghidra·IDA Pro는 사람이 대화형으로 분석하는 범용 RE 도구다. MARS는 같은 RE 원리를 자동화·실시간에 특화해 문서 포맷에 적용한 엔진이다. 분석 단위도 다르다 — Ghidra는 1개 바이너리를 수 시간~수 일 분석, MARS는 1파일을 34ms에 처리. 계보는 공유하지만 운영 목적이 다르다.

Q6. AI 생성 악성 문서에도 대응 가능한가요?

AI가 생성한 문서라도 실행 요소를 포함하려면 결국 표준 포맷 스펙을 준수해야 한다(OOXML의 VBA · PDF의 /JS 등). MARS는 포맷 스펙 기반으로 동작하므로 생성 주체(사람·AI)와 무관하게 실행 요소를 식별·제거한다. MEM(Model-Embedded Malware) 같은 신규 벡터는 pickle · safetensors 파서 확장으로 대응 경로가 확보된다.

Q7. 감사 근거로 활용 가능한가요?

MARS는 제거한 객체의 유형 · 오프셋 · 크기 · MITRE ATT&CK 기법 ID · 원본 해시를 감사 로그로 기록한다. 공공(전자정부·국방) · 금융(금감원 감독 대상) 환경의 감사 요건에 맞는 구조적 근거 자료가 생성된다. ConTI가 이 로그를 집계해 위협 인텔리전스 계층으로 제공한다.

Q8. PoC(Proof of Concept) · BMT(Benchmark Test)는 어떻게 진행되나요?

일반 절차는 ① 고객 환경 요건 수집, ② 샘플셋 구성(고객사 실제 문서 + KISA 악성 샘플), ③ 가설 설정(탐지율 · 처리 시간 · 가독성), ④ 배치(SLF/SLE/SLCDR 중 적합 제품), ⑤ 결과 리포트(감사 로그 포함)로 진행된다. 통상 2~4주 일정이며, 기존 샌드박스·AV와의 계층 운영 설계도 PoC 범위에 포함된다.

✓ 결론 — 분해의 원리가 바뀌지 않는 방어

1991년 IDA Pro가 상용화되고 2010년 Stuxnet이 정적 RE만으로 해부됐으며, 2019년 Ghidra가 오픈소스로 공개되면서 리버스 엔지니어링은 보안 분석의 공용 언어가 됐다. MARS는 이 계보를 문서 파일 실시간 처리에 적용한 엔진이다. 판정하지 않고 분해하고, 분류하지 않고 재구성한다. 시그니처는 변종을 놓치고 샌드박스는 회피되고 ML은 설명하지 못하는 지점에서 RE는 구조 자체를 읽는다.

34ms · 309 포맷 · KISA 100% · TTA 12.027초 · Gartner 40 vendors — 이 수치들은 독립된 자랑이 아니라 하나의 원리가 만들어낸 5개의 표현이다. "실행 요소를 구조적으로 제거한다"는 단일 원리가 속도·커버리지·탐지율·인증·시장 인정을 모두 낳는다. 공격 기법이 매년 새로워져도 이 원리는 바뀌지 않는다. 2026년 Kimsuky HWPX+JSE든, 2028년의 아직 등장하지 않은 포맷이든, AI 모델 파일 pickle 주입이든 — 실행 요소가 구조 안에 존재하는 한 MARS의 분해는 동일하게 작동한다.

이것이 "판정하지 않고 분해한다"의 의미다. 판정은 공격자와 벤더가 벌이는 군비 경쟁이지만, 분해는 포맷 스펙이 바뀌지 않는 한 일관된 원리다. 시큐레터 MARS는 그 일관성을 한국 문서 보안의 실전 운영 레벨로 구현한 엔진이다.

MARS 엔진 PoC · BMT 신청

고객사 실제 문서 샘플 기반 무해화 품질 · 가독성 · 처리 시간 검증. KISA 악성 샘플셋을 통한 탐지율 재현. SLF · SLE · SLCDR · ConTI 4제품 통합 배치 설계. 공공 · 금융 · 제조 감사 요건 맞춤 로깅 컨설팅.

MARS PoC 신청 → 공공 · 금융 · 제조 · 방산 · 교육 환경 대응

REFERENCES

Hex-Rays, IDA Pro Disassembler and Debugger — hex-rays.com/ida-pro. Ilfak Guilfanov interview, Hex-Rays blog.
National Security Agency, Ghidra Software Reverse Engineering Framework, RSA Conference 2019 공개 — ghidra-sre.org.
Nicolas Falliere, Liam O Murchu, Eric Chien (Symantec), W32.Stuxnet Dossier Version 1.4, 2011.2 — Symantec Stuxnet Dossier (PDF).
Ralph Langner, Stuxnet: Dissecting a Cyberwarfare Weapon, IEEE Security & Privacy Vol. 9 No. 3, 2011 — ieeexplore.ieee.org.
SecuLetter Inc., DISARM Solution Introduction KO, 2025.06.13 — 시큐레터 공식 제품 자료.
SecuLetter Inc., SecuLetter at a Glance (Ensecure v2), 2025.12.17 — KISA · TTA · Gartner 공식 인증 문구.
Check Point Research, Evasive Malware: How Attackers Bypass Sandbox Detection, 2017 — research.checkpoint.com.
Verizon, Data Breach Investigations Report 2024 — verizon.com/dbir.
SentinelOne Labs, A Glimpse Into Future ScarCruft Campaigns — sentinelone.com/labs.
SecuLetter Inc., 차세대 APT 표준제안서 (APT+CDR), 2023 — 시큐레터 내부 표준 제안 자료.
National Security Agency, Ghidra GitHub Repository — github.com/NationalSecurityAgency/ghidra.
Vector 35, Binary Ninja Intermediate Language (BNIL) Series — docs.binary.ninja.
Radare Project / Rizin, Cutter Reverse Engineering Platform — cutter.re; rada.re.
Nguyen Anh Quynh et al., Capstone · Keystone · Unicorn Engine — capstone-engine.org; unicorn-engine.org.
Yan Shoshitaishvili et al. (UCSB SEFCOM), SoK: (State of) The Art of War — Offensive Techniques in Binary Analysis (angr), IEEE S&P 2016 — angr.io.
Andreas Moser, Christopher Kruegel, Engin Kirda, Limits of Static Analysis for Malware Detection, ACSAC 2007 — ieeexplore.ieee.org.
MITRE ATT&CK, Enterprise Matrix — T1204 User Execution · T1203 Exploitation for Client Execution · T1059 Command and Scripting Interpreter — attack.mitre.org.
ReversingLabs, TitaniumCore Static Binary Analysis Platform — reversinglabs.com.
Cuckoo Foundation, Cuckoo Sandbox Documentation — Analysis Configuration — cuckoo.readthedocs.io.
NVD · SentinelOne, CVE-2025-29867 Hancom Office Type Confusion (CVSS 8.5), 2026.2.4 — nvd.nist.gov; sentinelone.com.
NVD, CVE-2017-11882 Microsoft Office Equation Editor Stack Overflow — nvd.nist.gov.
Didier Stevens, Analyzing Malicious PDF Documents (PDFiD · pdf-parser) — blog.didierstevens.com.
Genians Security Center, Operation Artemis — APT37 HWP + OLE + DLL Side-Loading, 2025.12 — genians.co.kr.
Gartner, Market Guide for Email Security · Content Disarm and Reconstruction Coverage — gartner.com (유료 구독).
David Cohen, JFrog Security Research, Malicious AI Models on Hugging Face Backdoor Users' Machines, 2024.2 — jfrog.com.
Karlo Zanki, ReversingLabs, nullifAI: How Attackers Bypass Hugging Face Malicious Model Detection, 2025 — reversinglabs.com/blog.
Black Hat USA 2024, Model-Embedded Malware (MEM) — Hiding Payloads in LLM Weights — blackhat.com.
Elastic Security Labs, Detecting OLE Attacks — Equation Editor and DDE — elastic.co/security-labs.
Mandiant (Google Cloud), APT37 ScarCruft · North Korean Threat Actor Profile — mandiant.com.
KISA, 정보보호제품 성능평가 · 악성코드 대응 제품 인증 — kisa.or.kr.
TTA, 소프트웨어 시험인증 · 정보보안 제품 시험 — tta.or.kr.

기술 심화 실무 검토가 필요하신가요?

시큐레터 보안연구팀이 현재 환경을 함께 검토합니다. 기밀 유지 보장, 비용 없음.

PoC 신청