최근 국가정보국(ODNI)은 오픈소스 정보(OSINT)에 대한 새로운 전략을 공개하고 OSINT를 “첫 번째 수단의 INT”라고 불렀습니다. 공공 및 민간 부문 조직은 이 분야가 제공할 수 있는 가치를 깨닫고 있지만 최근 몇 년 동안 디지털 데이터의 기하급수적 증가가 많은 기존 OSINT 방법을 압도하고 있다는 사실도 알게 되었습니다. 다행히도 인공 지능(AI)과 머신 러닝(ML)이 정보 수집 및 분석의 미래에 혁신적인 영향을 미치기 시작했습니다.
오픈소스 인텔리전스(OSINT)란 무엇인가?
오픈소스 인텔리전스는 공개적으로 이용 가능한 소스에서 정보를 수집하고 분석하는 것을 말합니다. 이러한 소스에는 기존 미디어, 소셜 미디어 플랫폼, 학술 출판물, 정부 보고서 및 공개적으로 액세스할 수 있는 기타 모든 데이터가 포함될 수 있습니다. OSINT의 주요 특징은 인간 정보 또는 사회 공학과 같은 은밀하거나 비밀스러운 정보 수집 방법을 포함하지 않는다는 것입니다. 미국 정부에서 근무하는 동안 데이터를 얻을 수 있었지만 더 이상 민간인으로서 얻을 수 없다면 그것은 OSINT가 아닙니다.
역사적으로 OSINT는 여러 가지 핵심 단계를 포함하는 노동 집약적 프로세스였습니다.
- 출처 식별: 분석가는 어떤 공개 소스에 관련 정보가 담겨있을 가능성이 높은지 판단합니다.
- 데이터 수집: 정보는 종종 수동 검색이나 웹 스크래핑 도구를 통해 이러한 출처에서 수집됩니다.
- 데이터 처리: 수집된 정보는 분석을 위해 정리되고 구조화됩니다.
- 분석: 숙련된 분석가는 데이터를 조사하여 패턴, 추세, 통찰력을 파악합니다.
- 보고: 연구 결과는 의사 결정권자가 더욱 정보에 입각한 의사 결정을 내릴 수 있도록 보고서로 정리됩니다.
효과적이기는 하지만, 이 접근 방식은 사용 가능한 정보의 엄청난 양으로 인해 한계에 부딪힙니다. 인간 분석가는 모든 것을 수동으로 처리하는 데 어려움을 겪고, 가치 있는 통찰력은 인간이 감지하기 어려운 복잡한 패턴에 숨겨져 있을 수 있습니다. 바로 여기서 AI/ML이 정보를 수집, 처리 및 분석하는 방법에 엄청난 이점을 제공할 수 있으며, 따라서 인간 분석가는 맥락 제공과 같이 고유하게 자격을 갖춘 것에 집중할 수 있습니다. 부수적인 이점으로, 이러한 변화는 인간이 일상적인 처리 작업에 덜 시간을 할애하고 정보를 분석하고 검토하는 데 더 많은 시간을 할애하기 때문에 사기를 향상시킵니다.
AI/ML이 즉각적인 이점을 제공할 수 있는 작업은 다음과 같습니다.
- 대량의 데이터 볼륨 처리: AI 시스템은 인간의 능력을 훨씬 뛰어넘는 속도로 엄청난 양의 데이터를 처리하고 분석할 수 있습니다. 이를 통해 OSINT 실무자는 이전에 가능했던 것보다 훨씬 더 넓은 그물을 던지고 여전히 결과를 처리할 수 있습니다.
- 실시간 분석: 오늘날 디지털 세계에서 정보 흐름의 양은 엄청납니다. AI 기반 OSINT 도구는 실시간으로 데이터 스트림을 모니터링하고 분석하여 최신 정보를 제공하고 새로운 상황에 신속하게 대응할 수 있습니다.
- 다국어 및 다중 모드 분석: AI는 여러 언어로 된 콘텐츠를 동시에 번역하고 분석하여 언어 장벽을 허물 수 있습니다. 게다가 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 유형을 통합적으로 처리하여 보다 포괄적인 인텔리전스 그림을 제공할 수 있습니다. OpenAI의 Whisper와 같은 이러한 기능 중 다수는 오프라인에서 사용할 수 있으므로 운영 보안(OPSEC)에 대한 우려를 없앨 수 있습니다.
- 예측 분석: AI는 과거 데이터와 현재 추세를 분석함으로써 미래의 사건이나 행동을 예측하는 데 도움을 줄 수 있으며, OSINT에 선제적 차원을 더할 수 있습니다.
- 일상적인 작업의 자동화: AI는 데이터 수집 및 초기 필터링과 같은 OSINT의 많은 시간 소모적인 측면을 자동화하는 데 도움이 되어 인간 분석가가 더 높은 수준의 분석과 의사 결정에 집중할 수 있도록 해줍니다. 정확한 감정 분석과 같이 이전에는 구현하기 매우 어렵거나 불가능했던 것들이 이제는 사소한 일이 되었습니다.
SANS 네트워크 보안에서 SEC497 실무 OSINT 과정과 SEC587 고급 OSINT 과정은 학생들에게 이러한 AI 기능을 활용하는 실무 경험을 제공하여 생산성을 높일 뿐만 아니라 새로운 가능성을 발견할 수 있도록 해줍니다.
어떤 기술도 완벽하지 않으며 AI를 구현하기 전에 환각이 일으킬 수 있는 잠재적 영향을 고려해야 하지만 현재 OSINT에 활용되고 있는 주요 기술은 다음과 같습니다.
- 자연어 처리(NLP): NLP는 기계가 인간 언어를 이해하고, 해석하고, 생성할 수 있도록 합니다. OSINT에서 NLP는 다음에 필수적입니다.
- 소셜 미디어 게시물의 감정 분석
- 텍스트에서 사람, 조직 및 위치를 식별하기 위한 엔터티 인식
- 대량의 텍스트 데이터를 분류하기 위한 주제 모델링
- 다국어 정보 수집을 위한 기계 번역
- 컴퓨터 시각 인식: 이 기술은 기계가 시각 정보를 해석하고 분석할 수 있게 해줍니다. OSINT에서 컴퓨터 비전은 다음과 같은 용도로 사용됩니다.
- 이미지 및 비디오에서의 얼굴 인식
- 여러 이미지에 같은 사람이 등장하는지 확인하기 위한 얼굴 비교
- 이미지에서의 객체 감지
- 이미지에서 텍스트를 추출하기 위한 광학 문자 인식(OCR)
- 영상 속 장면 이해
- 머신 러닝 및 데이터 마이닝: “역사를 모르는 자는 그것을 반복할 운명이다”라는 말을 몇 번이나 들었나요? 머신 러닝은 시스템이 데이터로부터 학습하고 시간이 지남에 따라 성능을 개선할 수 있도록 하는 개념의 의인화입니다. OSINT에서 머신 러닝은 다음과 같은 용도로 사용됩니다.
- 추세나 이벤트를 예측하기 위한 예측 분석
- 비정상적인 패턴이나 동작을 식별하기 위한 이상 감지
- 더 쉬운 분석을 위한 데이터 클러스터링 및 분류
- 엔티티 간의 관계를 이해하기 위한 네트워크 분석
저는 거의 20년 동안 OSINT를 해왔고, 지금이 제가 본 것 중 가장 역동적이고 신나는 시기입니다. 이 분야에서 문자 그대로 매일 새로운 발전이 일어나고 있습니다. 올 9월 라스베이거스에서 열리는 Network Security에 참석하신다면, 이 역량이 오늘날 우리의 효과성과 효율성을 어떻게 개선할 수 있는지, 그리고 미래에 무엇을 기대할 수 있는지에 대해 논의하기를 기대합니다.
아직 SANS Network Security에 등록하지 않으셨나요? 이 페이지를 확인하여 모든 것을 확인하세요!
메모: 본 기사는 SANS 수석 강사이자 Argelius Labs의 책임자이며 10년의 OSINT 전문 경험을 보유한 Matt Edmondson이 전문적으로 집필했습니다.