인라인 딥 러닝이란 무엇인가요?

인라인 딥 러닝은 딥 러닝의 분석 기능을 인라인에 배치하는 프로세스입니다.

여기에는 최신 사이버 위협에 대응할 수 있는 세 가지 주요 구성 요소가 포함되어 있습니다:

  1. 대량의 실제 위협 데이터로 학습된 위협 탐지 기능
  2. 네트워크에 유입되는 실제 트래픽을 검사하기 위해 인라인 분석 수행
  3. 딥 러닝 분석과 실시간 판결 및 집행을 위한 대규모 처리 능력

 

인라인 딥 러닝이 중요한 이유는 무엇인가요?

매년 수백만 개의 새로운 사이버 위협이 등장하고, 이를 방지하기 위한 조직들의 경쟁이 치열합니다. 오늘날의 공격자들은 클라우드 대규모 리소스 및 자동화와 같은 첨단 기술의 도움으로 공격에 성공하고 회피 능력이 매우 향상되고 있습니다. 보다 구체적으로, 최신 위협 행위자는 두 가지 중요한 이점을 가지고 있습니다(그림 1):

  1. 확산 속도: 공격자는 그 어느 때보다 빠르게 공격을 확산시킬 수 있습니다.
  2. 다형성: 위협 행위자는 식별 가능한 기능을 지속적으로 변경하여 탐지를 회피하는 멀웨어와 악성 콘텐츠를 구축할 수 있습니다.
멀웨어 확산/확산 속도 및 다형성에 대한 Palo Alto Networks Unit 42 데이터를 보여주는 그래픽

그림 1: 멀웨어 확산/확산 속도 및 다형성에 대한 ® 데이터

새로운 공격은 기존의 샌드박싱, 프록시 및 독립적인 시그니처 기술로 보호 기능을 구축하는 것보다 훨씬 더 빠르게 시작되고 있습니다. 최신 멀웨어는 최초 감염 후 보호 조치가 개발되어 조직 전체로 확장되기 훨씬 전에 수초 내에 수천 개의 시스템을 더 감염시킬 수 있습니다. 지능형 위협을 방지하기 위해 조직은 전에 없던 위협으로부터 가능한 한 빨리 초기 감염을 방지해야 합니다. 목표는 가시성과 예방 사이의 시간을 0으로 줄이는 것입니다. 인라인 딥 러닝 덕분에 이제 이것이 가능해졌습니다.

 

딥 러닝이란 무엇인가요?

인라인 딥 러닝의 개념을 더 잘 이해하려면 먼저 딥 러닝과 머신 러닝을 정의한 다음 둘을 구분하는 것이 도움이 됩니다. 딥 러닝은 인공 신경망을 사용하여 뇌의 기능을 모방하고 대량의 비정형 데이터로부터 학습하는 머신 러닝(ML)의 하위 집합입니다. 신경망은 대량의 비정형 데이터를 사용하여 학습됩니다. 사람의 개입 없이도 여러 데이터 소스에서 실시간으로 정보를 수집, 분석, 해석할 수 있습니다. 딥 러닝은 대량의 사이버 위협 데이터를 검사하여 사이버 공격을 탐지하고 방지할 때 특히 유용할 수 있습니다. 딥 러닝은 특징 추출을 자동화하여 사람에 대한 의존성을 제거합니다: 예를 들어 개, 고양이, 새와 같은 동물을 분류할 때 딥 러닝은 각 동물을 다른 동물과 구별하는 데 중요한 특징(예: 귀, 코, 눈 등)을 결정합니다. 이러한 고급 기능 덕분에 딥 러닝은 분석 및 자동화 관련 작업을 개선하는 데 매우 유용합니다.

 

머신러닝이란 무엇인가요?

머신 러닝은 데이터를 구문 분석하고, 데이터 세트에서 학습하고, 학습한 내용을 적용하여 정보에 기반한 의사 결정을 내리는 알고리즘을 포함하는 AI의 응용 프로그램입니다. 일반적으로 컴퓨터는 구조화된 데이터를 제공받고 이를 학습 데이터로 사용하여 더 나은 평가와 행동을 취합니다. 기본적인 머신 러닝 기반 모델은 시간이 지남에 따라 정확도가 향상되도록 설계되었지만 여전히 사람의 개입이 필요합니다.

 

머신 러닝 대 딥 러닝

인공지능(AI)은 여러 산업 분야에서 자동화된 작업을 촉진하기 위해 점점 더 많이 사용되고 있습니다. AI의 두 가지 큰 구성 요소는 머신 러닝과 딥 러닝입니다. 이 용어는 종종 같은 의미로 사용되지만 뚜렷한 차이점이 있습니다:

  • 머신 러닝을 사용하려면 데이터 과학자나 엔지니어가 직접 기능이나 분류자를 선택하고, 요구 사항에 맞는 결과물이 나오는지 확인하고, 생성된 예측이 정확하지 않다고 판단되면 알고리즘을 조정해야 합니다.

    딥 러닝은 사람의 개입이 필요 없습니다. 딥 러닝은 신경망을 통해 알고리즘을 계층으로 구조화하여 예측이 정확한지 여부를 스스로 판단할 수 있습니다.
  • 머신 러닝 알고리즘은 선형 회귀 또는 의사 결정 트리와 같은 단순한 아키텍처를 사용하는 경향이 있습니다. 또한 머신 러닝 기능은 처리 능력이 떨어지는 경향이 있습니다. 설정 및 운영은 다소 빠르게 이루어질 수 있지만 제한적인 결과를 얻을 수 있습니다.

    딥 러닝은 훨씬 더 복잡합니다. 일반적으로 더 강력한 하드웨어, 리소스 및 설정 시간이 필요하지만, 결과를 즉시 생성하고 유지 관리가 거의 필요하지 않은 경우가 많습니다.
  • 기존의 머신 러닝 알고리즘은 딥 러닝 모델보다 훨씬 적은 데이터를 필요로 합니다. ML 기반 기술은 수천 개의 데이터 포인트를 사용하여 작동할 수 있지만 딥 러닝에는 일반적으로 수백만 개의 데이터 포인트가 필요합니다. 또한 사용되는 데이터는 대부분 비정형 데이터이며 이미지와 동영상을 포함할 수 있으므로 변동을 제거하고 고품질의 해석을 할 수 있습니다.

 

인라인 딥 러닝은 어떻게 작동하나요?

딥 러닝 자체는 네트워크 보안을 비롯한 다양한 산업 분야에서 활용되고 있습니다. 수집하는 방대한 양의 위협 데이터를 통해 지속적으로 진화하고 학습할 수 있기 때문에 사이버 공격을 예측하는 핵심 기술로 자리 잡았습니다. 새로운 사이버 위협을 탐지하고 예방하는 효과를 높이기 위해 업계를 선도하는 새로운 전략, 즉 인라인 딥 러닝이 등장했습니다. 보안 침해가 발생하면 인라인 딥 러닝을 사용하여 네트워크에 유입되는 악성 트래픽을 분석 및 탐지하고 실시간으로 위협을 차단합니다. 이는 최신 위협 행위자들이 기존의 보안 방어 체계로는 알 수 없는 정교한 기술을 사용하여 공격하기 때문에 매우 중요합니다. 인라인 딥 러닝은 이러한 놀라운 기능을 갖추고 있지만, 개인의 디바이스 사용 능력을 방해하지 않고 작동합니다. 눈에 띄지 않게 백그라운드에서 실행되므로 디바이스의 워크플로나 생산성을 방해하지 않습니다.

 

인라인 머신 러닝을 통한 알려지지 않은 위협 방지

팔로알토 네트웍스는 세계 최초로 머신 러닝 기반 차세대 방화벽(NGFW)을 출시하여 알려지지 않은 파일 및 웹 기반 위협을 차단하는 인라인 머신 러닝을 제공합니다. 특허받은 시그니처리스 접근 방식을 사용하는 WildFire와 고급 URL 필터링은 비즈니스 생산성을 저하시키지 않으면서 무기화된 파일, 인증정보 피싱, 악성 스크립트를 선제적으로 방지합니다. 팔로알토 네트웍스 하드웨어 및 가상 NGFW는 새로운 ML 기반 예방 기능을 적용할 수 있습니다:

  • WildFire 인라인 ML은 파일을 회선 속도로 검사하고 악성 콘텐츠의 상당 부분을 차지하는 PowerShell 파일뿐만 아니라 휴대용 실행 파일의 멀웨어 변종을 차단합니다.
  • URL Filtering 인라인 ML은 알 수 없는 URL을 회선 속도로 검사합니다. 이 기능은 피싱 페이지와 악성 JavaScript를 몇 밀리초 만에 식별하여 네트워크에서 아무도 볼 수 없도록 인라인으로 차단할 수 있습니다.
  • 인라인 딥 러닝에 대해 자세히 알아보려면 Palo Alto Networks 백서(회피 위협 방지를 위한 요구 사항)를 읽어보세요.

 

인라인 딥 러닝 FAQ

인라인 딥 러닝은 딥 러닝의 분석 기능을 인라인으로 배치하는 프로세스입니다. 예를 들어, 보안 침해가 발생하면 인라인 딥 러닝을 사용하여 네트워크에 유입되는 악성 트래픽을 분석 및 탐지하고 실시간으로 위협을 차단합니다.
딥 러닝은 인간의 뇌처럼 작동하도록 모델링된 알고리즘인 인공 신경망을 사용하여 뇌의 기능을 모방하고 대량의 비정형 데이터로부터 학습하는 머신 러닝(ML)의 하위 집합입니다.
  1. 사람의 개입
    머신 러닝을 사용하려면 데이터 과학자나 엔지니어가 직접 기능이나 분류자를 선택하고, 요구 사항에 맞는 결과물이 나오는지 확인하고, 생성된 예측이 정확하지 않다고 판단되면 알고리즘을 조정해야 합니다.

    딥 러닝은 사람의 개입이 필요 없습니다. 딥 러닝은 신경망을 통해 알고리즘을 계층으로 구조화하여 예측이 정확한지 여부를 스스로 판단할 수 있습니다.

  2. 아키텍처 및 성능
    머신러닝 알고리즘은 선형 회귀 또는 의사 결정 트리와 같은 단순한 아키텍처를 사용하는 경향이 있습니다. 또한 머신 러닝 기능은 처리 능력이 떨어지는 경향이 있습니다. 설정 및 운영은 다소 빠르게 이루어질 수 있지만 제한적인 결과를 얻을 수 있습니다.

    딥 러닝은 훨씬 더 복잡합니다. 일반적으로 더 강력한 하드웨어, 리소스 및 설정 시간이 필요하지만, 결과를 즉시 생성하고 유지 관리가 거의 필요하지 않은 경우가 많습니다.

  3. 데이터 요구 사항
    기존의 머신 러닝 알고리즘은 딥 러닝 모델보다 훨씬 적은 데이터를 필요로 합니다. ML 기반 기술은 수천 개의 데이터 포인트를 사용하여 작동할 수 있지만 딥 러닝에는 일반적으로 수백만 개의 데이터 포인트가 필요합니다. 또한 사용되는 데이터는 대부분 비정형 데이터이며 이미지와 동영상을 포함할 수 있으므로 변동을 제거하고 고품질의 해석을 할 수 있습니다.
이전 인공 지능(AI)이란 무엇인가요?
다음 위협 탐지에서 AI의 역할은 무엇인가요?