머신 러닝에 대해 알아야 할 10가지 사항

머신 러닝(ML) 도구는 역동적이고 강력한 보안 플랫폼의 필수 요소가 될 수 있습니다. ML은 멀웨어 탐지, 네트워크 이상 징후 탐지, 사용자 행동 분류, 취약점 우선순위 지정 등 사이버 보안 영역에서 수많은 작업에 사용할 수 있습니다. 궁극적으로 ML을 사용하는 목표는 모델 리스크를 개선하고 위협 분류를 간소화하며 즉각적인 공격과 미래의 공격을 정확하게 예측하는 것입니다. 다음은 사이버 공간에 ML 구현을 고려할 때 염두에 두어야 할 10가지 주요 사항입니다.  

  1. 사이버 범죄는 진화하고 있으며 우리는 한 발 앞서 나가야 합니다
    기술이 지속적으로 빠르게 발전함에 따라 공격자들은 피싱, 랜섬웨어 공격, 악성 캠페인 등을위한 기술을 발전시키고 있습니다. 사이버 보안은 ML을 사용하여 강화할 수 있는 최첨단 기술을 활용하는 것이 필수적입니다.

  2. 지도 학습과 비지도 학습은 머신러닝의 두 가지 주요 구성 요소입니다
    지도 학습은 과거 데이터를 사용하여 알고리즘이 불량 데이터에서 정상 데이터를 식별하는 데 도움을 줍니다. 과거에 학습된 행동을 사용하여 동일한 가이드라인을 따르는 결과를 예측합니다.

    비지도 학습은 데이터 간의 유사성을 식별하여 레이블이 지정되지 않은 예제를 그룹화하는 클러스터링을 사용합니다. 사이버 보안에서 비지도 학습은 사기 또는 비정상적인 데이터를 함께 결합할 수 있습니다. 

    지도 학습은 분류에 유용합니다. 잠재적 위협의 형태에 대한 정보가 주어지면 기계는 데이터에서 위협을 탐지하고 찾아낼 수 있습니다. 반면 비지도 학습은 특정 지침 없이 데이터를 입력받아 유사한 데이터를 조합하기 시작합니다. 즉, 위협과 같은 데이터를 유사한 특성으로 인해 그룹으로 클러스터링하고 조직화합니다. 

  3. 데이터가 핵심입니다
    ML 알고리즘이 제대로 실행되고 원하는 결과를 도출하려면 대량의 양질의 데이터가 전제되어야 합니다. 대규모 데이터 세트를 입력할 때는 ML 도구가 제대로 작동하려면 데이터가 공격이 예상되는 위협을 나타내야 한다는 점을 염두에 두어야 합니다. 또한 데이터가 최신 상태인지 확인해야 합니다.

  4. ML을 효과적으로 사용하려면 데이터가 동일한 언어를 사용해야 합니다
    데이터 유형이나 분류의 차이로 인해 서로 잘 상호 작용하지 않는 서로 다른 소스에서 데이터를 가져오는 경우, 기계가 관련성이 있는 것을 선별하고 판단하기 어려울 수 있습니다. 알고리즘이 최상의 성능으로 작동하려면 데이터가 하나의 일관된 소스에서 제공되어야 합니다. 

  5. ML은 결정론적이지 않고 예측적입니다 
    ML은 결과의 확률과 가능성을 다룹니다. 즉, 주어진 데이터를 가지고 이전 결과를 사용하여 미래의 잠재적 결과를 예측합니다. 결정론적인 것은 아니지만, 일반적으로 매우 정확하며 사람이 할 수 있는 것보다 훨씬 빠른 속도로 처리할 수 있습니다. 

  6. ML은 기존 방법으로는 해결할 수 없는 비효율적이거나 불가능한 문제를 극복하는 보안 전용 기술을 제공할 수 있습니다. 
    ML은 인간을 뛰어넘는 새로운 인사이트를 찾는 데 도움을 줄 수 있습니다. 또한 탐지 규칙을 쉽게 유지 관리하여 작업자의 부담을 줄일 수 있습니다. 데이터가 회사에서 정한 특정 지침을 따르도록 수동으로 보장하는 대신 ML을 사용하면 더 빠른 속도로 보안 규칙을 자동으로 유지할 수 있습니다. 대규모 확장이 가능하므로 실행할 수 있는 데이터를 늘릴 수 있어 효율성이 향상됩니다. 

  7. 회귀, 분류, 클러스터링 및 연관성을 위한 규칙 학습은 중요하고 일반적인 작업입니다
    회귀는 이전 결과를 기반으로 다음 결과를 예측한다는 점에서 지도 학습과 유사합니다. 사이버 보안에서는 사기 탐지에 사용할 수 있습니다.
    분류 및 클러스터링은 데이터를 그룹 또는 카테고리로 분리하고, 데이터에 나타난 유사성을 기반으로 특정 그룹을 클러스터링하는 작업입니다. 머신러닝을 통해 분류하면 스팸과 허용된 데이터 및 실제 데이터를 구분하는 카테고리를 만들 수 있습니다.
    연관 규칙 학습은 데이터에 대한 과거 경험을 사용하여 사람이 할 수 있는 것보다 훨씬 빠른 속도로 특정 결과를 추천합니다. 사이트에서 인시던트가 발생하면 연관 규칙 학습을 구현하여 사용자에게 자동으로 솔루션을 추천할 수 있습니다. 

  8. ML은 사이버 보안의 거의 모든 측면에 통합되었지만, 그 한계를 인식하는 것이 중요합니다.
    ML 알고리즘은 패턴을 인식하고 예측하는 데 매우 효율적입니다. 그러나 ML에는 많은 리소스가 필요하고 모든 데이터 세트의 범위가 제한되어 있기 때문에 상대적으로 오류에 대한 민감도가 높습니다. ML은 또한 미디어에서 실제보다 더 강력하다고 주장하며 과장할 수 있습니다.

  9. 사이버 보안을 구현하는 사람은 알고리즘만큼이나 중요합니다
    ML 기반 사이버 보안 알고리즘의 성능을 극대화하려면 사람과 기계가 함께 노력해야 합니다. ML 알고리즘이 무차별적인 데이터 분석을 수행할 수 있지만, 팀에서는 최신 기술 혁신과 가능한 위협에 대한 최신 정보를 파악하는 것이 중요합니다.

  10. 사이버 보안을 위한 ML은 기존 소프트웨어 및 아키텍처와 쉽게 통합되어야 합니다
    비즈니스에서 새로운 ML 기술을 구현할 때는 경험을 단순화하고 긴장을 유발하지 않아야 한다는 점을 기억하세요. 구현을 최대한 활용하려면 현재 사용 중인 소프트웨어 및 프로그래밍과 잘 통합되는 ML 솔루션을 선택하는 것이 좋습니다. 
    요약하자면, 사이버 보안을 위한 ML은 다음과 같아야 합니다:
    • 구체적인 목표와 목적에 맞게 타겟팅
    • 잘못된 예측 최소화
    • 효과를 평가할 수 있는 방법을 마련하세요.
    • 강력한 팀과 함께 일하기

팔로알토 네트웍스는 미래의 위협으로부터 기업을 보호하기 위해 ML을 어떻게 활용하고 있을까요? 머신 러닝 기반 NGFW는 머신 러닝을 사용하여 일반적인 파일 및 웹 위협을 95%의 성공률로 방지합니다. 저희 방화벽은 3배 더 많은 IoT 디바이스를 탐지하고 ML을 활용하여 10초 미만의 서명 전달을 생성하여 감염된 시스템을 99.5% 감소시킵니다. ML은 파트너와 고객을 위해 더 안전하고 보안이 강화된 환경을 만드는 데 도움이 됩니다. 

이 사이버피디아 문서에서 팔로알토 네트웍스의 ML에 대해 자세히 알아보세요: 머신러닝이란 무엇인가요?

글로벌 사이버 보안 리더인 Palo Alto Networks는 사람과 조직의 운영 방식을 혁신하는 기술을 통해 클라우드 중심의 미래를 만들어가고 있습니다. 저희의 사명은 디지털 생활 방식을 보호하는 사이버 보안 파트너가 되는 것입니다. 자세한 내용은 www.paloaltonetworks.co.kr