이 책은 구축/운영 매뉴얼이 아니며, 스플렁크를 데이터 분석툴로 활용한다. 특히 통계 분석이 가능한 데이터 구조를 만드는 데 필수인 데이터 전처리 및 분석 과정을 예제와 함께 따라해볼 수 있도록 하여 독자의 쉬운 이해를 돕는다.
[ 이 책의 구성 ]
1장에서는 웹 로그를 대상으로 엑셀(2013 이상)을 이용한 ‘탐색적 데이터 분석(Exploratory Data Analysis)’을 통해 통계 분석의 개념을 이해하고, 분석 대상 데이터에 대한 이해도를 높이며, 목적에 맞는 데이터 가공 및 분석 절차를 학습한다.
2장에서는 스플렁크 개념 및 구축 방안을 살펴보고, 스플렁크의 세 가지 데이터 연동 및 전처리 과정을 진행한다.
3장에서는 스플렁크의 검색 언어인 SPL(Search Processing Language)을 이용한 데이터 검색 및 전처리 보강, 그리고 대시보드 구축을 통해 이상징후 분석을 진행한다.
4장에서는 리눅스 및 스플렁크 앱을 이용한 데이터 분석 환경 구축을 다룬다.
★ 리뷰 이벤트 중 ★
[ 목차 ]
1장. 데이터 분석
1.1 통계 분석
1.2 데이터 전처리
1.3 탐색적 데이터 분석
1.3.1 전체 그림 그리기
1.3.2 상태 세분화
1.3.3 상태별 관계 그리기
1.3.4 URL 변화 추이 그리기
1.3.5 변수 변화 추이 그리기
1.3.6 사용자 및 접속 도구 변화 추이 그리기
1.3.7 이상징후 확인
1.3.8 응답 변화 추이 그리기
1.4 데이터 해상도
1.4.1 시간 해상도
1.4.2 URL 해상도
1.4.3 변수 해상도
1.4.4 시행착오
1.5 정리
2장. 스플렁크
2.1 스플렁크란?
2.1.1 데이터 관리 구조
2.2 스플렁크 설치
2.3 데이터 연동
2.3.1 로컬 데이터 업로드
2.3.2 데이터 삭제
2.3.3 실시간 모니터
2.3.4 포워더
2.4 정리
3장. 이상징후 분석
3.1 SPL
3.1.1 검색 명령어
3.1.2 통계 명령어
3.1.3 시계열 차트
3.2 데이터 전처리 편집
3.2.1 필드 별칭
3.2.2 필드 계산
3.3 대시보드
3.4 정리
4장. 분석 환경 구축
4.1 스플렁크 ON 리눅스
4.1.1 데이터 연동
4.1.2 포워더
4.2 스플렁크 앱
4.3 정규표현식 메타 문자
4.3 정리
[ 강명훈 ]
다년 간 국가정보자원관리원, 국가정보원 등의 네트워크 보안 업무를 지원했으며, 사고 분석이 아닌 데이터 분석 관점의 보안 제품 활용 방안에 관심이 많다. 데이터 분석 기반 네트워크 보안 방법론을 강의하고 있다.
[ 저서 ]
IDS와 보안관제의 완성(2013)
데이터 분석이 쉬워지는 정규표현식(2017)
엘라스틱서치로 알아보는 이상징후 분석(2020)
블로그: kangmyounghun.blogspot.com
이메일: mhkang589@gmail.com