본문 바로가기
자격증/빅데이터분석기사

[P01CH02S01] 분석 방안 수립

by rnasterofmysea 2025. 3. 11.
728x90
반응형

PART 1: 빅데이터 분석 기획

Chapter 01: 데이터 분석 계획

 

 

[P01CH01S02] 분석 방안 수립

 


✅ 01 데이터 분석

  • 데이터 분석은 데이터에서 의미 있는 정보와 패턴을 찾아내어 의사결정 및 전략 수립을 지원하는 과정
  • 데이터 분석은 규모가 아니라 어떤 시각과 통찰을 얻을 수 있는가의 문제이다.
  • 전략 도출을 위한 가치 기반 데이터 분석 지향

✅ 02 분석 기획

분석 기획은 분석을 수행할 목적과 방향성을 명확히 설정하고, 전체 분석 과정의 전략적 로드맵을 설계하는 단계입니다.

 

2.1. 분석 대상과 방법에 따른 분류

 

분석의 대상(무엇을 분석할 것인가)과 방법(어떻게 분석할 것인가)에 따라 다음과 같이 네 가지 유형으로 나눌 수 있습니다:

 

이기적 빅데이터 분석기사 P.86 발췌

  • 최적화(Optimization): 분석할 대상과 방법이 모두 알려진 경우로, 기존 프로세스나 시스템을 개선하여 최적의 상태로 만드는 것을 목표로 합니다. 예를 들어, 생산 공정의 효율성을 높이기 위한 분석이 이에 해당합니다.
  • 솔루션(Solution): 분석할 대상은 명확하지만, 이를 해결하기 위한 방법이 알려지지 않은 경우입니다. 새로운 분석 기법이나 접근 방식을 찾아 문제를 해결해야 합니다. 예를 들어, 고객 이탈률은 알고 있지만, 이를 줄이기 위한 방법이 명확하지 않을 때 해당합니다.
  • 통찰(Insight): 분석 방법은 알고 있지만, 분석할 대상이 명확하지 않은 경우입니다. 기존의 분석 기법을 활용하여 새로운 인사이트나 지식을 발견하는 것을 목표로 합니다. 예를 들어, 판매 데이터에서 새로운 마케팅 기회를 찾는 것이 이에 해당합니다.
  • 발견(Discovery): 분석할 대상과 방법이 모두 불명확한 경우로, 데이터 탐색을 통해 새로운 문제나 기회를 발견하는 것을 목표로 합니다. 예를 들어, 대량의 로그 데이터를 분석하여 새로운 사용자 행동 패턴을 찾는 것이 이에 해당합니다.

 

2.2 목표 시점에 따른 분류

 

과제 중심적 접근(단기적): 당면한 과제를 빠르게 해결하는 것을 목표로 합니다. 신속한 실행과 문제 해결(Speed & Test)을 중시하며, 'Quick-Win' 전략을 활용합니다. 이러한 접근 방식은 문제 해결 중심의 Problem Solving에 초점을 맞춥니다.

 

마스터 플랜 접근(중장기적): 지속적인 분석 문화의 내재화를 목표로 하며, 정확성과 문제 정의(Accuracy & Deploy)를 중시합니다. 장기적인 관점에서 과제를 도출하고 수행하며, 문제 정의 중심의 Problem Definition에 초점을 맞춥니다


✅ 03 분석 마스터 플랜 수립 (Master Plan) 

 

3.1. 빅데이터 ROI 4V

 

https://velog.velcdn.com/images/be2be2/post/b0f2e4fa-cbfd-40db-a9bb-b01487788cda/image.png

 

 

ROI 4V의 구성
  • Volume: 빅데이터의 양, 즉 처리해야 하는 데이터의 양을 의미합니다 
     
  • Variety: 빅데이터의 다양성, 즉 정형 및 비정형 데이터를 모두 포함하는 다양한 종류의 데이터를 의미합니다 
     
  • Velocity: 빅데이터의 속도, 즉 데이터가 얼마나 빨리 수신 및 처리되는가를 나타내는 척도를 의미합니다 
     
  • Value: 빅데이터의 가치, 즉 비즈니스의 효과를 의미합니다 

 

3.2. 포트폴리오 사분면 분석 기법‼️

 

https://starrykss.tistory.com/1946

 


✅ 04 분석 로드맵 설정 (Roadmap)

분석 로드맵은 구체적인 단계별 일정과 작업을 명시하여 분석 진행을 체계적으로 관리합니다.

📌 로드맵 작성 시 고려 사항

  • 현실 가능한 일정과 목표 설정
  • 단계별 수행 과제의 명확화 및 역할 분담
  • 위험 요소 파악과 대응 방안 마련

✅ 04 분석 문제 정의

분석 문제 정의는 데이터 분석 프로젝트의 방향성과 성공 여부를 결정짓는 중요한 단계입니다. 분석 문제 정의 단계에서 자주 등장하는 출제 유형으로는 『하향식 접근(Top-down)』과 『상향식 접근』 방식이 있습니다.

 

문제가 먼저 주어지고 이에 대한 해법을 찾아가는 방식  ➡️ 하향식 접근
데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하는 방식  ➡️ 상향식 접근 (프로토타이핑)

 

https://hyunsitstory.tistory.com/32

 


✅ 05 데이터 분석 방안 수립 - 데이터 분석 방법론의 종류 및 특징

 

📌 계층적 프로세스 모델 

📌 소프트웨어 개발 생명주기 활용(폭포수, 프로토타입, 나선형, 반복적 모형, 진화형 모형) -- 지겨워서 생략함...

 

① KDD 방법론 (Knowledge Discovery in Database)

  • 데이터베이스 내 유용한 지식을 추출하기 위한 표준적 방법론
  • 단계
    1. 데이터 선택(Selection)
    2. 전처리(Preprocessing)
    3. 변환(Transformation)
    4. 데이터 마이닝(Data Mining)
    5. 결과 평가(Evaluation & Interpretation)

② CRISP-DM (Cross Industry Standard Process for Data Mining)

  • 산업 분야를 초월하여 범용적으로 활용할 수 있는 데이터 마이닝 프로세스 방법론
  • 단계
    1. 비즈니스 이해(Business Understanding)
    2. 데이터 이해(Data Understanding)
    3. 데이터 준비(Data Preparation)
    4. 모델링(Modeling)
    5. 평가(Evaluation)

② SEMMA(Sample, Explore, Modify, Model and Assess)

  • SAS의 주도로 만들어진 기술과 통계 중심의 데이터 마이닝 프로세스
  • 단계
    1. 샘플링(Sample)
    2. 탐색(Explore)
    3. 수정(Modify)
    4. 모델링(Model)
    5. 평가(Assess)

 

시험 팁 ✅

CRISP-DM (Cross-Industry Standard Process for Data Mining)

비즈니스 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 배포

SEMMA (Sample, Explore, Modify, Model, Assess)
데이터 샘플링 → 탐색 → 수정 → 모델링 → 평가

KDD (Knowledge Discovery in Database)
데이터 선택 → 데이터 전처리 → 변환 → 데이터 마이닝 → 결과 평가 및 활용

 


✅ 06 빅데이터 분석 방법론

 

<빅데이터 분석 방법론의 개발절차, 출처 이기적 스터디 카페>


✅ 07 데이터 거버넌스

 

데이터 거버넌스(Data Governance)는 데이터의 품질, 일관성, 신뢰성 및 보안을 보장하기 위한 전사적 관리 체계를 의미합니다. 즉, 기업이나 조직에서 데이터 활용의 가치를 극대화하고 데이터와 관련된 리스크를 최소화하기 위해 데이터에 대한 정책, 표준, 역할 및 책임을 명확하게 정의하고 관리하는 것입니다.

 

https://lh5.googleusercontent.com/proxy/_E8Vj_1YWmdBEexV5lrLRxxXI-scOSSZfCwUiJnpmLIgliz06W1ffF-Mnq0J11GYqtE4E8G6f4lZ5XqdZsigy_W5rqSYyX9ZNwc

데이터 거버넌스의 주요 목적

  1. 데이터 품질 향상
    • 데이터의 정확성, 완전성, 일관성을 유지하여 데이터 분석과 활용이 신뢰성을 갖도록 합니다.
  2. 데이터 보안 강화
    • 데이터의 접근 권한, 보호 정책을 명확하게 규정해 개인정보 유출이나 데이터의 오용, 남용을 방지합니다.
  3. 규제 준수 및 리스크 관리
    • 데이터 관련 법규(개인정보보호법, GDPR 등) 준수를 통해 법적 리스크를 관리하고, 내부 통제를 강화합니다.
  4. 데이터 자산의 가치 극대화
    • 데이터를 자산으로 인식하고, 전사적으로 데이터를 효율적으로 활용할 수 있도록 체계를 구축합니다.

 


 

💡 도움이 되셨다면 댓글과 공감 부탁드립니다! 😊
📌 더 많은 빅데이터 분석기사 자료와 프로그래밍 자료는 블로그에서 확인하세요!
✉️ 문의나 피드백은 댓글이나 이메일로 남겨주세요!

728x90
반응형