본문 바로가기
자격증/빅데이터분석기사

Part 4: 빅데이터 결과 해석

by rnasterofmysea 2025. 3. 18.
728x90
반응형

 

 

 

Chapter 1: 분석모형 평가 및 개선

  1. 분석모형 평가
    • 회귀모형 평가 지표: 평균절대오차(MAE), 평균제곱오차(MSE), 평균제곱근오차(RMSE), 평균절대백분율오차(MAPE), 결정계수(R²) 등이 사용됩니다. 결정계수 R² 값이 1에 가까울수록 모형의 설명력이 높음을 의미합니다.
    • 분류모형 평가 지표: 혼동행렬을 기반으로 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity), 정밀도(Precision), F1 스코어, ROC 곡선 및 AUC 값 등이 활용됩니다.
  2. 분석모형 진단
    • 회귀모형 가정 진단: 선형성, 독립성, 등분산성, 정규성 등의 가정을 확인하며, 잔차 산점도, 더빈-왓슨 검정, Q-Q plot 등을 통해 진단합니다.
    • 오류 유형: 과대적합(Overfitting)과 과소적합(Underfitting)을 구분하며, 일반화 오류와 학습 오류를 분석합니다.
  3. 교차 검증
    • 데이터를 여러 부분으로 나누어 모형의 일반화 능력을 평가하는 방법으로, K-폴드 교차 검증, LOOCV, 부트스트랩 등이 있습니다.

Chapter 2: 분석결과 해석 및 활용

  1. 분석결과 해석
    • 분석모형 해석: 모형의 해석 가능성, 변수 중요도, 부분 의존도 등을 평가합니다.
    • 비즈니스 기여도 평가: 투자대비 효과(ROI), 순현재가치(NPV), 내부수익률(IRR), 총 소유비용(TCO), 투자회수 기간(PP) 등을 통해 분석결과의 비즈니스적 가치를 평가합니다.
  2. 분석결과 시각화
    • 시각화 분류: 데이터 시각화, 정보 시각화, 정보 디자인으로 구분합니다.
    • 시각화 프로세스: 정보 구조화, 정보 시각화, 정보 시각표현의 단계를 거칩니다.
    • 시각화 종류: 시간 시각화(막대 그래프, 선 그래프 등), 공간 시각화(지도 기반 시각화), 관계 시각화(산점도, 버블 차트 등), 비교 시각화(히트맵, 스타차트 등), 인포그래픽 등이 있습니다.
  3. 분석결과 활용
    • 분석모형 전개: 분석결과를 실제 업무에 적용하는 단계입니다.
    • 분석결과 활용 시나리오 개발: 분석결과를 기반으로 비즈니스 시나리오를 개발합니다.
    • 분석결과 보고서 작성: 분석과정을 문서화하여 공유합니다.
    • 분석모형 모니터링 및 리모델링: 모형의 성능을 지속적으로 모니터링하고 필요 시 개선합니
728x90
반응형