빅데이터분석기사

[빅분기] CH2. 데이터 분석 계획_분석 작업 계획_240313

리니끄적 2024. 3. 13. 22:58

24.03.13

 

01. 분석 작업 개요

1) 데이터 처리 영역

- 데이터 분석을 위한 기초 데이터를 정의, 수집 및 저장, 분석하기 수월하도록 물리적인 환경을 제공하는 영역

- 데이터 소스 / 데이터 수집 / 데이터 저장 / 데이터 처리

2) 데이터 분석 영역

① 데이터 분석: 저장된 데이터를 추출 및 가공해 목적에 맞는 분석 방법 통해 분석

<데이터 분석 단계 - NCS>

도메인 이슈 도출 / 분석목표 수립 / 프로젝트 계획 수립 / 보유 데이터 자산 확

② 데이터 표현: 분석된 겨로가를 누구나 쉽게 이해할 수 있도록 적합한 시각화 방법 이용해 표현

 

 

02. 데이터 확보 계획

1) 데이터 확보를 위한 사전 검토사항

필요 데이터의 정의

② 보유 데이터의 현황파악

③ 분석 데이터의 유형

편향되지 않고 충분한 양의 데이터 규모

⑤ 내부 데이터이 사용: 개인정보일 경우 비식별 조치방안을 함께 고려

⑥ 외부 데이터의 수집

 데이터 수집 방법

- 설문조사 / 관찰 / 실험 / 웹 크롤링 / 소셜 미디어 분석 / 데이터베이스 및 기존 데이터 활용 / FGI / 스크래퍼

 

2) 분석에 필요한 변수 정의

① 데이터 수집 기획

② 분석변수 정의

 

3) 분석 변수 생성 프로세스 정의

객관적 사실(Fact) 기반의 문제 접근

② 데이터의 상관 분석

③ 프로토타입을 통한 분석 변수 접근

- 프로토타입 접근의 필요성: 문제 인식 수준의 확인 / 필요 데이터 존재 여부 / 사용 목적에 따른 가변성 검증

 

4) 생성된 분석 변수의 정제를 위한 점검항목 정의

- 개념적 대안 설계를 통해 도출된 데이터에 대해 가용성을 평가하고 점검항목을 정의 

① 분석 변수 점검의 필요성

② 분석 변수 점검항목 정의

- 데이터 수집: 데이터 적정성 / 데이터 가용성 / 대체 분석 데이터 유무

- 데이터 적합성: 데이터 중복 / 분석 변수별 범위 / 분석 변수별 연관성 / 데이터 내구성

- 특징 변수: 특징 변수 사용 / 변수 간 결합 가능 여부

- 타당성: 편익/비용 검증 / 기술적 타당성

 

5) 생성된 분석 변수의 전처리 방법 수립

① 데이터 전처리 수행: 데이터 정제 / 통합 / 축소 / 변환

② 빅데이터 분석 프로세스 수행

③ 데이터 전처리 방안 수립

- 정제: 모슨점 포착 / 메타데이터 확인

- 통합/축소: 데이터 통합

- 변환: 데이터 변환

 

6) 생성 변수의 검증 방안 수립

① 분석 변수의 데이터 검증 방안 수립

대량 데이터 / 정밀 데이터 / 데이터 출처 불명확

정확성 / 완전성/ 적시성 / 일관성

② 데이터 검증 체계 수립

 

 

03. 분석 절차와 작업 계획

1) 분석 절차

① 분석 절차의 특징

- 분석 방법론을 구성하는 최소 요건

일반적 데이터 분석 절차 NCS 데이터 분석 절차 단계별 산출물
- 문제인식
- 연구조사
- 도메인 이슈 도출
- 분석목표 수립
- 데이터 요건 정의서
- 분석목표 정의서
- 모형화
- 데이터 수집
- 데이터 분석
- 프로젝트 계획 수립
- 보유 데이터 자산 확인
- 작업문할구조도(WBS)
- 데이터 품질 보고서
- 분석 결과 제시 - 데이터 분석결과 시각화 - 분석 보고서

② 일반적인 문석 절차

분석 절차 적용 시 고려사항

- 문제에 대한 구체적 정의가 가능, 필요 데이터 보유, 분석역량 갖추고 있어야 함!

- 문제에대한 구체적 정의가 없다면 데이터 마이닝 기반으로 데이터를 분석해 인사이트 발굴

 

2) 작업 계획

① 분석 작업 계획 수립

프로젝트 소요비용 배분 / 프로젝트 작업분할구조 수립 / 프로젝트 업무 분장 계획 및 배분

② 분석 작업 계획 수립을 위한 작업분할구조(WBS: Work Breakdown Structure) 작성

데이터 분석과제 정의 / 데이터 준비 및 탐색 / 데이터 분석 모델링 및 검증 / 산출물 정리

 

3) 분석목표정의서

① 분석목표정의서 구성요소

- 원천 데이터 조사: 정보, 데이터 수집 난이도

- 분석 방안 및 적용 가능성 판단

- 성과평가 기준: 정성적, 정량적 평가

② 분석목표정의서 작성 방법: 분석 목적을 설정하고 이를 달성하기 위한 세부 목표를 수립

필요한 데이터 정의, 분석 방법과 데이터 수집 및 분석 난이도, 수행 주기, 분석 결과에 대한 검증 기준을 설계, 도메인 이슈 도출을 통한 개선 방향 토대로 목표 수준 정리

 

 

04. 분석 프로젝트 관리

1) 분석 프로젝트

분석 프로젝트의 특징: 데이터 영역과 비즈니스 영역에 대한 이해 모두 필요, 지속적인 개선 및 변경을 염두에 두기!

분석 프로젝트의 추가적 속성
: 데이터 크기(지속적으로 생성되어 증가), 데이터 복잡도(다양한 데이터 많음), 속도, 분석 모형의 복잡도, 정확도와 정밀도

③ 분석가의 역할

 

2) 분석 프로젝트 관리

① 효율적인 데이터 분석 수행을 위한 필요성

② 분석 프로젝트의 관리 방안

 

3) 분석 프로젝트의 영역별 주요 관리 항목

범위 관리 일정 관리 ③ 원가 관리 ④ 품질 관리 ⑤ 통합 관리

⑥ 조달 관리 ⑦ 인적자원 관리 ⑧ 위험 관리 ⑨ 의사소통 관리 ⑩ 이해관계자 관리