ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅분기] CH2. 데이터 분석 계획_분석 작업 계획_240313
    빅데이터분석기사 2024. 3. 13. 22:58

    24.03.13

     

    01. 분석 작업 개요

    1) 데이터 처리 영역

    - 데이터 분석을 위한 기초 데이터를 정의, 수집 및 저장, 분석하기 수월하도록 물리적인 환경을 제공하는 영역

    - 데이터 소스 / 데이터 수집 / 데이터 저장 / 데이터 처리

    2) 데이터 분석 영역

    ① 데이터 분석: 저장된 데이터를 추출 및 가공해 목적에 맞는 분석 방법 통해 분석

    <데이터 분석 단계 - NCS>

    도메인 이슈 도출 / 분석목표 수립 / 프로젝트 계획 수립 / 보유 데이터 자산 확

    ② 데이터 표현: 분석된 겨로가를 누구나 쉽게 이해할 수 있도록 적합한 시각화 방법 이용해 표현

     

     

    02. 데이터 확보 계획

    1) 데이터 확보를 위한 사전 검토사항

    필요 데이터의 정의

    ② 보유 데이터의 현황파악

    ③ 분석 데이터의 유형

    편향되지 않고 충분한 양의 데이터 규모

    ⑤ 내부 데이터이 사용: 개인정보일 경우 비식별 조치방안을 함께 고려

    ⑥ 외부 데이터의 수집

     데이터 수집 방법

    - 설문조사 / 관찰 / 실험 / 웹 크롤링 / 소셜 미디어 분석 / 데이터베이스 및 기존 데이터 활용 / FGI / 스크래퍼

     

    2) 분석에 필요한 변수 정의

    ① 데이터 수집 기획

    ② 분석변수 정의

     

    3) 분석 변수 생성 프로세스 정의

    객관적 사실(Fact) 기반의 문제 접근

    ② 데이터의 상관 분석

    ③ 프로토타입을 통한 분석 변수 접근

    - 프로토타입 접근의 필요성: 문제 인식 수준의 확인 / 필요 데이터 존재 여부 / 사용 목적에 따른 가변성 검증

     

    4) 생성된 분석 변수의 정제를 위한 점검항목 정의

    - 개념적 대안 설계를 통해 도출된 데이터에 대해 가용성을 평가하고 점검항목을 정의 

    ① 분석 변수 점검의 필요성

    ② 분석 변수 점검항목 정의

    - 데이터 수집: 데이터 적정성 / 데이터 가용성 / 대체 분석 데이터 유무

    - 데이터 적합성: 데이터 중복 / 분석 변수별 범위 / 분석 변수별 연관성 / 데이터 내구성

    - 특징 변수: 특징 변수 사용 / 변수 간 결합 가능 여부

    - 타당성: 편익/비용 검증 / 기술적 타당성

     

    5) 생성된 분석 변수의 전처리 방법 수립

    ① 데이터 전처리 수행: 데이터 정제 / 통합 / 축소 / 변환

    ② 빅데이터 분석 프로세스 수행

    ③ 데이터 전처리 방안 수립

    - 정제: 모슨점 포착 / 메타데이터 확인

    - 통합/축소: 데이터 통합

    - 변환: 데이터 변환

     

    6) 생성 변수의 검증 방안 수립

    ① 분석 변수의 데이터 검증 방안 수립

    대량 데이터 / 정밀 데이터 / 데이터 출처 불명확

    정확성 / 완전성/ 적시성 / 일관성

    ② 데이터 검증 체계 수립

     

     

    03. 분석 절차와 작업 계획

    1) 분석 절차

    ① 분석 절차의 특징

    - 분석 방법론을 구성하는 최소 요건

    일반적 데이터 분석 절차 NCS 데이터 분석 절차 단계별 산출물
    - 문제인식
    - 연구조사
    - 도메인 이슈 도출
    - 분석목표 수립
    - 데이터 요건 정의서
    - 분석목표 정의서
    - 모형화
    - 데이터 수집
    - 데이터 분석
    - 프로젝트 계획 수립
    - 보유 데이터 자산 확인
    - 작업문할구조도(WBS)
    - 데이터 품질 보고서
    - 분석 결과 제시 - 데이터 분석결과 시각화 - 분석 보고서

    ② 일반적인 문석 절차

    분석 절차 적용 시 고려사항

    - 문제에 대한 구체적 정의가 가능, 필요 데이터 보유, 분석역량 갖추고 있어야 함!

    - 문제에대한 구체적 정의가 없다면 데이터 마이닝 기반으로 데이터를 분석해 인사이트 발굴

     

    2) 작업 계획

    ① 분석 작업 계획 수립

    프로젝트 소요비용 배분 / 프로젝트 작업분할구조 수립 / 프로젝트 업무 분장 계획 및 배분

    ② 분석 작업 계획 수립을 위한 작업분할구조(WBS: Work Breakdown Structure) 작성

    데이터 분석과제 정의 / 데이터 준비 및 탐색 / 데이터 분석 모델링 및 검증 / 산출물 정리

     

    3) 분석목표정의서

    ① 분석목표정의서 구성요소

    - 원천 데이터 조사: 정보, 데이터 수집 난이도

    - 분석 방안 및 적용 가능성 판단

    - 성과평가 기준: 정성적, 정량적 평가

    ② 분석목표정의서 작성 방법: 분석 목적을 설정하고 이를 달성하기 위한 세부 목표를 수립

    필요한 데이터 정의, 분석 방법과 데이터 수집 및 분석 난이도, 수행 주기, 분석 결과에 대한 검증 기준을 설계, 도메인 이슈 도출을 통한 개선 방향 토대로 목표 수준 정리

     

     

    04. 분석 프로젝트 관리

    1) 분석 프로젝트

    분석 프로젝트의 특징: 데이터 영역과 비즈니스 영역에 대한 이해 모두 필요, 지속적인 개선 및 변경을 염두에 두기!

    분석 프로젝트의 추가적 속성
    : 데이터 크기(지속적으로 생성되어 증가), 데이터 복잡도(다양한 데이터 많음), 속도, 분석 모형의 복잡도, 정확도와 정밀도

    ③ 분석가의 역할

     

    2) 분석 프로젝트 관리

    ① 효율적인 데이터 분석 수행을 위한 필요성

    ② 분석 프로젝트의 관리 방안

     

    3) 분석 프로젝트의 영역별 주요 관리 항목

    범위 관리 일정 관리 ③ 원가 관리 ④ 품질 관리 ⑤ 통합 관리

    ⑥ 조달 관리 ⑦ 인적자원 관리 ⑧ 위험 관리 ⑨ 의사소통 관리 ⑩ 이해관계자 관리

Designed by Tistory.