빅데이터분석기사

[빅분기] CH2. 데이터 탐색_데이터 탐색의 기초, 고급 데이터 탐색

리니끄적 2024. 3. 27. 20:14
24.03.26
 

p.236 - p.265 개념공부 및 예상문제 풀이

 

예상문제 오답노트_데이터 탐색의 기초

 

01) 탐색적 데이터 분석 및 필요성에 대한 설명으로 틀린 것은? 

 

① 수집한 데이터가 들어왔을 때, 다양한 방법을 통해서 자료를 관찰하고 이해하는 과정을 의미하는 것이다.

② 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 이해할 수 있다.

③ 문제점 발견 시 본 분석 전 데이터의 수집 의사를 결정할 수 있다.

 최초의 가설에 집중하여 원하는 패턴과 양상에 맞는지에 집중하여 검증하는 데 노력한다.

 

- 새로운 양상을 발견하면 가설을 수정하는 방식으로 진행한다.

 

10) 포트폴리오의 투자수익률, GDP 성장률 등의 연간 자료에 대해서 알맞은 기술적 통계량인 평균은 무엇인가? 


① 산술평균                                                 ② 조화평균

③ 기술평균                                                 ④  기하평균

 

- 비율 = 기하평균으로 적절하다

 

 

예상문제 오답노트_고급 데이터 탐색

 

01) 시간데이터의 정의와 의미 연결이 틀린 것은? 

 

① 유효 시간: 객체가 발생하거나 소멸된 시간

② 거래 시간: 관리 시스템을 통해 처리된 시간

③ 스냅샷 데이터: 시간 개념이 필요하지 않아 거래, 유효 시간을 미지원하는 데이터 

 다변량 데이터: 거래 시간과 유효 시간을 동시에 지원하는 데이터

 

- 다변량 데이터는 2개 이상의 변수를 가진 데이터이다. 거래 시간과 유효 시간을 동시에 지원하는 데이터는 이원시간 데이터이다.

 

02) 다음은 어떤 공간데이터 용어의 정의인가?

공간 객체 간 관계를 표현하며 방위, 공간 객체 간의 중첩, 포함, 교차, 분리 등과 같은 위치적 관계

 

① 비 공간 타입

② 레스터 공간 타입

③ 벡터 공간 타입

위상적 공간 타입

 

 

09) 요인분석의 목적이 아닌 것은?

 

① 변수특성파악: 관련된 변수들의 묶음으로 상호독립특성을 파악할 수 있다.

② 측정항목의 타당성 평가: 그룹이 되지 않은 변수의 특성을 구분할 수 있게 된다.

분포분석: 추론통계의 의한 분석을 통해 수행한다.

요인점수를 통한 변수생성: 회귀분석, 군집분석, 판별분석 등에 적용 가능한 변수를 생성할 수 있다.

 

- 요인분석의 목적에는 분포분석이 없으며, 요인분석의 특성상 추론통계가 아닌 기술 통계에 의한 분석이 특징이다.