분류 전체보기
-
[0416 복습] 딥러닝 심화_Object Detection, Bounding Box, Class Classification, Confidence Score, IoU, NMS, Precision, Recall, AP,mAP, AnnotationKT 에이블스쿨 복습 2024. 4. 16. 22:48
**셀프 복습용으로 작성한 것이라 실수가 있을 수 있습니다! 혹시 실수를 발견하시면 댓글로 알려주시면 감사드리겠습니다 :) 딥러닝 심화 CH1. 시각지능 Object Detection의 주요 개념 Classification + Localization Multi-Labeled Classification + Bounding Box Regression: 다중분류 문제와 bounding box 선형회귀의 결합 Localization: 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음 Object Detection: 여러 개의 Object들의 위치를 Bounding Box로 지정하여 찾음 1. Bounding Box bounding box는 지도학습으로 정답이 있어야 함, 하나의 Object가..
-
[0415 복습] 딥러닝 기초_딥러닝 개념, 회귀 모델링, 이진분류, 다중분류, CNN 등KT 에이블스쿨 복습 2024. 4. 15. 22:55
**셀프 복습용으로 작성한 것이라 실수가 있을 수 있습니다! 혹시 실수를 발견하시면 댓글로 알려주시면 감사드리겠습니다 :) 딥러닝 기초 CH1. 딥러닝 개념 이해 가중치와 가중치 조정 각 변수별 중요도를 선정하여 변수 X 가중치를 통해 모델링 최적의 모델 = 오차가 가장 적은 모델, 최적의 가중치를 찾아 오차를 줄이는 방식 weight를 조정해 모델 학습, 오차가 줄어드는지 확인 → 지정한 횟수만큼 or 더 이상 오차가 줄지 않을 때까지 반복 model.fit(x_train, y_train)을 통해 학습 가중치에 초기값을 랜덤으로 지정 후 → 예측 결과 뽑음 (학습 데이터) 오차 계산 후 오차를 줄이는 방향으로 가중치 조정 (Optimizer; 가중치를 어떻게 줄여야 하는지 찾는 역할) 이 과정을 계속 ..
-
[0402 복습] 앙상블 (보팅, 배깅, 부스팅, 스태킹)KT 에이블스쿨 복습 2024. 4. 3. 09:08
앙상블 CH1. 앙상블 이해 앙상블(Ensembel) 약한 모델이 올바르게 결함하면 더 정확하고 견고한 모델 얻을 수 있음 ! → 약분류기를 강분류기로 만드는 방법 여러 개의 모델을 결합해 훨씬 강력한 모델을 생성하는 기법 캐글과 같은 많은 기계학습 경쟁에서 상위 순위 차지 앙상블 방법: ① 보팅 ② 배깅 ③ 부스팅 ④ 스태킹 CH2. 보팅 보팅(Voting) 여러 모델들(다른 알고리즘)의 예측 결과를 투표를 통해 최종 예측 결과 결정하는 방법! 하드 보팅: 다수 모델이 예측한 값 소프트 보팅: 각 모델이 예측한 레이블 값의 결정 확률 평균 구하고 가장 확률이 높은 값 CH3. 배깅 배깅(Bagging) Bootstrap Aggregating의 약자, 부트스트랩한 데이터로 모델 학습 (같은 모델) 부트스..
-
[0401 복습] 머신러닝 마무리_로지스틱 회귀분석, K-Fold Cross Validation(k-분할 교차 검증), 성능 예측, 하이퍼파라미터 튜닝, Random Search, Grid SearchKT 에이블스쿨 복습 2024. 4. 1. 17:58
결정트리 실습 리뷰 - 모델링에서 학습용, 평가용 데이터 분리 시 검증용 데이터까지 필요하다면 x_val, y_val 로 변수명 설정! - max_depth의 기본값 = None - 결정트리에서 변수 중요도를 표시: 트리 구조에서 특정 변수가 줄여준 총 불순도의 양이 많은 순서 (전체에서 차지한 비율) **max_depth를 주면 변수 중요도가 달라짐! Why? 트리의 깊이(단계)가 줄어들기 때문에 당연히 변수 중요도가 달라짐 CH4. Logistic Regression(로지스틱 회귀분석) 확률문제를 선형회귀로 모델링, 로지스틱 회귀 공부 시간에 따라 합격 (1) 불합격 (0)으로 나눔! 범주값도 숫자이기 때문에 선형 회귀모델을 만들 수는 있음! 그러나 아래의 그래프는 0,1 제외 다른값도 존재! 결과는..
-
[0329 복습] 기본 알고리즘_Linear Regression(선형회귀), K-Nearest Neghbor(KNN), 정규화(스케일링), Decision Tree(의사결정나무, 결정트리)KT 에이블스쿨 복습 2024. 3. 29. 22:58
CH1. Linear Regression(선형회귀) 최적의 회귀모델 y = ax +b (a는 기울기(가중치), b는 y절편(편향)) 다양한 형태를 가진 데이터에서 최선의 직선을 긋는 것! (오차의 합=MSE이 최소가 되는 직선) 단순 회귀 독립변수가 하나면 단순 회귀, 여러 개이면 다중 회귀! x 값 하나만으로 y 값을 설명할 수 있는 경우 모델 학습 후 회귀계수 확인 가능 회귀식: y = w0 + w1x1 coef_: 회귀계수(=가중치) intercept_: 편향 다중 회귀 여러 독립변수가 종속변수에 영향을 미치는 선형 회귀 y값을 설명하기 위해서는 여러 개의 x값이 필요한 경우! 모델 학습 후 회귀계수 확인 가능 회귀식: y = w0 + w1x1 + w2x2 + w3x3 + w4x4 ... + wnx..
-
[0328 복습] 머신러닝 성능 평가(회귀 모델, 분류 모델)_MSE, MAE, 혼동행렬, 결정계수, F1-Score, SST, SSR, SSEKT 에이블스쿨 복습 2024. 3. 28. 23:07
**셀프 복습용으로 작성한 것이라 실수가 있을 수 있습니다! 혹시 실수를 발견하시면 댓글로 알려주시면 감사드리겠습니다 :) CH1. 회귀 모델 성능 평가 평가 방법 분류 모델 평가: 0인지 1인지 예측하는 것 (이진분류), 예측값이 실젯값과 많이 같을수록 좋은 모델이라 할 수 있음 정확히 예측한 비율로 모델 성능을 평가 (accuracy_score: 정확도) 회귀 모델 평가: 정확한 값을 예측하기는 사실상 어려움, 예측값이 실젯값에 가까울수록 좋은 모델이라 할 수 있음 예측한 값과 실젯값의 차이(=오차)로 모델 성능을 평가 (mean_absolute_error: 오차) 오차 제곱의 합 오차 제곱(SSE)의 합을 구한 후 평균을 구함 → MSE 오차의 제곱이므로 루트를 사용해 일반적인 값으로 표현 → RM..
-
[빅분기] CH2. 데이터 탐색_데이터 탐색의 기초, 고급 데이터 탐색빅데이터분석기사 2024. 3. 27. 20:14
24.03.26 p.236 - p.265 개념공부 및 예상문제 풀이 예상문제 오답노트_데이터 탐색의 기초 01) 탐색적 데이터 분석 및 필요성에 대한 설명으로 틀린 것은? ① 수집한 데이터가 들어왔을 때, 다양한 방법을 통해서 자료를 관찰하고 이해하는 과정을 의미하는 것이다. ② 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 이해할 수 있다. ③ 문제점 발견 시 본 분석 전 데이터의 수집 의사를 결정할 수 있다. ④ 최초의 가설에 집중하여 원하는 패턴과 양상에 맞는지에 집중하여 검증하는 데 노력한다. - 새로운 양상을 발견하면 가설을 수정하는 방식으로 진행한다. 10) 포트폴리오의 투자수익률, GDP 성장률 등의 연간 자료에 대해서 알맞은 기술적 통계량인 평균은 무엇인가? ① 산술평균 ② ..