Machine Learning(3)
-
Logistic Regression
✅ 학습 목표 ✅ 로지스틱 회귀란? ✅ 선형 모델 방식을 분류에 사용하는 이유 ✅ 선형 모델 - Logistic Regression📌 Sigmoid 함수 중요!- 0과 1을 넘어가지 않음 -> 이진 분류를 명확하게 잡아줄 수 있음! ✅ 주요 매개변수 ✅ 목표손글씨 데이터 숫자(0~9)를 분류하는 모델을 만들어 보자분류 모델의 불확실성을 확인하고 이해이미지 데이터의 형태를 알아보자# 필요한 라이브러리 importimport pandas as pdimport numpy as npfrom matplotlib import pyplot as plt # 데이터 가져오기digit = pd.read_csv('data/digit_train.csv')digit📌 데이터 분석label : 0~9까지 정답이 들어있는 컬..
2024.06.14 -
규제
✅ 규제 ✅ 학습 목표 ✅ 선형 회귀 수업 흐름도 ✅ 규제란? ✅ 선형 회귀 ✅ 모델 정규화- L2 규제를 더 자주 씀!- 가중치 크기로 중요도를 판단! ✅ L2 - Ridge# 모델 importfrom sklearn.linear_model import Ridgeridge_model = Ridge(alpha=100)ridge_model.fit(extend_X_train, y_train)ridge_model.score(extend_X_test, y_test)ridge_model.score(extend_X_train, y_train)📌 test 성능은 좋아졌는데 과대적합은 완전하게 해소하지 못했다.✅ L1 - Lassofrom sklearn.linear_model import Lassolasso_model..
2024.06.14 -
보스턴 주택 데이터 회귀분석
✅ 목표 설정특성 변수를 활용해서 회귀예측을 진행해보자특성곱이라는 특성 공학을 진행해보자# 필요한 라이브러리 불러오기import pandas as pdimport numpy as npfrom matplotlib import pyplot as plt# 데이터 로딩data = pd.read_csv('data/boston_housing.csv')data # 필요없는 컬럼 제거하기data.drop('Unnamed: 0', axis=1, inplace=True)data# 데이터 프레임 간략한 정보 확인하기data.info()# 데이터의 컬럼을 살펴보기data.columns✅ 설명 변수(특성변수, 문제데이터, 특성값)원인 : 예측을 설명할 수 있는 변수 / 종속변수에 영향을 미치는 변수'CRIM' : 범죄율'ZN..
2024.06.14