[ML] Cost Function _poly1d
학습 데이터 각각에 정답(주택가격)이 주어져 있으므로 지도학습(Supervised Learning)이며, 주택 가격을 연속된 값으로 예측하는 것이므로 회귀(Regression) 문제이다. 선형회귀 (Linear Regression) 문제의 정의 : 입력 변수(특징) x가 하나인 경우, 선형회귀 문제는 주어진 학습데이터와 가장 잘 맞는 Hypothesis함수 h를 찾는 문제가 된다. a = np.ploy1d[[1, 1]) b = np.ploy1d[[1, -1] ploy1d[[1, 1]) = x + 1 / ploy1d[[1, -1]) = x -1을 의미한다. 고로 a * b = (x+1)(x-1) = x^2 -1인데, 이는 poly1d([1, 0, -1])로 출력된다. x^이 1, x항이 없으니 0, 상수항..
2023. 1. 6.
[ML] Hyperparameter Tuning_ 교차검증
교차검증 과적합 : 모델이 학습 데이터에만 과도하게 최적화된 현상. 그로 인해 일반화된 데이터에서는 예측 성능이 과하게 떨어지는 현상. 지난번 와인 맛 평가에서 훈련용 데이터의 Acc는 72.94, 테스트용 데이터는 Acc가 71.61%였는데, 누가 이 결과가 정말 괜찮은 것인지 묻는다면? 나에게 주어진 데이터에 적용한 모델의 성능을 정확히 표현하기 위해서도 유용하다 import numpy as np from sklearn.model_selection import KFold X = np.array([ [1, 2], [3, 4], [1, 2], [3, 4] ]) y = np.array([1, 2, 3, 4]) kf = KFold(n_splits=2) print(kf.get_n_splits(X)) print..
2023. 1. 5.