본문 바로가기
Machine Learning

[ML] Cost Function_ Boston 집값 예측

by ram_ 2023. 1. 7.
from sklearn.datasets import load_boston

boston = load_boston()
print(boston.DESCR)

*PRICE 칼럼은 Label이므로 이후 과정에서의 주의가 필요하다.
상관계수와 히트맵

Price와 RM(방의 수), LSTAT(저소득층 인구)가 높은 상관관계를 보인다.

 -> RM과 LSTAT와 PRICE의 관계에 대해 좀 더 관찰해본다.


from sklearn.model_selection import train_test_split

X = boston_pd.drop('PRICE', axis=1)
y = boston_pd['PRICE']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=13)

from sklearn.linear_model import LinearRegression

reg = LinearRegression()
reg.fit(X_train, y_train)

Train과 Test 데이터의 RMSE 값

 


 + 'LSTAT'도 제외한 값을 만들어본다.

'Machine Learning' 카테고리의 다른 글

[ML] Credit Card Fraud Detection  (0) 2023.01.10
[ML] Ensemble _HAR data _ DecisionTree / RandomForest  (0) 2023.01.09
[ML] Cost Function _poly1d  (0) 2023.01.06
[ML] ROC Curve  (0) 2023.01.06
[ML] Hyperparameter Tuning  (0) 2023.01.06