from sklearn.datasets import load_boston
boston = load_boston()
print(boston.DESCR)




Price와 RM(방의 수), LSTAT(저소득층 인구)가 높은 상관관계를 보인다.
-> RM과 LSTAT와 PRICE의 관계에 대해 좀 더 관찰해본다.

from sklearn.model_selection import train_test_split
X = boston_pd.drop('PRICE', axis=1)
y = boston_pd['PRICE']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=13)
from sklearn.linear_model import LinearRegression
reg = LinearRegression()
reg.fit(X_train, y_train)

Train과 Test 데이터의 RMSE 값

+ 'LSTAT'도 제외한 값을 만들어본다.


'Machine Learning' 카테고리의 다른 글
| [ML] Credit Card Fraud Detection (0) | 2023.01.10 |
|---|---|
| [ML] Ensemble _HAR data _ DecisionTree / RandomForest (0) | 2023.01.09 |
| [ML] Cost Function _poly1d (0) | 2023.01.06 |
| [ML] ROC Curve (0) | 2023.01.06 |
| [ML] Hyperparameter Tuning (0) | 2023.01.06 |