from sklearn.datasets import load_boston
boston = load_boston()
print(boston.DESCR)
Price와 RM(방의 수), LSTAT(저소득층 인구)가 높은 상관관계를 보인다.
-> RM과 LSTAT와 PRICE의 관계에 대해 좀 더 관찰해본다.
from sklearn.model_selection import train_test_split
X = boston_pd.drop('PRICE', axis=1)
y = boston_pd['PRICE']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=13)
from sklearn.linear_model import LinearRegression
reg = LinearRegression()
reg.fit(X_train, y_train)
Train과 Test 데이터의 RMSE 값
+ 'LSTAT'도 제외한 값을 만들어본다.
'Machine Learning' 카테고리의 다른 글
[ML] Credit Card Fraud Detection (0) | 2023.01.10 |
---|---|
[ML] Ensemble _HAR data _ DecisionTree / RandomForest (0) | 2023.01.09 |
[ML] Cost Function _poly1d (0) | 2023.01.06 |
[ML] ROC Curve (0) | 2023.01.06 |
[ML] Hyperparameter Tuning (0) | 2023.01.06 |