인공지능-기계학습/통계_모델_알고리즘
sklearn을 이용한 초간단 선형회귀 모델
The Yellow Lion King
2022. 8. 25. 00:08
반응형
파이썬의 싸이킷런 패키지(sklearn)을 이용하여 선형회귀 모델 만드는 초간단 예시입니다.
# sklearn 패키지에서 선형회귀 모듈을 불러옵니다.
from sklearn.linear_model import LinearRegression
model_lr = LinearRegression()
# 필요한 훈련 데이터를 간단히 만듭니다.
X_train = np.asarray([[170, 70], [180, 80], [195, 85], [159, 51]])
y_train = np.asarray([120, 130, 140, 100])
# 모델을 훈련 시킵니다.
reg = model_lr.fit(X_train, y_train)
# 간단히 성능을 알아봅니다.
print(reg.score(X_train, y_train))
# 새로운 데이터로 예측을 해봅니다.
y_preds = reg.predict(np.asarray([[170,70]]))
y_preds
출력 내용은 아래와 같습니다.
0.9987095109046329
array([119.25474255])
120에 가까운 숫자가 나오는 것으로 보아 모델이 잘 동작 함을 알 수 있습니다.
사실 데이터 항목이 많아지고 데이터의 분포에 따라서 학습이 잘되지 않는 경우도 많이 있습니다. 이럴 경우 데이터 전처리 작업과의 고달픈 (삽질?) 시간이 필요합니다.
반응형