반응형

파이썬의 싸이킷런 패키지(sklearn)을 이용하여 선형회귀 모델 만드는 초간단 예시입니다.

# sklearn 패키지에서 선형회귀 모듈을 불러옵니다.
from sklearn.linear_model import LinearRegression
model_lr = LinearRegression()

# 필요한 훈련 데이터를 간단히 만듭니다.
X_train = np.asarray([[170, 70], [180, 80], [195, 85], [159, 51]])
y_train = np.asarray([120, 130, 140, 100])

# 모델을 훈련 시킵니다.
reg = model_lr.fit(X_train, y_train)

# 간단히 성능을 알아봅니다.
print(reg.score(X_train, y_train))

# 새로운 데이터로 예측을 해봅니다.
y_preds = reg.predict(np.asarray([[170,70]]))
y_preds

출력 내용은 아래와 같습니다.

0.9987095109046329
array([119.25474255])

120에 가까운 숫자가 나오는 것으로 보아 모델이 잘 동작 함을 알 수 있습니다.

 

사실 데이터 항목이 많아지고 데이터의 분포에 따라서 학습이 잘되지 않는 경우도 많이 있습니다. 이럴 경우 데이터 전처리 작업과의 고달픈 (삽질?) 시간이 필요합니다.

 

 

 

 

반응형

+ Recent posts