로지스틱 회귀분석
종속변수가 범주형으로 0, 1의 값을 갖는 경우
df = pd.read_csv('/content/drive/MyDrive/sample_data/admission.csv')
df
df.info()
# 독립변수
X = df[['gre','gpa']].values
# X = df.loc[:,['gre','gpa', 'rank']].values
X
# 종속변수
y = df['admit'].values
y
# 1.정규화 - 분리 전 정규화
scal_mx = MinMaxScaler()
df_sc_mx = scal_mx.fit_transform(X)
pd.DataFrame(X).boxplot()
plt.show()
# 데이터 분리
X_train, X_test, y_train , y_test = train_test_split(X,y,test_size=0.3)
# 2.정규화 - 분리 후 정규화
scal_mx = MinMaxScaler()
X_train = scal_mx.fit_transform(X_train)
X_test = scal_mx.fit_transform(X_test)
pd.DataFrame(X_train).boxplot()
plt.show()
model = LogisticRegression()
model.fit(X_train,y_train)
print(model.score(X_train,y_train))
print(model.score(X_test,y_test))
# 예측 - 예측할때는 반드시 매트릭스 형태로 넣어줘야한다
pred_val = [[520, 3.33, 1]]
print(model.predict(pred_val))
print(model.predict_proba(pred_val))
'Colab > 머신러닝' 카테고리의 다른 글
07. 결정 트리 (Decision Tree) 01 (0) | 2023.03.08 |
---|---|
06. K-최근접 이웃 회귀 K-NN Regression (0) | 2023.03.06 |
04. 선형회귀(linear regression) - 학습, 테스트 (0) | 2023.03.02 |
03. 선형회귀(linear regression) (0) | 2023.02.28 |
02. 선형회귀(linear regression) (0) | 2023.02.27 |