Colab/머신러닝

05. 로지스틱 회귀분석 Logistic Regression

HicKee 2023. 3. 3. 23:35

로지스틱 회귀분석
종속변수가 범주형으로 0, 1의 값을 갖는 경우

df = pd.read_csv('/content/drive/MyDrive/sample_data/admission.csv')
df

df.info()

 

# 독립변수
X = df[['gre','gpa']].values
# X = df.loc[:,['gre','gpa',	'rank']].values
X
# 종속변수
y = df['admit'].values
y
# 1.정규화 - 분리 전  정규화
scal_mx = MinMaxScaler()
df_sc_mx = scal_mx.fit_transform(X)
pd.DataFrame(X).boxplot()
plt.show()

# 데이터 분리
X_train, X_test, y_train , y_test = train_test_split(X,y,test_size=0.3)
# 2.정규화  - 분리 후  정규화
scal_mx = MinMaxScaler()
X_train = scal_mx.fit_transform(X_train)
X_test = scal_mx.fit_transform(X_test)
pd.DataFrame(X_train).boxplot()
plt.show()

model = LogisticRegression()
model.fit(X_train,y_train)
print(model.score(X_train,y_train))
print(model.score(X_test,y_test))
# 예측 - 예측할때는 반드시 매트릭스 형태로 넣어줘야한다
pred_val = [[520,	3.33,	1]]
print(model.predict(pred_val))
print(model.predict_proba(pred_val))