데이터분석
[빅데이터 분석기사] 실기 (체험형) 작업형 3 풀이
J 코딩
2024. 6. 21. 12:35
반응형
구름EDU - 모두를 위한 맞춤형 IT교육
구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/
edu.goorm.io
# 데이터 read
import pandas as pd
df = pd.read_csv("data/Titanic.csv")
# 1) 문제풀이
# 사용자 코딩
from scipy.stats import chi2_contingency
G = df['Gender']
S = df['Survived']
# contingency_table 생성
cont_table = pd.crosstab(G, S)
# chi^2 test
# 카이제곱통계량
statistic = chi2_contingency(cont_table)[0]
# p-value
pvalue = chi2_contingency(cont_table)[1]
# p-value가 유의수준 보다 작으면 귀무가설(독립성을 가진다 = 기각)
# p-valuer가 유의수준 보다 크면 귀무가설(독립성을 가진다 = 채택)
ans = statistic.round(3)
# 정답 출력
print(ans)
# 2) 문제풀이
# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit().summary() 암기
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit().summary()
print(ans)
parch의 계수 : round(-0.2007, 3)
or
바로 값으로 추출하는 방법이 있다
# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit() <==
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit()
print(ans.params['Parch'].round(3)) # Series
# 3) 문제풀이
# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit() 암기
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit().params
# Odds ratio(오즈비) = np.exp()
import numpy as np
print(np.exp(ans)['SibSp'].round(3))
감사합니다.
반응형