새벽코딩

[빅데이터 분석기사] 실기 (체험형) 작업형 3 풀이 본문

데이터분석

[빅데이터 분석기사] 실기 (체험형) 작업형 3 풀이

J 코딩 2024. 6. 21. 12:35
반응형

https://dataq.goorm.io/exam/3/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%EC%B2%B4%ED%97%98/quiz/5

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/

edu.goorm.io

 

 

 

# 데이터 read
import pandas as pd
df = pd.read_csv("data/Titanic.csv")

 

# 1) 문제풀이 

# 사용자 코딩
from scipy.stats import chi2_contingency
G = df['Gender']
S = df['Survived']

# contingency_table 생성
cont_table = pd.crosstab(G, S)
# chi^2 test
# 카이제곱통계량
statistic = chi2_contingency(cont_table)[0]
# p-value 
pvalue = chi2_contingency(cont_table)[1]
# p-value가 유의수준 보다 작으면 귀무가설(독립성을 가진다 = 기각)
# p-valuer가 유의수준 보다 크면 귀무가설(독립성을 가진다 = 채택)
ans = statistic.round(3)
# 정답 출력
print(ans)

# 2) 문제풀이

# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit().summary() 암기
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit().summary()
print(ans)

parch의 계수 : round(-0.2007, 3)

or

바로 값으로 추출하는 방법이 있다

# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit() <== 
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit()
print(ans.params['Parch'].round(3)) # Series

# 3) 문제풀이

# 사용자 코딩
from statsmodels.formula.api import logit
# logit('종속변수~독립변수1+독립변수2+독립변수n', data=df).fit() 암기
ans = logit('Survived ~ Gender+SibSp+Parch+Fare', data=df).fit().params
# Odds ratio(오즈비) = np.exp()
import numpy as np
print(np.exp(ans)['SibSp'].round(3))

 

감사합니다.

반응형
Comments