데이터분석
[빅데이터분석기사] 실기 기출문제 5회 작업형 3
J 코딩
2024. 6. 22. 00:31
반응형
import pandas as pd
df= pd.read_csv('https://raw.githubusercontent.com/Datamanim/datarepo/main/krdatacertificate/e5_p3_1.csv')
df.head()
데이터 모양
문제 1
t분포 양쪽 꼬리에서의 t 값을 구하여라 (반올림하여 소수4째자리까지)
1개의 샘플 데이터에 대하여 T검정을 시행하려고 한다. 이 학생들의 키의 95% 신뢰구간을 구하고자 한다.
검정통계량, p-value, critical_value(t분포 양쪽 꼬리의 t값)를 구하여라
h_mean = df['height'].mean().round(3)
# t-value
import numpy as np
from scipy.stats import ttest_1samp
from scipy.stats import t
alpha = 0.05
critical_value = t.ppf(1-alpha/2, df=len(df)-1)
print(critical_value.round(4))
# 신뢰수준 범위 구하기
std = np.std(df['height'], ddof=1)
lower = round(h_mean - critical_value * std / np.sqrt(len(df['height'])), 3)
upper = round(h_mean + critical_value * std / np.sqrt(len(df['height'])), 3)
print(lower, upper)
감사합니다.
반응형