본문 바로가기
반응형

데이터과학5

SAS를 이용한 이표본 T 검정 방법 SAS를 이용한 이표본 T 검정 방법 안녕하세요. Career hacker입니다. 오늘은 평균 비교 방법 중 두 그룹의 평균을 비교하는 이표본 t-검정을 SAS를 이용해 실습해보겠습니다. 굳이 SAS가 아니어도 파이썬이나 R 역시 결과 창은 비슷하기 때문에 결과 해석하는 방법은 같습니다. 1. t-검정으로 해결할 수 있는 문제 다판다 쇼핑몰의 고민 다판다 쇼핑몰은 신규 고객을 보다 많이 유치하기 위해 배너 광고 실을 생각입니다. 배너광고 단가는 위치와 크기에 따라 다르게 측정됩니다. 그래서 다판다 쇼핑몰은 단가가 비슷한 위치 중 가장 광고효과가 좋은 위치를 선택하기 위해 임시로 100명의 고객을 대상으로 다음과 같이 두 위치에 다르게 배너 광고가 보이게 했습니다. 배너 위치에 따른 조회율 비교 그 결과 .. 2021. 4. 3.
데이터 사이언스란? 데이터 사이언스는 생활 속 문제를 데이터를 이용해 해결하는 방법입니다. 데이터 사이언스는 통계학, 데이터 마이닝, AI 등 다양한 학문이 결합해 만들어졌습니다. 데이터 사이언스는 경험에 기초한 문제해결과 다릅니다. 경험에 기초한 문제해결은 전문가나 경험자에 의존합니다. 하지만 데이터 사이언스는 기록된 데이터를 분석해 보다 객관적으로 문제를 해결합니다. 1. 데이터 사이언스란? 데이터 과학은 우리 생활 속 현상을 통계학, 데이터 마이닝, 기계학습 방법 등을 통해 분석하고 이해하는 과학적 방법입니다. 데이터 과학은 생활 속 다양한 문제를 데이터에 기초해 해결합니다. 예를 들면, 다음과 같은 문제를 해결할 수 있습니다. 어떤 상품이 서로 같이 많이 팔릴까? 사람들은 어떤 경로로 우리 매장을 방문할까? 코로나 .. 2021. 3. 30.
ANOVA 일원분산 분석이란? ANOVA 일원분산 분석이란? 안녕하세요. Career hacker입니다. 오늘부터 분산분석(Analysis of Variance;ANOVA) 방법을 알아보겠습니다. 오늘은 그 첫 순서로 일원분산분석(one-way ANOVA)에 대해 알아보겠습니다. 1. 분산분석이란? 분산분석은 연속형 종속변수(반응변수)와 범주형 독립변수(설명변수)를 갖는 데이터를 분석하기 위한 방법입니다. 실험계획법에서 집중적으로 연구한 분야이기도 합니다. 그러다 보니 종속변수라는 말보단 반응변수를 더 많이 사용합니다. 또한 독립변수도 요인(factor)라고 합니다. 범주형 독립변수는 질적 변수입니다. 즉, 성별, 거주 지역, 정치 성향과 같이 일정한 수준(level)을 갖는 변수들입니다. 가령 성별의 수준은 두 가지로 남, 여가 각.. 2021. 3. 22.
SAS를 이용한 일표본 T-검정 평균 비교: 일표본 t-test 실습 안녕하세요. Career hacker 입니다. 오늘은 SAS를 이용한 일표본 T-검정 방법에 대해 알아보겠습니다. 참고: 실습에 사용할 통계 패키지는 SAS University Edition으로 현재 무상으로 제공되고 있습니다. [예제] 나이스 스포츠는 매년 수백만 켤레의 운동화를 생산한다. 최근 나이스 스포츠는 신상으로 울트라슈퍼부스트 시리즈를 출시했다. 그런데 고객들로부터 280 사이즈 울트라슈퍼부스트 시리즈의 발 사이즈가 표기된 것과 다르다는 컴플레인이 받았다. 컴플레인 건수가 많지 않아 우선 생산된 제품 중 100개를 임의추출해 280 사이즈와 같은지 확인하려고 한다. [참고] 관련 데이터는 본 아래 첨부 파일을 다운 받으시기 바랍니다. 1. 표본 크기에 대한.. 2021. 3. 22.
t-검정은 무엇인가? t-검정은 무엇인가? 안녕하세요. Career hacker입니다. 첫 게시글이네요. 오늘은 T-검정에 대해 알아보겠습니다. 개념은 매우 간단합니다. 한 집단의 평균과 다른 집단의 평균 또는 특정 상수 값이 서로 같은지(다른지)를 통계적으로 검정하는 방법입니다. 1. 언제 쓰는가? t-검정은 평균 비교에 널리 쓰이는 검정방법입니다. 모형 관점으로 접근하면 t-검정은 범주형 독립변수와 수치형 종속변수를 갖는 모형 중 범주형 독립변수의 수준(level)이 2개 이하인 경우에 해당합니다. t-검정을 사용할 수 있는 문제 예시는 다음과 같습니다. 1) (일표본 t-검정) 임의 선정된 만 15세 남, 여 100명을 대상으로 성별에 따른 평균 키 차가 유의한 지 검정 나이가 만 15세인 남학생과 여학생 100명을 임.. 2021. 3. 22.
반응형