본문 바로가기
반응형

사회탐구방법4

썸네일 [사회통계/데이터과학] 4. 회귀분석과 결정계수 R², 추정값 β 환영합니다, Rolling Ress의 카루입니다.길게 설명하진 않을게요. 요점만 정리하겠습니다.​회귀분석이란 독립변수와 종립변수의 관계를 밝히는 것입니다. 단순히 "관계가 있다!"로 끝나는 게 아니에요. 그럴 거면 그냥 상관분석(-> [-1, 1]) 쓰면 되죠. 회귀분석은, 무엇이 원인이고 무엇이 결과이며, 정확히 어떤 관계가 있는지 분석합니다.자, 이런 데이터가 있다고 생각해봅시다. 어차피 회귀분석은 독립변수와 종속변수가 모두 양적자료(연속형 변수)일 때 수행하기 때문에 그냥 수학적으로 접근하는 게 편합니다. 이름은 적당히 붙이세요. 가령 x축을 키, y축을 몸무게라고 보든가. 좌표축에 써진 숫자는 무시해도 좋아요.​여튼, 회귀분석은 이들의 관계를 수학적으로 분석하는 겁니다. 쉽게 말해서, 임의의 독립.. 2022. 4. 20.
썸네일 [사회통계/데이터과학] 3. 정규분포곡선의 표준화 (feat. 미적분) 환영합니다, Rolling Ress의 카루입니다.​ 사실 3~8반은 문제 될 게 없어요. 거긴 다 확통이니까. 근데 1반은 미적+사탐방이 꽤 있죠. 사실... 정규분포 곡선 나오는 게 확통에서 나오는 거라 이거 모르면 좀 애를 먹겠더라고요. 그래서, 간단하게나마 설명을 하려고 합니다. 확통을 배우는 게 아니니까, 설명은 미적분을 중심으로 해볼게요.​이 글은 미적분 & 사회탐구방법 수강생들을 위한 글입니다. 확통 하시는 분들은 아마 다 아는 내용일 거예요.​ 정규분포곡선은 이런 식으로 나타낼 수 있습니다. 여기서 μ는 평균, σ는 표준편차를 뜻합니다. 표준편차는 중학교 때 산포도 배웠으니 아마 알고 계시리라 믿습니다. 자료가 퍼진 정도, 정규분포곡선에서는 그래프가 퍼진 정도를 결정합니다. 평균은 아시죠. .. 2022. 4. 20.
썸네일 [사회통계/데이터과학] 2. 표본과 가설검정, p-value와 정규분포 환영합니다, Rolling Ress의 카루입니다.​전수조사는 정확합니다. 그러나 시간과 비용이 많이 들죠. 단적인 예로, 여론조사 하자고 우리나라 국민 전부를 조사할 수는 없는 일입니다. 그래서, 우리나라 국민들을 **무작위 추출하여 표본을 만들고, 이 표본을 분석하여 우리나라 국민 전체(모집단)에 적용하고자 합니다.​**고등학교 교육과정에서는 무작위 추출만 알고 있어도 됩니다. 표본을 추출하는 방법은 많은데(층화추출, 군집추출, ...), 알 필요는 없어요. 물론 사회조사분석사를 준비한다면 표본 추출 방법들을 모두 알고 있어야 합니다.​ 중심 극한의 정리에 의해, 모집단의 분포와 상관 없이 표본 평균은 정규 분포를 이룹니다. 모집단의 분포에 상관 없이, 표본평균의 분포가 정규분포로 수렴하므로 z값을 통.. 2022. 4. 19.
썸네일 [사회통계/데이터과학] 1. 정규분포곡선의 의미와 해석 환영합니다, Rolling Ress의 카루입니다.​오늘은 사회탐구방법 과목에서 주구장창 쓰이는 곡선인 정규분포곡선에 대해 알아볼 겁니다. 사실 이것 자체는 크게 중요하지 않은데, 몇 가지 중요한 성질들이 있어요.​**생소한 수학 기호가 많을 수 있습니다. 특히 저 함수식은 몰라도 됩니다. 그래프만 보고 넘어가세요. 식은 이해를 돕기 위한 참고용입니다. 표준정규분포곡선을 그려보겠습니다. 식은 아래와 같아요.​편의상 곡선을 f(x)로 잡았습니다. 참고로, 표준정규분포는 다루기 쉬워요. 이거 전체 적분하면 1 나옵니다. 면적 따질 때 이상한 문자 넣을 필요 없이 전체 면적을 1로 잡고 하겠습니다.​그 다음, 평균과 표준편차가 중요합니다. 각각 μ(뮤)와 σ(시그마)로 나타냅니다. 평균은 이 곡선의 중심을 뜻해.. 2022. 4. 19.
반응형