본문 바로가기
반응형

사회탐구방법4

썸네일 [사탐방/데이터과학] 4. 회귀분석과 결정계수 R², 추정값 β 환영합니다, Rolling Ress의 카루입니다. 길게 설명하진 않을게요. 요점만 정리하겠습니다. ​ 회귀분석이란 독립변수와 종립변수의 관계를 밝히는 것입니다. 단순히 "관계가 있다!"로 끝나는 게 아니에요. 그럴 거면 그냥 상관분석(-> [-1, 1]) 쓰면 되죠. 회귀분석은, 무엇이 원인이고 무엇이 결과이며, 정확히 어떤 관계가 있는지 분석합니다. 자, 이런 데이터가 있다고 생각해봅시다. 어차피 회귀분석은 독립변수와 종속변수가 모두 양적자료(연속형 변수)일 때 수행하기 때문에 그냥 수학적으로 접근하는 게 편합니다. 이름은 적당히 붙이세요. 가령 x축을 키, y축을 몸무게라고 보든가. 좌표축에 써진 숫자는 무시해도 좋아요. ​ 여튼, 회귀분석은 이들의 관계를 수학적으로 분석하는 겁니다. 쉽게 말해서, .. 2022. 4. 20.
썸네일 [사탐방/데이터사이언스] 3. 정규분포곡선의 표준화 (feat. 미적분) 환영합니다, Rolling Ress의 카루입니다. ​ 사실 3~8반은 문제 될 게 없어요. 거긴 다 확통이니까. 근데 1반은 미적+사탐방이 꽤 있죠. 사실... 정규분포 곡선 나오는 게 확통에서 나오는 거라 이거 모르면 좀 애를 먹겠더라고요. 그래서, 간단하게나마 설명을 하려고 합니다. 확통을 배우는 게 아니니까, 설명은 미적분을 중심으로 해볼게요. ​ 이 글은 미적분 & 사회탐구방법 수강생들을 위한 글입니다. 확통 하시는 분들은 아마 다 아는 내용일 거예요. ​ 정규분포곡선은 이런 식으로 나타낼 수 있습니다. 여기서 μ는 평균, σ는 표준편차를 뜻합니다. 표준편차는 중학교 때 산포도 배웠으니 아마 알고 계시리라 믿습니다. 자료가 퍼진 정도, 정규분포곡선에서는 그래프가 퍼진 정도를 결정합니다. 평균은 아.. 2022. 4. 20.
썸네일 [사탐방/데이터사이언스] 2. 표본과 가설검정, p-value와 정규분포 환영합니다, Rolling Ress의 카루입니다. ​ 전수조사는 정확합니다. 그러나 시간과 비용이 많이 들죠. 단적인 예로, 여론조사 하자고 우리나라 국민 전부를 조사할 수는 없는 일입니다. 그래서, 우리나라 국민들을 **무작위 추출하여 표본을 만들고, 이 표본을 분석하여 우리나라 국민 전체(모집단)에 적용하고자 합니다. ​ **고등학교 교육과정에서는 무작위 추출만 알고 있어도 됩니다. 표본을 추출하는 방법은 많은데, 알 필요는 없어요. ​ 중심 극한의 정리에 의해, 모집단의 분포와 상관 없이 표본 평균은 정규 분포를 이룹니다. 모집단의 분포에 상관 없이, 표본평균의 분포가 정규분포로 수렴하므로 z값을 통해 확률을 구할 수 있는 거죠. 이걸로 네이만-피어슨 가설 검정을 할 수 있게 됩니다. ​ 상자에 귤.. 2022. 4. 19.
썸네일 [사탐방/데이터사이언스] 1. 정규분포곡선의 의미와 해석 환영합니다, Rolling Ress의 카루입니다. ​ 우리 학교 교육과정 중에 제가 좀 마음에 들지 않아하는 부분인데, 미적분이랑 확률과통계가 선택이죠. 사실 이게 예전에는 경제수학(미적분 내용)/영미 문학 읽기로 분화가 되어 선택권이 넓었으나, 지금은 미적러가 확통 수업을 들을 수 없습니다..ㅋㅋㅋㅋㅋ 그래서 저는 방학 때 통계 관련 공부를 따로 했어요. ​ 자, 잡소리 그만 하고 시작하죠. 오늘은 사회탐구방법 과목에서 주구장창 쓰이는 곡선인 정규분포곡선에 대해 알아볼 겁니다. 사실 이것 자체는 크게 중요하지 않은데, 몇 가지 중요한 성질들이 있어요. ​ **생소한 수학 기호가 많을 수 있습니다. 특히 저 함수식은 몰라도 됩니다. 그래프만 보고 넘어가세요. 식은 이해를 돕기 위한 참고용입니다. 표준정규.. 2022. 4. 19.
반응형