본문 바로가기
반응형

통계공부2

[CONNIE'S] 서울시 대기환경 정보 데이터를 사용한 상관계수(Correlation Coefficient) 개념 정리 안녕하세요! CONNIE 입니다. 이번에는 실제 데이터로 상관계수 개념을 공부해보면 어떨까 해서 서울시의 대기환경 정보를 가져왔어요. 미세먼지, 초미세먼지 농도는 한국의 포털 사이트 메인에 항상 나와있을 정도로, 우리가 거의 매일 확인하는 수치들이죠. 본격적으로 데이터 실습을 하기 앞서 우리가 배운 상관계수가 어떤 것이었는지 이론을 살짝 살펴보도록 하겠습니다! Correlation Coefficient (상관계수) 상관계수란 두 변수 간의 선형(선형이라는 게 중요했어요!💃🕺) 상관관계를 수치로 표현해주는 값입니다. Scatter Plot(산점도)를 통해 두 변수 간의 관련성을 시각적으로 파악할 수 있다면, 상관계수란 이를 수치로 표현해주는 값이라 할 수 있습니다. 위키디피아의 정의는 다음과 같이 나와있습.. 2021. 3. 9.
[CONNIE'S] 통린이의 통계공부 시작하기 들어가며 통계 공부를 시작해보려 합니다. 한국의 평범한 인문계 고등학교 졸업 후, 모 대학의 경영학과에 진학해 경영/마케팅 수업을 들으며 대학생활을 마쳤습니다. 학교 졸업 후, 수학과는 담을 쌓고 지냈는데 어찌어찌 직장생활을 하다 보니 Data Analyst로 이직하고 싶다는 생각을 하게 되었습니다. 글쎄요... 통계학 전공도 아니고, 하물며 대학원 석사과정도 밟지 않은 제가 Analyst로 이직하는 것이 가능할까요? 아직은 모르겠습니다. 그렇지만, 분명 지금까지 일하며 제가 일하며 접해왔던 산업들과 비지니스, 그리고 Data Anlyst로 할 수 있는 업무들의 맞닿는 지점이 있으리라 생각해요. 일상의 사소한 것에도 통계가 녹아있다고 하죠. 하물며 비즈니스를 하는 어떤 산업군에도 데이터 분석 업무가 불필.. 2021. 2. 4.
반응형