본문 바로가기
반응형

분류 전체보기80

0강. 빅데이터 분석의 시작 - R 4.1.0, RStudio, Rtools4.0 설치방법 데이터 사이언스 기본 툴인 R을 설치하 방법을 다룹니다. R의 버전이 4.1.0으로 업데이트되면서 Rtools도 4.0 버전을 같이 설치해야 온전하게 사용할 수 있게 되었습니다. 따라서 RStudio와 R, Rtools 세 가지 프로그램을 한꺼번에 저와 똑같이 설치하는 것이 필요합니다. 추가적으로 RStudio를 간지 나게 바꿔줄 테마와 Fira code 역시 같이 설정해줍시다. 0강. 준비과정 먼저 강의안을 다운 받고 시작합시다~! 참고로 Rtools의 경우 맥 사용자는 설치하지 않아도 됩니다. Windows를 OS로 사용하는 사용자들만 설치하면 된다는 점 유의하세요! 그럼 즐강. :) 2021. 9. 30.
넷플릭스 DP에 나온 몬티홀 문제와 베이즈 정리에 대한 완벽 정리.zip 요즘 넷플릭스의 D.P. 드라마가 아주 핫하다. 개인적으로 군대의 기억이 새록새록나서 너무 재미있게 봤다. (아.. 이제는 지나가버린 잊고싶은 시간들...ㅠㅠㅠㅋㅋㅋ) 그렇게 재미있게 드라마를 보던 나에게 호기심을 자극했던 에피소드가 있었으니, 바로 4편의 허치도 병장이 나오는 몬티홀 게임에 대한 역설이었다. 정해인이 연기했던 안준호 이병! 구교환이 연기했던 구교환 상병(연기 무엇..? 개인적으로 너무 "호"인 배우ㅋㅋ)도 풀지 못해서 끙끙거렸던 몬티홀 문제를 한번 풀어보자. 참고로, 몬티홀 문제는 여러가지 이름으로 불리는데, 몬티홀의 역설, 몬티홀의 딜레마 이런 것들이 결국 하나의 문제를 이야기하는 것이다. 영상 보기전 아래쪽 강의안 다운받아 보면 좋을 것이다. 참고로 영상의 R코드는 아래쪽에 있다. .. 2021. 9. 27.
[be-favorite] #3 R 과 Python를 고민하는 당신에게 (feat. 데싸 선배의 조언) 오랜만에 인사드립니다.🤗 올해 2월에 대학원을 졸업 후, 3월부터 바로 연구원으로 업무를 시작하느라 이를 핑계로 개인 블로그, 객원 칼럼에 손을 놓고 있었네요. #2 글을 쓴지 어언 반년이 넘었군요. 잘 만든 핑계는 사람을 이렇게나 나태하게 만듭니다..😅 오랜만에 인사드리는 칼럼에 Data Science 분야에서 매우 자극적으로 여겨지는 타이틀을 가져왔습니다. 본 칼럼에서는 다행히 두 언어 중 어떤 언어가 더 우월한가를 논하진 않습니다. Data Science 분야에 관심을 두고 시작하는 단계에서 두 언어 중 어떤 언어를 익혀야 할지 그 기로에서 고민하고 있는 분들, 그리고 둘 중 한 언어를 익히고 있으나 나머지 한 언어에 대한 막연한 불안감이 있는 분들께 권하고 싶은 글입니다. 무의미한 논쟁 우선 본 .. 2021. 9. 25.
세상에서 가장 친절한 MLE 강의 시리즈. 1강 - 개념이해 슬기로운통계생활에서 유료멤버십을 개설했다. 슬통갱들에게 보답하고자, 최대우도 추정량 (Maximum Likelihood Estimator) 강의를 시작했다. 확률변수가 무엇인지, 확률밀도함수와 확률질량함수에 대한 개념정도 안다는 전제하에 거의 기초에서부터 시작하는 것으로 통계적 추론에 대한 지식이 거의 전무하다는 것을 전제로 강의한다. 기초부터 시작해서 통계학과 학부 3,4학년 혹은 타 학과 석사 1학년 수준까지 정복하는 것으로 목표을 잡았다. 수업에서 다루는 내용들은 어지간한 곳에서는 들을 수 없는 수준이라고 장담한다. 필자는 수학이나 통계에서 가장 중요한 것은 기호를 어떻게 쓰는지 확실하게 알려줘야하고, 명확하게 설명해야한다고 생각해서 가장 처음에는 기호 설명부터 진행했다. 다행히 멤버십 분들이 재미.. 2021. 9. 25.
R 프로그래밍 무료 기초 강의 안내 안녕하세요, 슬기로운 통계생활에서 첫 정규 커리큘럼으로 시작한 기초 R 강의를 시작했습니다. 슬통 유튜브에서 매주 목요일 밤 10시에 라이브로 진행 할 예정입니다. R을 처음 배우시는 분들, 데이터 분석 공부를 이제 막 시작하시는 분들께 적극 추천드립니다. 정말 아무것도 모른다는 전제 하에 프로그램 설치에서부터 R의 고급 함수들까지 자연스럽게 공부할 수 있도록 수업이 디자인 되어 있습니다. 유료 강의보다 더 유료 강의 같은 강의 무료 R 강의이지만 흔히 생각하시는 무료 강의가 아닙니다. 추후 기업 강의용으로 내용을 준비한 강의입니다. 많이들 생각하시는 얕은 입문 강의라고 생각하시면 안 됩니다.ㅋㅋ 기초부터 차근차근 다진다는 생각으로 맘 다잡고 따라오세요~! 완강하셨을 때 머리속에 R 지식들로 꽉 차있게 .. 2021. 9. 4.
[CONNIE'S] 서울시 대기환경 정보 데이터를 사용한 상관계수(Correlation Coefficient) 개념 정리 안녕하세요! CONNIE 입니다. 이번에는 실제 데이터로 상관계수 개념을 공부해보면 어떨까 해서 서울시의 대기환경 정보를 가져왔어요. 미세먼지, 초미세먼지 농도는 한국의 포털 사이트 메인에 항상 나와있을 정도로, 우리가 거의 매일 확인하는 수치들이죠. 본격적으로 데이터 실습을 하기 앞서 우리가 배운 상관계수가 어떤 것이었는지 이론을 살짝 살펴보도록 하겠습니다! Correlation Coefficient (상관계수) 상관계수란 두 변수 간의 선형(선형이라는 게 중요했어요!💃🕺) 상관관계를 수치로 표현해주는 값입니다. Scatter Plot(산점도)를 통해 두 변수 간의 관련성을 시각적으로 파악할 수 있다면, 상관계수란 이를 수치로 표현해주는 값이라 할 수 있습니다. 위키디피아의 정의는 다음과 같이 나와있습.. 2021. 3. 9.
[be-favorite] #2 데이터 과학자를 꿈꾸는 당신이 수리통계학을 대하는 방법 지난 번 글 #1에서는 대학원 진학 전에 품었던 고민에 대해 풀어보았습니다. 대학원에 입학하기로 결정이 난 후, 3월 개강 전 겨울방학에 지도교수님께 첫 번째로 받은 과제는 바로 "수리통계학"이었습니다. 지도교수님께서는 본격적인 대학원 3월 개강 이전에 수리통계학에 대한 전반적인 이해를 바라셨습니다. 그래서, 이번 글은 다음의 두 주제에 대하여 이야기 해보려 합니다. 우리가 수리통계학을 공부해야 하는 이유 어떻게 수리통계학을 공부하는 것이 좋을까? 통계학 석사 졸업생에 불과한 제가 수리통계학 공부 방향에 대해 글로 풀어내는 것이 건방진 행위라고 생각이 들기도 하지만..😅 개인적인 의견이라 생각하시고 너그러이 읽어주세요. 그리고, 이 글을 쓰는 이유는 수리통계학이라는 과목을 대부분의 통계학 전공생들이 어려.. 2021. 3. 1.
파이썬에서 형태소 분석 후 R로 넘겨주기 - 자연어 처리 고수되기 1탄 자연어 처리 슬기로운통계생활에서는 R을 중심으로 여러 멤버들이 칼럼을 작성 중입니다. 그런데 '왜 갑자기 Python 이야기인가' 궁금해할 분들이 많을 것입니다. 여기서 Python을 언급한 이유는 자연어 처리(Natural language processing)에서 가장 중요한 과정인 형태소 분석(Morphological analysis) 때문입니다. 잠시 자연어 처리를 이야기하자면 컴퓨터에게 인간의 언어를 이해시키려면 인간의 언어(자연어)를 컴퓨터가 이해할 수 있는 형태로 변환하는 과정이 필수적입니다. 예컨대 인공지능 스피커에게 우리가 말을 하면, 인공지능 스피커는 우리가 한 말을 통으로 인식할 수 없습니다. 알고리즘에 따라 다르겠지만, 인간이 말한 문장을 부분부분 끊어서(분절화) 인식합니다. 왜냐하면.. 2021. 2. 23.
[CONNIE'S] 베이즈 정리(Bayes' rule) 완벽히 정리하기 오늘은 조건부 확률의 개념과 베이즈 정리에 대한 글을 써보려 합니다. 베이즈 정리는 사전 확률과 사후 확률의 관계를 조건부 확률의 개념을 통해 풀어낸 정리입니다. 기존에 베이즈 정리에 대한 설명과 수식만을 보고 이해가 잘 안갔던 점들을 오늘은 재미있는 영상과 예제를 소개하며, 다시 한 번 개념에 대해 이해해볼까 합니다. Conditional Probability (조건부 확률) 사전적 정의: 주어진 사건이 일어났다는 가정 하에 다른 한 사건이 일어날 확률을 뜻합니다. 원래의 확률 함수는 P라 할 때, 사건 B가 일어났다는 가정 하에 사건 A가 일어날 조건부 확률은 $P(A|B)$로 표기합니다. $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$ 예제로 알아보기 - 주사위 굴리기 주사위를 .. 2021. 2. 17.
[CONNIE'S] 코세라 통계적 추론 강의 수강 후 통계 기초 개념 정리! 이전에 Coursera에서 Statistical Inference(통계적추론) 수업을 들으면서, 완강 후에 수업에 나오는 개념들에 대해 다시 공부해봐야겠다고 생각했어요. 그래서 수강했던 수업을 훑어보며 이제까지 배웠던 통계학의 기본 개념들을 정리하는 시간을 가져보기로 하였습니다. 👩‍💻 통계적 추론 (Statistical Inference) 통계학을 이용하여 모집단(population) 내에서 추출한 표본(sample)을 통해 모수(parameter)를 추론하는 과정. 모집단에 대한 추론을 100% 확신하기 위해서는 모집단 전체를 표본으로 조사해야 하지만, 경제성 또는 시간, 양적 접근의 한계 등의 이유로 불가능한 경우가 많기 때문에 표본에서 얻은 정보를 통해 추론한다. Statistical Infere.. 2021. 2. 10.
[PoliscieR] 작업환경 구축하기 (feat. Project TIER) 2월 말부터 3월 초-중까지 바쁘게 달려야 하는 일정이 있어서 아마 주에 하나 정도씩 글을 올리게 될 것 같습니다. 앞서 STATA 혹은 R로 했던 연구들을 재현하면서 전처리와 분석, 그리고 시각화를 중심으로 포스팅할 계획이라고 밝힌 바 있습니다. 그런데 생각해보니 그에 앞서 먼저 짚고 넘어가야 될 내용이 있는 것 같아서 오늘의 주제는 "작업환경 구축하기"로 잡았습니다. 경험 상 첫 발을 내딛을 때, 잘 내디뎌야 다음 단계로 넘어가기가 수월합니다. 연구가 다 마무리되고 난 뒤에도 재현 가능한 결과들을 위한 정리도 수월하구요. 이번 포스팅은 제 블로그에 있는 Project TIER (Teaching Integrity in Empirical Research) 라는 포스팅에 바탕을 두고 있습니다. 해당 포스팅.. 2021. 2. 7.
[CONNIE'S] 통린이의 통계공부 시작하기 들어가며 통계 공부를 시작해보려 합니다. 한국의 평범한 인문계 고등학교 졸업 후, 모 대학의 경영학과에 진학해 경영/마케팅 수업을 들으며 대학생활을 마쳤습니다. 학교 졸업 후, 수학과는 담을 쌓고 지냈는데 어찌어찌 직장생활을 하다 보니 Data Analyst로 이직하고 싶다는 생각을 하게 되었습니다. 글쎄요... 통계학 전공도 아니고, 하물며 대학원 석사과정도 밟지 않은 제가 Analyst로 이직하는 것이 가능할까요? 아직은 모르겠습니다. 그렇지만, 분명 지금까지 일하며 제가 일하며 접해왔던 산업들과 비지니스, 그리고 Data Anlyst로 할 수 있는 업무들의 맞닿는 지점이 있으리라 생각해요. 일상의 사소한 것에도 통계가 녹아있다고 하죠. 하물며 비즈니스를 하는 어떤 산업군에도 데이터 분석 업무가 불필.. 2021. 2. 4.
반응형