본문 바로가기

슬기로운통계생활9

메트로폴리스-해스팅스(Metropolis-Hastings) 난수추출 알고리즘에 대하여 이번 포스팅에서는 베이지안 통계에서 많이 사용되는 알고리즘인 Metropolis-Hastings(이하 MH) 알고리즘에 대하여 간단히 알아보고자 한다. MH 알고리즘은 마르코프 체인 몬테칼로(Markov Chain Monte Carlo) 방법 중 하나로, MH 알고리즘을 사용하여 타겟 분포를 정상분포(stationary distribution)로 갖는 마코브 체인을 발생시킬수 있기 때문이다. 이렇게 발생시킨 체인은 타켓 분포에서 발생시킨 상관성이 존재하는 표본으로 생각할 수 있는데, 이 표본들을 가지고 몬테칼로 방법을 적용하게 된다. 이러한 전반적인 과정을 머리속에 생각하면서, 오늘은 우리가 생각하는 특정 분포을 정상분포로 갖는 체인을 발생시키는 방법에 대하여 알아보자. Metropolis-Hasting.. 2022. 5. 9.

5강. 데이터 프레임 가지고 놀기 학습목표 오늘은 R 데이터 분석 환경에서 가장 많이 쓰이는 객체인 데이터 프레임을 가지고 놀아보는 시간을 갖도록 하겠습니다. 가장 많이 쓰인다는 말을 앞으로 계속 마주치게 될 녀석이라는 이야기겠죠? 그러니까 꼭 정확하게 알아두셔야 합니다.ㅎㅎ 늘 말씀드리지만, 처음 배울때 잘 배우셔야 오래갑니다. 정신 집중하시고, 고고! 데이터 프레임 만들기 원소 접근 방법 학습 데이터 프레임 인덱싱 NA를 처리하는 방법 구성원소 추가/삭제/변경 subset() 함수 aggregate() 함수 배울 게 많군요! 차근차근 따라와주세요. 여러분 그거 아세요? 오늘 잘 배운 함수, 내일 직장에서의 10분을 절약해 줌. 강의영상 아래 쪽에 강의안 첨부합니다. 다운받으시고 강의 들어주세요. 그럼 R공부를 슬기롭게! 같이 공부해보.. 2021. 10. 9.

4강. R 리스트 완전 정복하기 학습목표 이번 강의의 목표는 R 리스트를 완전 정복하는게 목표입니다.ㅋㅋ R에서 리스트는 상당히 특별한 존재입니다. 왜냐하면 다른 여러 객체들을 한꺼번에 다 담을 수 있거든요! 리스트 만들기 벡터 vs. 리스트 리스트 인덱싱 재귀 리스트 리스트에 함수 적용하기 lapply()와 sapply() 어느 언어나 마찬가지입니다. 처음에 잘 이해하고, 반복해서 사용해야합니다. 강의 영상 및 강의안 아래 쪽에 강의안 첨부합니다. 다운받으시고 강의 들어주세요. 그럼 R공부를 슬기롭게! 같이 공부해보시쥬! 2021. 10. 9.

5강. 딥러닝 신경망의 구조 - 순전파 (Forward propagation) 이해하기 이제 처음으로 딥러닝의 밑바닥을 이루는 인공 신경망의 구조를 이해하는 시간이다. 앞으로 우리가 다룰 수많은 신경망 모델의 기반을 이루는 내용이므로, 정말 많은 시간을 투자해서 이해해두기 바란다. 투자한 시간에 비례하여, 추후에 복잡한 모델을 학습하는 시간을 단축시켜 줄 것이라 장담한다. 딥러닝의 시작점인 신경망(Neural network)을 공부하기 위해서, 앞으로 우리가 다룰 모델 중 가장 간단하면서, 딥러닝에서 어떤 일이 벌어지고 있는지 상상이 가능한 신경망을 먼저 학습하기로 하자. 우리가 오늘 예로 생각할 신경망은 다음과 같다. 위의 그림과 같은 신경망을 2단 신경망이라고 부른다. 일반적으로 단수를 셀 때 제일 처음 입력하는 층은 단수에 포함하지 않는 것에 주의하자. 각 녹색, 회색, 그리고 빨간색.. 2021. 10. 4.

세상에서 가장 친절한 MLE 강의 시리즈. 1강 - 개념이해 슬기로운통계생활에서 유료멤버십을 개설했다. 슬통갱들에게 보답하고자, 최대우도 추정량 (Maximum Likelihood Estimator) 강의를 시작했다. 확률변수가 무엇인지, 확률밀도함수와 확률질량함수에 대한 개념정도 안다는 전제하에 거의 기초에서부터 시작하는 것으로 통계적 추론에 대한 지식이 거의 전무하다는 것을 전제로 강의한다. 기초부터 시작해서 통계학과 학부 3,4학년 혹은 타 학과 석사 1학년 수준까지 정복하는 것으로 목표을 잡았다. 수업에서 다루는 내용들은 어지간한 곳에서는 들을 수 없는 수준이라고 장담한다. 필자는 수학이나 통계에서 가장 중요한 것은 기호를 어떻게 쓰는지 확실하게 알려줘야하고, 명확하게 설명해야한다고 생각해서 가장 처음에는 기호 설명부터 진행했다. 다행히 멤버십 분들이 재미.. 2021. 9. 25.

[CONNIE'S] 코세라 통계적 추론 강의 수강 후 통계 기초 개념 정리! 이전에 Coursera에서 Statistical Inference(통계적추론) 수업을 들으면서, 완강 후에 수업에 나오는 개념들에 대해 다시 공부해봐야겠다고 생각했어요. 그래서 수강했던 수업을 훑어보며 이제까지 배웠던 통계학의 기본 개념들을 정리하는 시간을 가져보기로 하였습니다. 👩‍💻 통계적 추론 (Statistical Inference) 통계학을 이용하여 모집단(population) 내에서 추출한 표본(sample)을 통해 모수(parameter)를 추론하는 과정. 모집단에 대한 추론을 100% 확신하기 위해서는 모집단 전체를 표본으로 조사해야 하지만, 경제성 또는 시간, 양적 접근의 한계 등의 이유로 불가능한 경우가 많기 때문에 표본에서 얻은 정보를 통해 추론한다. Statistical Infere.. 2021. 2. 10.

[PoliscieR] 작업환경 구축하기 (feat. Project TIER) 2월 말부터 3월 초-중까지 바쁘게 달려야 하는 일정이 있어서 아마 주에 하나 정도씩 글을 올리게 될 것 같습니다. 앞서 STATA 혹은 R로 했던 연구들을 재현하면서 전처리와 분석, 그리고 시각화를 중심으로 포스팅할 계획이라고 밝힌 바 있습니다. 그런데 생각해보니 그에 앞서 먼저 짚고 넘어가야 될 내용이 있는 것 같아서 오늘의 주제는 "작업환경 구축하기"로 잡았습니다. 경험 상 첫 발을 내딛을 때, 잘 내디뎌야 다음 단계로 넘어가기가 수월합니다. 연구가 다 마무리되고 난 뒤에도 재현 가능한 결과들을 위한 정리도 수월하구요. 이번 포스팅은 제 블로그에 있는 Project TIER (Teaching Integrity in Empirical Research) 라는 포스팅에 바탕을 두고 있습니다. 해당 포스팅.. 2021. 2. 7.

[PoliscieR] 정치학과에서 R로 연구하기 정치학과에서 다시 숫자를, 그리고 프로그래밍을 하게 될 줄은... 안녕하세요, 이 게시판은 R meets Political Science라는 이름 그대로 정치학 분야에서 R을 활용해서 정량적인 연구를 하며 제가 겪었던 여러 경험들(대부분이 시행착오겠죠?)과 그 결과로 현재 주로 사용하는 분석 방법과 기법들을 정리하는 데 목적이 있습니다. 간단하게 제 경험을 이야기하자면 (아마 일반화되기는 힘든 경험이겠지만), 저는 한국외국어대학교 정치외교학과에서 석사까지 마무리하고 현재 미국의 University of South Carolina 정치학과에 박사과정에 입학했습니다. 그런데 사실 한국외국어대학교 정치외교학과에 들어가게 된 계기, 정확히는 외대에 진학하게 된 계기 중 하나는 바로 제가 수학을 엄청 싫어한다는 .. 2021. 1. 31.

확률변수 (random variable)를 만들어 보자. 예제 코드 magic_box 2020. 8. 1.

이전 1 다음

티스토리툴바