본문 바로가기
반응형

분류 전체보기80

Rmd 파일 저장할 때 knit하기 저장용 knit 할 때 저장할 때 knit되게 하는 함수 저장용 pdf_watch 2022. 1. 26.
[be-favorite] #5 중심극한정리에 관한 고찰 오늘 나른한 일요일 오후에 R distill 패키지로 블로그를 구축하려고 갔던 별다방에서, 중심극한정리에 대해 다시 생각해보게 되었습니다. 결국, 블로그 구축은 하나도 못하고 말이죠.😂 그래서, 어떤 것들을 고찰했는지 주저리주저리 떠들어 보겠습니다. 중심극한정리에 대한 고찰 수식 다음은 중심극한정리(Central Limit Theorem, CLT)를 표현할 때, 통계학에서 일반적으로 선호하는 아름다운 수식 한 줄입니다: \begin{align} \sqrt{n} ({\bar{X}}_n - \mu) \ \ \overset{d}{\longrightarrow} \ N(0, \sigma^2) \end{align} 여기서 $\overset{d}{\longrightarrow}$는 분포 수렴(convergence in.. 2022. 1. 23.
gganimate 패키지로 신년 메세지 동영상만들기 새로운 새해가 밝았습니다. 22년 호랑이의 기운이 솟아나는 힘찬 한해가 되었으면 좋겠습니다! 오늘 만들어본 것은 이제까지 tidyverse 마스터클래스에서 배웠던 gganimate과 ggplot font를 사용해서 신년 축하 동영상을 만들어 보았습니다. 영상의 기본틀을 이루는 코드는 gganimate 패키지 제작자의 불꽃놀이 코드에서 훔쳐왔습니다. 저는 불꽃이 터지는 위치와 메세지가 겹치지 않도록 살짝 숟가락만 얹었습니다.ㅋㅋ 원본 코드가 들어있는 포스트는 다음과 같습니다. https://www.data-imaginist.com/2019/gganimate-has-transitioned-to-a-state-of-release/ gganimate has transitioned to a state of rel.. 2022. 1. 2.
ggmap을 이용한 지도 시각화 오늘은 ggmap을 이용한 데이터의 정보를 지도에 시각화하는 방법을 알아보도록 하겠습니다. 최종 결과물은 아래에 보이는 것처럼 유럽지역의 특정 국가 위치에 빨간색 투명점을 나라별 GDP에 따라 크기를 다르게 찍어보도록 하겠습니다! 구글맵 API를 발급 받아 ggmap에 연결시킵니다. 구글맵 API를 발급받기 위해서 구글맵 개발자 페이지에 방문합니다. 구글맵 API 발급받기 https://mapsplatform.google.com/ Google Maps Platform - Location and Mapping Solutions Create real world and real time experiences for your customers with dynamic maps, routes & places API.. 2022. 1. 1.
[be-favorite] #4 데이터 분석가를 꿈꾸는 그대에게 - 취업준비 우선순위 또 한 번 오랜만에 인사드립니다.😂 글을 매달 하나씩은 써보려고 했으나, 어느덧 2021년이 저물어가고 있군요. 퇴근하고 방에 앉아서 문득 어떤 생각이 떠올라서 글을 끄적이다가, 결국 이렇게 슬통 블로그를 켜고 다음 글로 쓰려고 생각해뒀던 주제와는 다른 글을 작성하고 있습니다. 저는 남들보다 이해력이 뛰어난 똑똑한 사람이 아닌 지극히 평범한 사람이어서, 학부 4학년 무렵부터 대학원을 졸업할 때까지 데이터 과학자, 데이터 분석가 (Data Scientist, Data Analyst)로써 직장을 구하기 위해서는 어떤 것들을 우선순위로 두고 준비를 해야 할 것인가에 대해 늘 고민해왔는데요. 아시다시피, 데이터 과학자 또는 데이터 분석가로 직장을 구하기 위해 준비해야 하는 것들은 한두 개가 아닙니다.😭 타고난 .. 2021. 12. 23.
ggplot2 사용시 invalid graphics state 오류 해결방법 위와 같은 오류를 ggplot2을 사용하면서 아래와 같은 오류를 보았는가? Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)) : invalid graphics state 이것때문에 들어왔다면 해결방법은 간단하다. 다음과 같은 코드를 돌려주고 다시 실행하여 된다. dev.off() 이러한 해결방법이 작동하는 이유는 이전에 기본 plot() 함수를 사용해서 그래프 팔렛트를 조정했을 가능성이 크다. 그 후에 다시 팔레트를 리셋해줘야 하는데, 팔렛트 리셋 명령어가 바로 dev.off() 명령어 임. 😎👍 2021. 11. 24.
10강. CNN 모델을 사용한 다중 분류 모델 구현하기 이전 포스트에서는 로지스틱 회귀모형을 사용하여 분류를 하는 문제를 다루었다. 이번 시간에는 좀 더 복잡한 분류 문제를 CNN(Convolutioinal Neural Network) 모델을 사용하여 해결하는 방법에 대하여 학습해보자. 예제 데이터 딥러닝에서 가장 유명한 데이터는 바로 MNIST 데이터이다. 딥러닝을 시작할 때 가장 많이 등장하는 signiture 느낌의 데이터 셋이므로 꼭 알고 있어야하는 데이터셋 중 하나이다. 캐글에서도 이 데이터를 사용하여 튜토리얼 대회를 열어놓았다. 본 포스팅은 캐글 튜토리얼 대회의 자료를 그대로 사용한다. MNIST 데이터는 손글씨 숫자 이미지 데이터라고 생각하면 된다. 데이터 셋에는 무작위로 0에서부터 9까지의 숫자가 손글씨 이미지 형태로 저장되어있다. 대회에서는 .. 2021. 11. 22.
9강. Torch의 Dataset과 Dataloader 클래스에 대하여 이번 챕터에서는 실제 딥러닝을 사용하여 모델링을 할 때 사용될 데이터를 어떻게 torch에 넣을수 있는지에 대하여 알아보자. 이 과정에서 우리가 알아야하는 클래스가 두개가 있는데, 바로 Dataset 클래스와 Dataloader 클래스이다. 예제 데이터 언제나 그렇듯, 본 공략집은 예제를 통해서 설명하는 것을 선호한다. 이번 챕터에서는 가상의 학생들의 공부시간과 연습한 문제 갯수, 그리고 시험의 합격 여부에 대한 자료를 만들어보았다. 아래 그림에서 볼 수 있듯이 공부 시간과 연습한 문제 갯수에 따라서 두 그룹으로 비교적 잘 나뉘어져 있다는 것을 알 수 있다. library(torch) library(tidyverse) set.seed(2021) # 독립변수 발생 x1 2021. 11. 8.
8강. 첫 torch 신경망 학습하기 저번 시간 우리는 토치에서 신경망을 정의하는 방법에 대하여 알아보았다. 오늘은 정의한 신경망을 어떻게 학습하는가에 대하여 알아보도록 하자. 학습 준비 - 데이터 만들기 필자는 유튜브에 R을 사용한 통계 관련 수업들을 올려놓았다. 이 수업에서 큰 축을 이루는 것 중 하나가 바로 회귀분석이다. 회귀분석은 주어진 데이터를 모델링할 때 신경망의 가장 큰 장점은 회귀 직선과 같은 선형 모형들이 가지는 한계를 넘어서, 비선형 모델링을 할 수 있게 해 준다는 것이다. 이러한 장점들을 잘 확인해보기 위해서 비선형 모델에서 관찰 값을 뽑아 모의 데이터로 만들어 보도록 하자. library(tidyverse) # 재현 가능을 위한 시드 고정 set.seed(2021) # x 자리 임의 생성 x 2021. 11. 8.
7강. torch_nn 모듈로 첫 신경망 정의하기 이제까지 torch의 자동 미분(auto grad) 기능과 순전파(forward propagation)에 대하여 알아보았다. 오늘은 드디어, torch 라이브러리에서 제공하는 함수들을 이용해서 순전파 챕터에서 텐서로 일일이 정의했던 기본 신경망을 라이브러리 함수를 통하여 만들어 보도록 하자. 딥러닝 라이브러리에서 제공하는 코드를 통하여 신경망을 정의하는 코드가 어떻게 간단해지는지 느껴보았으면 한다. 신경망 정의 (Custom nn Modules) 토치를 사용해서 신경망을 정의할 때 사용하는 함수가 있다. 바로 nn_module()이라는 함수인데, torch에서 신경망을 정의할 때, 이 함수를 사용해서 “클래스”를 만들어 정의한다! 왜 우리가 챕터 @ref(r6)에서 R6관련 클래스 내용을 그렇게도 공부했.. 2021. 11. 8.
6강. 미분 자동추적 기능 (Autograd) 에 대하여 이번 장에서는 torch 및 다른 딥러닝 라이브러리의 근본을 이루는 기능인 미분 자동 추적 기능에 대하여 알아보도록 하자. 예를 들어 설명하는 것을 좋아하므로, 이번 챕터에 쓸 예제 함수를 먼저 정의하자. 예제 함수 \(n\)개의 데이터 \(x_1, ..., x_n\)이 주어졌다고 할 때, 우리는 다음의 함수 \(f\)를 정의 할 수 있다. \[ f(\mu) = \frac{1}{n}\sum_{i=1}^{n}(x_i - \mu)^2 \] 위의 함수는 다음과 같이 해석해 볼 수 있다. \(x\) 데이터에 담겨있는 정보를 단 하나의 지표 \(\mu\)로 압축해서 나타낸다고 할 때, 함수 \(f\)는 각 관찰값에 대한 오차들, \(x_i - \mu\),의 제곱의 평균을 나타낸다. 통계학에서는 나름 유명한 함수인.. 2021. 11. 8.
5강. 데이터 프레임 가지고 놀기 학습목표 오늘은 R 데이터 분석 환경에서 가장 많이 쓰이는 객체인 데이터 프레임을 가지고 놀아보는 시간을 갖도록 하겠습니다. 가장 많이 쓰인다는 말을 앞으로 계속 마주치게 될 녀석이라는 이야기겠죠? 그러니까 꼭 정확하게 알아두셔야 합니다.ㅎㅎ 늘 말씀드리지만, 처음 배울때 잘 배우셔야 오래갑니다. 정신 집중하시고, 고고! 데이터 프레임 만들기 원소 접근 방법 학습 데이터 프레임 인덱싱 NA를 처리하는 방법 구성원소 추가/삭제/변경 subset() 함수 aggregate() 함수 배울 게 많군요! 차근차근 따라와주세요. 여러분 그거 아세요? 오늘 잘 배운 함수, 내일 직장에서의 10분을 절약해 줌. 강의영상 아래 쪽에 강의안 첨부합니다. 다운받으시고 강의 들어주세요. 그럼 R공부를 슬기롭게! 같이 공부해보.. 2021. 10. 9.
반응형