본문 바로가기
반응형

R52

[RSTAT101] 3강. 평균과 중앙값, 분산과 IQR의 관계 이해하기 데이터 불러오기 저번시간에 불러왔던 데이터를 다시 불러오도록 하자. mydata > student_id gender midterm final >> 1 1 F 38 46 >> 2 2 M 42 67 >> 3 3 F 53 56 >> 4 4 M 48 54 >> 5 5 M 46 39 >> 6 6 M 51 74 분포의 중간 지점을 나타내는 평균과 중앙값 평균 (mean) 우리가 갖고 있는 데이터를 가장 잘 대표하는 값 하나를 뽑으라면 평균이라고 생각합니다. 평균을 구하는 방법은 각각의 데이터를 더한 후, 데이터의 갯수만큼으로 나줘주면 됩니다. x > [1] 8 mean(x) >> [1] 8 Q. 중간고사의 평균은 어떻게 될까요? mean(mydata$midterm) >> [1] 41.16667 평균을 구한다는 것은.. 2023. 6. 10.
[RSTAT101] 2강. 기초통계 그래프들 - 파이차트, 줄기-잎 그래프, 히스토그램, 상자그림 데이터 불러오기 저번시간에 불러왔던 데이터를 다시 불러오도록 하자. mydata > student_id gender midterm final >> 1 1 F 38 46 >> 2 2 M 42 67 >> 3 3 F 53 56 >> 4 4 M 48 54 >> 5 5 M 46 39 >> 6 6 M 51 74 데이터 열에 접근하기 $ 명령어는 불러온 데이터의 행에 접근 할 수 있도록 해줍니다. 다음은 불러온 mydata의 midterm1 열을 선택하는 코드입니다. mydata$midterm >> [1] 38 42 53 48 46 51 48 43 28 38 50 29 27 36 29 34 35 46 >> [19] 39 9 76 15 63 28 49 42 24 52 65 52 이전에 배웠던 대괄호 명령어 [] 를 사.. 2023. 6. 9.
R에서 데이터프레임에 tibble 열별, 행별 총합 붙이기 가끔 R에서 문서에 들어가는 표를 작성하는 경우 데이터 프레임의 아래쪽과 옆쪽에 총합을 구해서 넣고싶은 경우가 있다. 이러한 것을 쉽게 해주는 함수가 janitor 패키지에 존재한다. adorn_totals() 함수를 사용하여 넣어주면 된다. 행에 넣고 싶은 경우 "row"만 입력하면 된다. 쉬워서 그냥 코드만 붙여넣었음. library(tidyverse) library(janitor) mytab # A tibble: 2 × 6 #> 성별 `20대` `30대` `40대` `50대` `60대.이상` #> #> 1 Male 20 20 20 0 0 #> 2 Female 20 20 0 0 0 mytab |> adorn_totals(c("row", "col")) #> 성별 20대 30대 40대 50대 60대.이상.. 2023. 4. 19.
Rmd 문서 G메일로 전송하기 (blastula 패키지) 문서 자동화의 핵심 기능이죠? 데이터에 연결된 보고서를 kniting 할 때마다 내용이 바뀌게 작성하고, 작성된 결과를 메일로 전송하는 방법을 알아보겠습니다. blastula 패키지를 사용한 Email 보내기 영상 다음은 영상에서 사용한 R코드와 Rmd 코드입니다. email-automation.R 코드 # 이메일 내용 작성 email_body as_tsibble(index = 날짜) |> autoplot(총매출) + scale_x_date(date_breaks = "1 month", date_labels = "%y년\n%m월") + theme(axis.text.x = element_text(angle = 0, hjust = 1)) + bbplot::bbc_style() + labs(title = "월별.. 2023. 4. 9.
R 프로그래밍 apply() 함수 - 당신의 코드를 짧고 간결하게 필자의 유튜브 슬기로운 통계생활에 R과 통계에 관한 강의를 올려놓았다. 기초 내용이지만 초급자들이 어려워하는 함수와 개념들을 자세하게 올려놓았고, 계속 업데이트 예정이니 자주 들려주시기 바란다. 😎 이번 포스팅에서 다룰 R함수는 바로 apply() 함수이다. 사실 R에는 여러가지 apply()로 끝나는 이름의 함수들이 많다. 예를들어, lappy(), sapply(), tapply(), 그리고 mapply() 등등 사실 이런 함수들의 사용법을 알고 있어도 필자도 매번 잊어버리고 도움말을 찾아본다. 일일이 이러한 함수의 사용법을 알고 있는 것 자체도 비효율적이라고 생각하는 측면도 있고, 따지고 보면 오늘 설명할 apply 함수에서 출발한 아류들이기 때문이다. 따라서 apply 함수를 확실하게 이해하고, 자.. 2023. 4. 5.
R에서 Python 연결 시 에러 해결법 미니콘다가 설치 되었음에도 불구하고 다음과 같은 에러가 나는 경우가 있다. Error in reticulate::use_miniconda() : Miniconda is not installed. Use reticulate::install_miniconda() to install Miniconda. Execution halted 이것은 현재 설치되어있는 미니콘다의 설치 경로를 R에서 알아채지 못해서 발생하는 오류이다. 해결법은 R에서 미니콘다가 현재 어디에 설치되어 있는지 알려주면 된다. 환경변수 `RETICULATE_MINICONDA_PATH ` 를 만들어서 설치경로를 입력하면된다. 2023. 3. 5.
가장 많이 쓰이는 통계 그래프 5 종류! R로 정복하기 데이터를 시각화하는데 사용할 수 있는 많은 유형의 통계 그래프가 있지만, 가장 널리 사용되는 그래프는 다음과 같습니다. 선 그래프(Line graph): 선 그래프는 시간 경과에 따른 추세를 표시하거나 여러 변수를 비교하는 데 사용됩니다. 기온, 주가, 인구 증가와 같은 연속 변수에 대한 데이터를 표시하는 것은 일반적인 방법입니다. 막대 차트: 막대 차트는 여러 범주 또는 데이터 그룹을 비교하는 데 사용됩니다. 성별, 나이 또는 직업과 같은 범주형 변수의 데이터를 표시하는 데 사용할 수 있습니다. 히스토그램: 히스토그램은 연속형 변수의 분포를 표시하는 데 사용됩니다. 막대 차트와 비슷하지만 서로 다른 범위 또는 빈 내의 데이터 빈도를 표시하는 데 사용됩니다. 산점도: 산점도는 두 연속형 변수 사이의 관계.. 2023. 1. 28.
R 그래프 그리는 법 - plot() 함수 옵션과 예제 R 프로그래밍 언어의 가장 강력한 특징 중 하나는 아름답고 유익한 플롯을 만드는 능력이다. 이 블로그 게시물에서는 기본 R 코드를 사용하여 간단한 플롯을 만드는 과정을 설명하고 플롯을 생성하는 데 사용되는 실제 R 코드를 제공하는 추가 보너스를 제공할 것이다. 1단계: 데이터 준비 그래프를 만드는 첫 번째 단계는 데이터를 준비하는 것입니다. 이 예에서는 다양한 자동차 모델과 특성에 대한 데이터를 포함하는 내장 mtcars 데이터 세트를 사용할 것이다. 시작하기 전에 데이터 세트를 로드하고 처음 몇 개의 행을 살펴보도록 하겠습니다: data(mtcars) head(mtcars) ## mpg cyl disp hp drat wt qsec vs am gear carb ## Mazda RX4 21.0 6 160 .. 2023. 1. 28.
Rmd 파일 저장할 때 knit하기 저장용 knit 할 때 저장할 때 knit되게 하는 함수 저장용 pdf_watch 2022. 1. 26.
gganimate 패키지로 신년 메세지 동영상만들기 새로운 새해가 밝았습니다. 22년 호랑이의 기운이 솟아나는 힘찬 한해가 되었으면 좋겠습니다! 오늘 만들어본 것은 이제까지 tidyverse 마스터클래스에서 배웠던 gganimate과 ggplot font를 사용해서 신년 축하 동영상을 만들어 보았습니다. 영상의 기본틀을 이루는 코드는 gganimate 패키지 제작자의 불꽃놀이 코드에서 훔쳐왔습니다. 저는 불꽃이 터지는 위치와 메세지가 겹치지 않도록 살짝 숟가락만 얹었습니다.ㅋㅋ 원본 코드가 들어있는 포스트는 다음과 같습니다. https://www.data-imaginist.com/2019/gganimate-has-transitioned-to-a-state-of-release/ gganimate has transitioned to a state of rel.. 2022. 1. 2.
ggmap을 이용한 지도 시각화 오늘은 ggmap을 이용한 데이터의 정보를 지도에 시각화하는 방법을 알아보도록 하겠습니다. 최종 결과물은 아래에 보이는 것처럼 유럽지역의 특정 국가 위치에 빨간색 투명점을 나라별 GDP에 따라 크기를 다르게 찍어보도록 하겠습니다! 구글맵 API를 발급 받아 ggmap에 연결시킵니다. 구글맵 API를 발급받기 위해서 구글맵 개발자 페이지에 방문합니다. 구글맵 API 발급받기 https://mapsplatform.google.com/ Google Maps Platform - Location and Mapping Solutions Create real world and real time experiences for your customers with dynamic maps, routes & places API.. 2022. 1. 1.
ggplot2 사용시 invalid graphics state 오류 해결방법 위와 같은 오류를 ggplot2을 사용하면서 아래와 같은 오류를 보았는가? Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)) : invalid graphics state 이것때문에 들어왔다면 해결방법은 간단하다. 다음과 같은 코드를 돌려주고 다시 실행하여 된다. dev.off() 이러한 해결방법이 작동하는 이유는 이전에 기본 plot() 함수를 사용해서 그래프 팔렛트를 조정했을 가능성이 크다. 그 후에 다시 팔레트를 리셋해줘야 하는데, 팔렛트 리셋 명령어가 바로 dev.off() 명령어 임. 😎👍 2021. 11. 24.
반응형