본문 바로가기

통계 & 데이터분석33

[R] 세계 인터넷 유저 (2001-2023) 변화 2024. 8. 27.
[R] 한국의 2012년의 밤과 2022년의 밤 한국은 유난히 밤이 밝죠. 도시는 여전히 북적북적하고, 늦은 시간까지 문 여는 곳도 많고요.해외에 살아서 그런건지, 아니면 이제는 아이를 낳고 키워서인지, 불빛이 반짝이는 밤에 시티에서 논 적이 가물가물할 정도에요. 다음은 2012년과 2022년, 한국의 밤이 얼마나 변했는지 보여주는 지도를 R로 그린건데요. 이렇게 따로 두고 보니 2022년이 확실히 더 밝긴 하나, 그렇다고 2012년이 아주 어두운건 아니에요. 10년이나 차이가 나지만, 어쩌면 20년, 30년까지 함께 두고 보면 더 흥미로울 듯도 합니다.   아래는 2012년과 2022년의 지도를 R Shiny에서 아래의 바로 왼쪽, 오른쪽 왔다 갔다 하며 시간을 넘나드는 지도를 볼 수 있는 걸 기록했어요.  해외에 나오면 애국자가 된다고, 이렇게 지.. 2024. 8. 27.
[R] 호주 NSW 인구밀도 3D in R 욕심내어 호주 전체 인구밀도를 그리고 싶었으나, 제 컴퓨터 파워가 감당하지 못했습니다. 현재 살고 있는 NSW 주로 국한하여 만들어보았습니다. 2024. 8. 27.
[R] 한국 인구밀도 R에서 3D로 그리기 worldpop.org의 데이터를 이용하여 처음에는 일단 텍스트 없이 지도만 구현해보았습니다.   다음 두 지도를 R로 만들어보며 테스트하는데, 역시 3D라 그런지 이미지가 빨리 나오지는 않아요. 결국 두가지 정도를 테스트 해보았는데 (결과물만 두 가지이고 이렇게도 저렇게도 바꾸어보다가 코드 짜놓은 건 어느새 뒤죽박죽이 되어버렸네요ㅠ) 어느쪽으로 해가 비치는게 더 낫나요? 첫번째는 서쪽에서, 두번째는 동쪽에서 해가 내리쬐는 것 처럼 그림자를 표현해보았습니다.    인구밀도를 담고 있는 지도이지만, 햇빛을 품어서 그런지 제 눈에는 이 지도도 꽤 감성적으로 보이네요? 2024. 8. 27.
[R] Korea Forest in 3D 애국가에 나오는 "무궁화 삼천리 화려강산"이라는 가사가 떠올랐던 이번 비주얼라이제이션 이었습니다.이번에 사용한 패키지는  terra, elevatr, giscoR, png, rayshader, magick 으로 3D 구현이 가능해요. 여기까지는 아직 3D apply하기 전입니다. 한국 지도를 보니 색감이 예뻐서 호주 지도로도 만들어보았습니다.       색깔을 요리조리 바꿔보며 만들어보는 재미는 있었지만, 3D일 때는 컴퓨터 파워도 필요하고, 여러번 테스트 해보기에는 인내가 필요하다는 사실 :) 2024. 8. 27.
[R] 호주 인구분포 - Are there any people? 호주에서 데이터 분석가로 일하고 있는만큼, 호주의 인구분포를 R로 나타내보았다. 사용된 패키지는 terra, giscoR, tidyverse 이다. #------------------------------------- # 1. GHSL데이터 웹사이트에서 다운로드 #------------------------------------- url 2024. 8. 26.
[R] Carbon Dioxide uptake in Grass Plants(식물의 이산화탄소 흡수량  분석) R package {datasets}에 있는 데이터 CO2 를 사용하여 분석과 시각화를 해보겠습니다. 먼저 아래와 같이 물음표를 앞에 붙여 CO2를 콘솔에 입력하면 오른쪽에 데이터의 설명에 대해서 볼 수 있습니다. 데이터 구성이 어떻게 되어 있는지 View(CO2)를 통해 확인합니다. ?CO2 View(CO2) CO2 데이터는 식물이 얼마나 이산화탄소를 흡수하느냐를 측정한 데이터라는 것을 알 수 있습니다. 총 84 row와 5개의 column으로 exploratory analysis를 시행해보면 Plant 에는 Type (Quebec, Mississippi), 그리고 Treatmentd (nonchilled, chilled) 에 따라 각 12개의 distinct value가 있음을 알 수 있습니다. Pl.. 2023. 7. 6.
[R] map_data와 ggplot 이용하여 지도 그리기 아래와 같은 이미지를 R package에 있는 데이터를 이용하여 그릴 수 있는데요, 저는 두 국가 - 제가 태어나고 자란 나라와 현재 거주하는 나라를 정해서 그려보았습니다. 색도 여러가지 시도해볼 수 있습니다. 아래 글에 ggplot에서 사용할 수 있는 657가지 색의 이름과 종류를 마지막에 정리해두었으니, 참고하셔서 각각 다른 나라 지도를 그려보는 것으로 시도해보시면 좋을 것 같습니다. 2023.05.26 - [DataViz] - ggplot2 scatterplot 기초 ggplot2 scatterplot 기초1. DATA CPS85: R의 mosaicData pacakage에 있는 CPS85데이터를 사용합니다. CPS는 The Current Population Survey의 약자로, 인구 조사(cen.. 2023. 7. 4.
ggplot2 scatterplot 기초 1. DATA CPS85: R의 mosaicData pacakage에 있는 CPS85데이터를 사용합니다. CPS는 The Current Population Survey의 약자로, 인구 조사(census)를 하는 기간 사이에 정보를 보완하는 데 사용됩니다. 이 데이터는 성별, 교육 기간, 경력 기간, 직업 상태, 거주 지역 및 조합원 자격을 포함하여 근로자의 임금 및 기타 특성에 대한 정보와 함께 무작위 표본으로 구성됩니다. 2. Exploratory Analysis 시각화 전 Exploratory analysis는 필수. # load data data(CPS85 , package = "mosaicData") # basic ggplot ggplot(data = CPS85, mapping = aes(x = .. 2023. 5. 26.
시계열분석 - ARIMA (AirPassengers) NOTE Trend(추세): 방향성(하향, 상향) Seasonality(계절성): 시기적(계절적)으로 반복적인 패턴을 나타냄. 주로 단기. Cycle(주기): 주로 장기. 주기성이 있으나 추세나 계절성이 없으면 정상성을 나타내는 시계열에 해당. Stationarity(정상성): 시계열의 평균, 분산 및 공분산이 모두 시간의 변화에 관계없이 일정. 주로 추세나 계절성을 보이지 않는 시계열을 white noise로 정상성을 보이는 시계열이라 할 수 있음. ACF 그래프를 사용하거나, Dickey-Fuller 검정 사용. ACF(Auto-Correlation Function): 정상성을 나타내지 않는 데이터에서는 ACF가 느리게 감소하지만, 정상성을 나타내는 시계열에서는, ACF가 비교적 빠르게 0으로 떨어짐.. 2023. 5. 24.
반응형