[혼공R이] 6주차 1편_황금같은 토요일 아침 adsp 털리고 와서 몰아치는 중

토요일 아침부터 보러간 adsp에 뒷통수 맞고 혼공단 마지막 공부를 하는 중이다.

난이도 실화? adsp야 기출이랑 완전 다른 사람이잖니? 

캐릭터 변화중이니? 너 굉장히 입체적인 아이구나!!!

아무튼 adsp 스터디의 시험후기까지 끝마지고 이제 혼공단의 후기까지 달려보자.



데이터 시각화

복잡해 보이는 수치 데이터를 이미지화하여 누구나 쉽게 내용을 이해할 수 있도록 시각적으로 전달하는 것


ggplot2 패키지

reshape2 패키지나 dplyr 패키지를 만든 해들리 위컴이 만든 패키지

R 시각화 1순위 패키지

ggplot() 함수를 이용하여 그래프 틀을 만들고, 그 안에 다양한 이미지 객체 레이어를 계속 포개는 방식으로 그래프를 표현


그래프 기본 틀 만들기 : ggpot() 하수

ggplot(데이터 세트, aes(데이터 속성))

ggplot() 함수 안에서 aes() 함수를 이용해 x축과 y축에 변수를 매핑하여 그래프의 가장 기본 틀을 생성




산점도 그리기 : geom_point() 함수

산점도 : 두 변수의 관계를 파악하기 위해 평면에 관측점을 찍어서 표현하는 그래프

geom_point() 함수를 사용하여 산점도를 그린다.

매핑을 위해 작성한 ggplot() 함수 뒤에 + geom_point()만 추가로 입력






 plot.new() : 작성한 그래프를 지운다.



선 그래프 그리기 : geom_line() 함수

geom_line() 함수를 사용하여 선 그래프를 그린다.

산점도가 두 변수의 관계를 점으로만 표현했다면 선 그래프는 점과 점을 순차대로 이어 하나의 선으로 표현한 시각화 자료로, 산점도에 비해 변화를 관찰하기 쉽다는 장점이 있다.

geom_point() 함수와 동일하게 매핑 코드 뒤에 + geom_line()을 입력하여 사용한다.





막대 그래프 그리기 : goem_bar() 함수

산점도와 선 그래프에서는 aes() 함수를 이용해 x축과 y축을 모두 지정했지만, 막대 그래프에서는 x축만 지정하면 된다.



빈 범주를 제외하고 싶다면 수치형인 데이터를 범주화 할 수 있는 factor() 함수 사용





누적 막대 그래프 그리기



fill 옵션으로 factor(gear)를 지정하면 gear 변수의 범주별 빈도가 막대 그래프에 색상으로 채워진다.



누적 막대 그래프로 그리는 선버스트 차트

누적 막대 그래프에 coord_polar() 함수 하나만 추가하면 그래프를 선버스트 차트로 변환할 수 있다.

선버스트 차트 : 계측 구조의 데이터를 수준별로 비율을 표시하는 그래프



coord_polar() 함수에 theta = "y" 옵션을 추가하면 가운데가 도넛처럼 비어있는 선버스트 차트가 그려진다.





상자 그림 그리기 : geom_boxplot() 함수




히스토그램 그리기 : geom_histogram() 함수




연산자로 이어지는 코드에서 줄 바꿈을 할 때는 연산자까지 작성한 후 줄을 바꿔야 모드 한 줄로 인식된다.



사선 그리기 : geom_abline() 함수

그래프에 사선을 추가하면 그래프 추세를 확인할 수 있다.

사선은 절편과 기울기를 이용하여 geom_abline() 함수로 그린다.





평행선 그리기 : geom_hline() 함수

평행선을 그래프에 추가하면 평행선을 기준으로 그래프 변동 추이를 좀 더 명확하게 파악할 수 있다.

평행선은 geom_hline() 함수로 그리며, yintercept 옵션에 y축 절편 값을 입력하면 그 값에 따라 평행선을 그린다.




수직선 그리기 : geom_vline() 함수



filter() 함수 사용을 위해 먼저 dplyr 패키지 로드.

as.Date() 함수를 이용해 날짜 형식으로 변환.



레이블 입력하기 : geom_text() 함수

geom_text(aes(label = 레이블, vjust = 세로 위치, hjust = 가로 위치))




데이터 레이블을 입력할 위치에서 세로와 가로 값을 모두 0으로 입력하면 레이블은 각 점의 오른쪽 위, + 값은 왼쪽/아래, - 값은 오른쪽/위에 표시된다.



도형 및 화살표 넣기 : annotate() 함수

annotate() 함수는 그래프 위에 사각형이나 화살표 등으로 특정 영역을 강조할 때 사용한다.

annotate("모양", xmin = x축 시작, xmax = x축 끝, ymin = y축 시작, ymax = y축 끝)




alpha 옵션은 투명도(0.1 ~ 1), fill 옵션은 채우기 색상

rect : 사각형

segment : 선

arrow = arrow() 옵션 : 화살표



화살표와 같은 선 스타일의 도형을 그릴 때는 사각형과 같은 면 스타일 도형과 달리 x축과 y축의 시작 위치와 끝 위치를 x, xend와 y, yend로 표현한다.




그래프 제목 및 축 제목 추가하기 : labs() 함수

디자인 테마 적용하기 : theme() 함수



절편과 기울기 구하기 : 회귀분석

회귀분석 : 독립변수와 종속변수 간의 인과관계를 구하는 분석 기법

단순회귀분석 : 독립변수가 1개인 경우

다중회귀분석 : 독립변수가 2개인 경우잡해 보이는 수치 데이터를 이미지화하여 누구나 쉽게 내용을 이해할 수 있도록 시각적으로 전달하는 것



ggplot2 패키지

reshape2 패키지나 dplyr 패키지를 만든 해들리 위컴이 만든 패키지

R 시각화 1순위 패키지

ggplot() 함수를 이용하여 그래프 틀을 만들고, 그 안에 다양한 이미지 객체 레이어를 계속 포개는 방식으로 그래프를 표현


그래프 기본 틀 만들기 : ggpot() 함수

ggplot(데이터 세트, aes(데이터 속성))

ggplot() 함수 안에서 aes() 함수를 이용해 x축과 y축에 변수를 매핑하여 그래프의 가장 기본 틀을 생성



산점도 그리기 : geom_point() 함수

산점도 : 두 변수의 관계를 파악하기 위해 평면에 관측점을 찍어서 표현하는 그래프

geom_point() 함수를 사용하여 산점도를 그린다.

매핑을 위해 작성한 ggplot() 함수 뒤에 + geom_point()만 추가로 입력

plot.new() : 작성한 그래프를 지운다.


선 그래프 그리기 : geom_line() 함수

geom_line() 함수를 사용하여 선 그래프를 그린다.

산점도가 두 변수의 관계를 점으로만 표현했다면 선 그래프는 점과 점을 순차대로 이어 하나의 선으로 표현한 시각화 자료로, 산점도에 비해 변화를 관찰하기 쉽다는 장점이 있다.

geom_point() 함수와 동일하게 매핑 코드 뒤에 + geom_line()을 입력하여 사용한다.


막대 그래프 그리기 : goem_bar() 함수

산점도와 선 그래프에서는 aes() 함수를 이용해 x축과 y축을 모두 지정했지만, 막대 그래프에서는 x축만 지정하면 된다.

빈 범주를 제외하고 싶다면 수치형인 데이터를 범주화 할 수 있는 factor() 함수 사용


누적 막대 그래프 그리기

fill 옵션으로 factor(gear)를 지정하면 gear 변수의 범주별 빈도가 막대 그래프에 색상으로 채워진다.

누적 막대 그래프로 그리는 선버스트 차트

누적 막대 그래프에 coord_polar() 함수 하나만 추가하면 그래프를 선버스트 차트로 변환할 수 있다.


선버스트 차트 : 계측 구조의 데이터를 수준별로 비율을 표시하는 그래프

coord_polar() 함수에 theta = "y" 옵션을 추가하면 가운데가 도넛처럼 비어있는 선버스트 차트가 그려진다.

상자 그림 그리기 : geom_boxplot() 함수


히스토그램 그리기 : geom_histogram() 함수

연산자로 이어지는 코드에서 줄 바꿈을 할 때는 연산자까지 작성한 후 줄을 바꿔야 모드 한 줄로 인식된다.



사선 그리기 : geom_abline() 함수

그래프에 사선을 추가하면 그래프 추세를 확인할 수 있다.

사선은 절편과 기울기를 이용하여 geom_abline() 함수로 그린다.


평행선 그리기 : geom_hline() 함수

평행선을 그래프에 추가하면 평행선을 기준으로 그래프 변동 추이를 좀 더 명확하게 파악할 수 있다.

평행선은 geom_hline() 함수로 그리며, yintercept 옵션에 y축 절편 값을 입력하면 그 값에 따라 평행선을 그린다.


수직선 그리기 : geom_vline() 함수

filter() 함수 사용을 위해 먼저 dplyr 패키지 로드.

as.Date() 함수를 이용해 날짜 형식으로 변환.


레이블 입력하기 : geom_text() 함수

geom_text(aes(label = 레이블, vjust = 세로 위치, hjust = 가로 위치))

데이터 레이블을 입력할 위치에서 세로와 가로 값을 모두 0으로 입력하면 레이블은 각 점의 오른쪽 위, + 값은 왼쪽/아래, - 값은 오른쪽/위에 표시된다.



도형 및 화살표 넣기 : annotate() 함수

annotate() 함수는 그래프 위에 사각형이나 화살표 등으로 특정 영역을 강조할 때 사용한다.

annotate("모양", xmin = x축 시작, xmax = x축 끝, ymin = y축 시작, ymax = y축 끝)

alpha 옵션은 투명도(0.1 ~ 1), fill 옵션은 채우기 색상

rect : 사각형

segment : 선

arrow = arrow() 옵션 : 화살표

화살표와 같은 선 스타일의 도형을 그릴 때는 사각형과 같은 면 스타일 도형과 달리 x축과 y축의 시작 위치와 끝 위치를 x, xend와 y, yend로 표현한다.


그래프 제목 및 축 제목 추가하기 : labs() 함수

디자인 테마 적용하기 : theme() 함수




[기본 숙제(필수)]

p. 288의 <좀 더 알아보기> 실습하고 결과 화면 캡처하기





중간부터 실습화면이 없는 이유는 홀라당 날려먹었기 때문이다...

오늘 무슨 날인지 내 멘탈은 강하게 훈련중이다...

후... 멘탈이슈로 나머지는 내일 2편에서 이어서 하기로 했다. 


댓글 쓰기

다음 이전

POST ADS1

POST ADS 2