본문 바로가기

My Study/R

R 공부 (1편) - 쉽게 배우는 R 데이터 분석

R에 대한 나의 생각 (feat. Python과의 차이)

최근에 R을 새로 배우는 중이다. 원래 나의 주언어는 Python이지만 두 언어의 각각의 강점과 특성을 잘 파악한다면 더 큰 시너지 효과를 얻을 수 있을 것 같아 공부를 시작했다.

 

간단하게 두 언어의 차이를 말하자면, R은 통계 분석과 시각화를 위해 개발된 프로그래밍 언어이자, 통계 모델링과 데이터 분석에 특화되어 있다. 하지만, Python 같은 경우는 범용 프로그래밍 언어로 데이터 과학뿐만 아니라 웹 개발, 자동화, 인공지능 등 다양한 분야에서 활용된다.

 

따라서, 어떤 언어를 배워 어떻게 활용하는 가에 따라 본인이 공부하고자 하는 언어가 달라질 것 같다. 현재 나는 데이터 분석에 대한 깊은 이해를 얻고 싶고 R로부터 얻은 지식을 Python에서도 활용하고자 R을 배우기로 결심했다. 

 


R과 R 스튜디오 설치하기 中

R과 R 스튜디오 설치하는 방법은 따로 다루지 않을 예정이다. 나보다 더 친절한 안내가 많기 때문이다. 다만, 한 가지 팁이 있다면, 윈도우 사용을 하는 사람들은 윈도우 사용자 계정을 한글로 하지말고 영어로 설정하자. 한글로 설정하면 오류가 발생할 수 있다.

 


R 스튜디오에 대한 이해 中

 R 스튜디오는 다른 IDE와 달리 특이하게 4개의 창으로 구성되어 있다. 각 창을 드래그하면 크기를 조절할 수 있다. 또한, 창의 위치도 바꿀 수 있다. 나 같은 경우에는 기존의 비주얼 스튜디오와 같은 IDE와 비슷한 구조를 만들기 위해 콘솔 창(왼쪽)과 환경 창(오른쪽)의 위치를 바꾸어 놓았다. 

 

처음 실행을 기준으로 콘솔 창, 환경 창, 파일 창, 소스 창이 있다. 

 

소스 창에서는 입력한 명령어로 만들어진 문서를 'Script'라고 하며 실행을 위해서는 Ctrl + Enter를 해당 행에 위치 시킨 다음 누르면 콘솔 창에서 결과를 확인할 수 있다. 한 번에 여러 줄의 명령어를 실행하기 위해서는 해당 명령어들을 블록으로 지정한 다음 Ctrl + Enter를 누르면 순차적으로 결과를 확인할 수 있다. 참고로, 콘솔 창 내 Terminal 탭이 있어 운영 체제를 조작할 수 있다. 

 

환경 창은 생성한 데이터를 보여 주는 창이다. 예를 들어, 변수를 생성하면 환경 창의 Values 목록에서 확인 가능하다. 추가적으로, 파일 창은 폴더에 있는 파일을 보여주는 창이다. 특히, 파일 창 중 Packages에서는 설치된 패키지 목록을 확인 가능하다. 

 

참고로, 스크립트를 만드는 단축키는 Ctrl + Shift + N이다. 

 


변수 中

변수를 만들기 위해선 할당 연산자 (화살표 기호 <-)를 활용해야 한다. 

a <- 1   # a에 할당
a        # a 출력  

## [1] 1

 

당연히 a/3, a+b 등과 같은 변수끼리 연산하거나 변수와 숫자를 조합한 연산도 가능하다. 변수명은 되도록이면 영문으로 작성하되, 소문자와 숫자, 언더바를 조합해서 생성하자.

 

var1 <- c(1, 2, 3, 4, 5)
var1

## [1] 1 2 3 4 5


var2 <- c(1:5)
var2

## [1] 1 2 3 4 5


var1 + var2

## [1] 2 4 6 8 10


var3 <- seq(1,5)
var3

## [1] 1 2 3 4 5

 

c() 함수를 이용해서 다섯 개의 숫자로 된 변수이다. c는 combine을 의미한다. 연속된 숫자를 만들기 위해서는 콜론(:)이나 seq()함수를 이용할 수 있다. 또한, 변수끼리 연산이 가능하다. 단, 문자로 된 변수로는 연산을 할 수 없다. 

 

x <- (1, 2, 3)
x

## [1] 1 2 3


mean(x)

## [1] 2


max(x)

## [1] 3


min(x)

## [1] 1


x_mean <- mean(x)
x_mean

## [1] 2

 

mean()은 평균을 구하는 함수, max()는 최댓값을 구하는 함수, min()은 최솟값을 구하는 함수이다. 함수의 결과물로 새 변수를 바로 만들 수 있다. 

 

str1 <- c("Hi!", "James")
str1

## [1] "Hi!", "James"


paste(str1, collapse = " ")

## [1] "Hi! James"

 

위와 같이 여러 문자를 하나로 합칠 때는 paste() 사용한다. 또한,  collapse와 같은 매개변수를 활용하면 원하는 기호로 단어들을 구분할 수 있다.  

'My Study > R' 카테고리의 다른 글

R 공부 (2편) - 쉽게 배우는 R 데이터 분석  (0) 2024.07.05