본문 바로가기
data/R 프로그래밍

R로 데이터를 원하는 모양으로 변형하기 ① (기본함수)

by #moonyz 2014. 11. 28.


 함수

의미 

 aggregate( ) 

 다양한 함수를 사용하여 계산 결과를 출력 

 apply( ) 

  

 cor( ) 

 상관함수 

 cumsum( )  

 설정된 지점까지의 누적합 

 cumprom( )  

 설정된 지점까지의 누적곱 

 diff( )  

 차이나는 부분을 찾아냄 

 length( ) 

 요소갯수를 구해서 출력함 

 max( )  

 최대값 출력 

 min( )  

 최소값 출력 

 mean( )  

 평균값 출력 

 median( )  

 가운데값 출력 

 order( )  

 각 요소의 원래 위치 

 prod( )  

 누적곱을 출력 

 range( )  

 범위값 출력 

 rank( )  

 각 요소의 순위를 출력

 rev( )  

 요소의 역순을 출력 

 sd( )  

 표준편차 출력 

 sort( )  

 정렬결과 출력 

 sum( )  

 총 합계 출력 

 summary( )  

 요약 통계량 출력  

 sweep( )  

  

 tapply( ) 

 벡터에서 주어진 함수연산 수행 

 var( )  

 분산값 출력 



1. 기본함수 - max, min, mean, sum, sd



2. aggregate 함수 - Dataframe 대상

- 분석할 데이터 형태가 데이터 프레임 형태일 경우 사용하는 함수

- 문법 : aggreate(계산될컬럼~기준될컬럼, 데이터, 함수)

- 기준될 컬럼이 여러개일 경우에는 + 사용 ex) aggregate(Sales~Fruit+Year,Fruits,max)



3. apply 함수로 분석하기 - Matrix 대상

- R에서 아주 많이 사용되는 함수이며 여러가지 변형도 많음

- 문법 : apply(대상,행/열,적용함수)

- 행/열 -> 1이면 행, 2이면 열기준으로 적용

- 행렬(Matrix)일 경우에 유용하게 사용됨 -> 행이나 열을 대상으로 작업하기때문에



4. lapply / sapply 함수

- apply함수의 변형

- 문법 : lapply/sapply(대상, 적용함수)



5. tapply / mapply 함수

tapply( )

- 그룹별 처리를 위한 apply함수

- 문법 : tapply(출력값, 기준컬럼, 적용함수)

mapply( )

이터프레임이 아닌 벡터나 리스트 형태의 데이터를 마치 데이터 프레임처럼 연산을 해주는 함수

- 문법 : mapply(함수, 벡터1, 벡터2, 벡터3 ...)



6. sweep 함수 - 한꺼번에 차이 구하기

- 벡터, 매트릭스, 배열, 데이터프레임으로 구성된 여러 데이터들에 동일한 기준을 적용시켜 차이나는 부분을 한꺼번에 보여주는 함수



7. length 함수 - 요소의 개수나 줄수 파악하기

- 요소의 개수나 줄수 파악하는 함수



댓글