본문 바로가기
data/R 프로그래밍

R로 데이터를 원하는 모양으로 변형하기 ③ (사용자 정의 함수)

by #moonyz 2014. 11. 28.

함수명 <- function (인수 또는 입력값) {

계산식 1

계산식 2

Return (계산 결과 반환값)

}


1. 입력 값 없는 경우



2. 함수에 입력되는 값 (인자)이 있는 경우



3. 데이터 정렬하기 - sort( ) 활용


4. 데이터 합치기 - merge( ), cbind( )
- DBMS에서 JOIN처럼 다른 데이터 프레임에 있는 데이터를 공통적으로 있는 컬럼기준으로 비교해서 합치기 가능
- cbind( ) 함수를 사용하여 컬럼 추가 가능


5. plyr ( ) 패키지
- 원본 데이터를 분석하기 쉬운 형태로 나누어서 다시 새로운 형태로 만들어 주는 패키지
- apply( ) 함수 확장
- ply( )앞에 함수 두글자를 적어서 사용 ( d: data frame, a : array (matrix 포함), l : list )
- 기본문법 : ddply(data, 기준컬럼, 적용함수)

 

 Data frame

 List 

 Array 

 Data frame

 ddply( )

ldply( ) 

adply( ) 

 List

dlply( ) 

llply( ) 

adply( ) 

 Array

daply( ) 

laply( ) 

aaply( ) 

- summarise : 합계정보를 계산해서 출력하고 싶을때, SQL에서 GROUP BY와 비슷한 역할

- transform : 다른 계산을 해서 컬럼을 추가하고 싶을때



6. reshape2( ) 패키지
- 컬럼이 많은 형태(wide)를 세로로 긴 형태(long)로 변경, 세로로 긴 형태(long)를 넓은형태로(wide) 변경
- melt함수와 cast함수가 가장 많이 사용됨
- melt : wide -> long
- cast : long -> wide


8. reshape2( ) 패키지
- 대상데이터가 문자일 경우 쉽게 처리할수 있는 패키지



댓글