기본문법 8. 자료구조 data.frame [데이터 분석 with R]

안녕하세요. 언제나 휴일에 언휴예요.

[데이터 분석 with R] 강의는 동영상 강의 중심으로 제작하고 있으며 사이트에는 동영상 강의에서 다루는 내용을 소개하고 있습니다.

data.frame은 원소 개수가 같은 벡터들로 구성한 리스트입니다.
테이블 구조를 생각하면 쉽게 이해할 수 있을 거예요.
회원 데이터를 여러 개의 변수로 관리하는 것을 data.frame 생성으로 강력한 관리가 가능함을 보여줍니다.
mt = data.frame(‘번호’=nums,’이름’=names,’나이’=ages,’성별’=genders,’주소’=cities)
Column (mt[1]) 과 Row (mt[1,]을 확인합니다.
회원 정보를 추가합니다.
rbind(mt,c(11,’강감찬’,11,”남”,”울산”)
그리고 특정 Column을 factor로 지정하지 않았을 때의 문제점을 얘기합니다.
그런데 사용자 혹은 개발자의 실수로 다음과 같은 데이터를 넣었다고 가정합시다.
rbind(mt,c(11,’강감찬’,11,”놈”,”울산”)
이런 데이터는 추가할 수 없게 막아야겠죠.
이 때 지난 강의에서 다른 factor가 필요한 거예요.
mt$”성별”=factor(mt$”성별”)
이제 사용자 혹은 개발자 실수를 방지할 수 있어요.
factor 지정을 취소할 때는 as.character를 사용합니다.
data.frame은 매우 강력합니다.
이번 강의는 기초문법에서 data.frame을 다루는 거예요.
보다 강력한 data.frame은 기초 문법을 다루고 나서 다루기로 할게요.