ADsP

ADsP R 데이터 구조 및 외부 파일 읽기

Gimpapa 2021. 3. 12. 19:19

 

1. R 데이터 구조

 

- 스칼라 scala : 구성인자가 하나인 벡터를 가리킨다.

    7 : int 정수

    12.3 : float 실수

    'abc' : string 문자

 

- 벡터 vector : 하나 이상의 스칼라 원소들을 갖는 단순한 형태의 집합을 가리킨다. 동일한 유형의 1차원 데이터 구조이다. 명령어 c 를 이용해 선언할 수 있으며 c 는 연결 concentration 의 첫 글자이다. 벡터 중에 구성인자가 1개인 것을 스칼라라고 한다.

    { 1, 2, 3, 4 }

 

- 요인 factor : 범주형(명목형, 순서형) 데이터 구조를 요인이라고 한다.

 

- 행렬 matrix : m x n 형태의 행렬에 데이터를 나열한 구조이다. 동일한 유형의 2차원 데이터 구조이다. 기본적으로 열을 우선 채우는 방향으로 입력된다. 행을 우선 채우고 싶다면 byrow = T 옵션을 추가한다.

 

- 데이터 프레임 data frame : 행렬과는 다르게 각 열이 서로 다른 데이터 형식을 가질 수 있다. 데이터 유형에 상관없는 2차원 형태의 데이터 구조이다. 엑셀의 시트와 유사한 모습을 갖는다.

 

- 배열 array : 행렬은 2차원 데이터 구조지만, 배열은 동일한 유형의 다차원 데이터 구조이다. 행렬을 여려겹으로 표현했다고 보면 된다.

 

- 리스트 list : 벡터, 행렬, 배열, 데이터 프레임 등과 같은 서로 다른 구조의 데이터를 모두 묶은 객체이다.


2. 외부 파일 읽기

 

- read.csv() : csv 형식의 파일을 불러온다. 라벨 구분이 콤마(,)인 경우에 사용하기 편리하다. 라벨 구분이 tab 으로 구분된 파일이라면 sep="\t" 옵션을 사용하면 된다.

 

- read.table() : 일반 텍스트 형태의 파일을 읽어서 데이터 프레임에 담는 기능을 한다.

 

 

https://www.r-project.org/help.html

 

'ADsP' 카테고리의 다른 글

ADsP 확률과 통계  (0) 2021.05.01
ADsP 400 데이터 분석 개요  (0) 2021.03.13
ADsP R프로그램 소개 및 설치  (0) 2021.03.12
ADsP 322 분석 거버넌스 체계  (0) 2021.03.11
ADsP 321 분석 마스터플랜 수립  (0) 2021.03.11