1. R
SAS 나 SPSS 같은 통계 소프트웨어는 유지보수가 쉽지만 고가이고 최신 기술이 반영되는 속도가 다소 느리다. 다양한 모듈을 사용하려면 추가 비용을 내야 한다. 하지만 R 은 오픈소스라 비용이 들지 않고, 최신 기술 반영 속도가 매우 빠르다. 커뮤니티가 매우 잘 되어 있어 학습자료를 구하거나 궁금증에 대한 답을 구하기가 쉽다. 다만 통계 소프트웨어에 비해 유지보수가 어렵다는 단점이 있다.
R 의 그래픽 성능은 상용 프로그램과 대등하거나 오히려 월등한 경우도 있다. 모든 운영체제에서 사용이 가능하다. 객체지향 언어이며 함수형 언어다. 일반 프로그래밍 언어처럼 자동화하거나 함수를 생성해서 사용할 수 있다.
R 프로그램은 아래와 같이 접속하여 다운로드 및 설치가 가능하다.
r-project.org 접속 - cran - Korea(mirror)
- 다른 이름으로 저장을 선택 후 다운로드
- 마우스 우클릭 후 관리자 권한으로 실행
- 한국어 분석을 자주 할 경우, 설치 언어를 반드시 한국어로 설정
2. R studio
R studio 는 R 을 편리하게 사용할 수 있는 통합 개발 중의 하나이다. 오픈소스이기 때문에 무료로 사용이 가능하다. 특별한 명령을 하지 않아도 변수의 정보를 바로 알 수 있다. 그리고 스크립트 관리가 편리하다. R studio 는 아래 경로를 통해 설치가 가능하다.
rstudio.com/products/rstudio
1) R studio 화면 구성
R studio 는 창을 4 분할해서 사용할 수 있다. 이 경우 각 창의 사용 용도는 다음과 같다.
- script : 입력하는 창
- console : 결과값을 보여줌
- environment / history : 설정 내용, 변수 등을 보여줌
- files/plot/packages/help/viewer
2) R studio 설정하기
- 관리자 권한으로 실행
- Tools - Global Options - General : 버전 확인 및 기본 시작 위치 지정( ~ 표시는 홈 디렉토리)
- Tools - Global Options - Code - Savings - Default Encoding : UTF-8 로 설정
- Tools - Global Options - Appearance : 글꼴 설정
- Tools - Global Options - Pane Layout : 화면 구성 설정 default 추천
3) R studio 프로젝트 생성
화면 우측 상단 Project[None] - New Project - New Directory - R_Basic(예시) 생성
- 가급적이면 제목은 영어 사용
- 기본 저장 위치는 ~ 로 사용자의 내문서 위치임
- 프로젝트 하위 폴더 생성 : 프로젝트 내에서 코드는 source 폴더, 데이터셋은 data 폴더, 생성파일은 output 폴더
4) 기타 유용한 메뉴
file - reopen with encoding - CP949(System default) : 유니코드 에러
session - set working directory - choose directory : working directory 설정
'ADsP' 카테고리의 다른 글
ADsP 400 데이터 분석 개요 (0) | 2021.03.13 |
---|---|
ADsP R 데이터 구조 및 외부 파일 읽기 (0) | 2021.03.12 |
ADsP 322 분석 거버넌스 체계 (0) | 2021.03.11 |
ADsP 321 분석 마스터플랜 수립 (0) | 2021.03.11 |
ADsP 314 분석 프로젝트 관리방안 (0) | 2021.03.10 |