파이썬 3

파이썬 상관분석

상관분석 correlation analysis 은 두 변수 사이에 어떤 관계가 있는지를 분석하는 방법이다. 상관계수는 -1에서 1 사이의 값을 갖게 된다. 다만 상관계수는 인과관계를 나타내지는 않는다. 5개의 변수를 가진 30개의 데이터가 있다. 이름을 나타내는 첫 번째 변수를 제외하고 나머지 4개의 변수에 대해 상관관계가 있는지 알아보자. 우선 데이터의 전체적인 모양을 한번 보자. chicks.head() chicks.info() 첫번째 열은 이름이므로 제외하고 새로운 데이터를 만들자. chicks_dataset=chicks.ilic[:,1:5] 나머지 4개의 변수들 간에 어떤 상관관계가 있을지 그래프로 시각화해보자. import matplotlib.pyplot as plt import seaborn ..

공부 2022.11.18

파이썬 히스토그램과 박스플롯 그리기

판다스의 데이터프레임을 하나 만든다. 병아리 이름과 몸무게가 한 쌍으로 총 30개의 데이터다. 테이블에서 맨 위 다섯개의 행만 보려면 head() 함수를 이용한다. info() 와 describe() 함수를 통해 테이블의 요약정보를 보자. matplotlyb.pyplot 을 import 해서 히스토그램과 박스플롯을 그려보자. 두 그래프를 한 번에 그릴 수도 있다. 아래 깃허브에 들어가면 코랩 파일을 오픈해 볼 수 있다. 값을 바꿔가면서 해보자. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fi..

공부 2022.11.12

파이썬 데이터프레임을 딕셔너리로 변환하기

csv형식으로 저장된 파일은 파이썬 판다스에서 read_csv()로 읽을 수 있다. 읽어온 파일은 판다스의 데이터프레임 형식으로 저장된다. df=pd.read_csv('파일명.csv') to_dict()를 이용하면 데이터프레임을 딕셔너리 형태로 바꿀 수 있다. dic=df.to_dict('list') to_dict()는 파라미터 값을 변경해서 다양한 형태의 딕셔너리를 만들 수 있다. 깃허브에 올려놓은 코랩을 열어서 하나씩 실행해볼 수 있다. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fiel..

공부 2022.11.09