전체 글 431

서울 투기지역 대폭 해제(2023.1.3 기획재정부)

이전 정부에서 하루가 멀다 하고 주택 관련 정책을 쏟아냈다. 그래도 집값은 잡히지 않고 계속 오르기만 했다. 하지만 지난 반년동안 금리가 급격하게 오르자 거래절벽에 이어 집값이 떨어지기 시작했다. 역시 금리는 무서운 존재였다. 이제는 주택관련 규제가 서서히 풀리고 있다. 2023년 1월 3일 기획재정부는 서울의 4개 구를 제외하고 모든 지역을 투기지역에서 해제하는 보도자료를 발표했다. 국토부는 이미 2023년 1월 2일 서울의 4개 구를 제외한 모든 지역을 투기과열지구 및 조정대상지역에서 해제했다. 그동안 우리나라는 규제지역을 투기지역, 투기과열지역, 조정대상지역으로 나눠서 관리하고 있었다. 2023년 1월 5일 0시를 기점으로 서울의 4개 구만 투기지역으로 남겨놓고 나머지 지역은 규제지역에서 다 벗어났..

재테크 2023.01.08

파이썬 비선형 회귀분석

성장기간에 따른 병아리 몸무게 파일을 준비한다. 데이터가 어떻게 생겼는지 대략 살펴본다. chick_weight.head() chick_weight.info() import matplotlib.pyplot as plt plt.figure(figsize=(10,6)) plt.scatter(chick_weight.day,chick_weight.weight,alpha=.5) plt.title('Scatter Plot') plt.xlabel('day') plt.ylabel('weight') plt.show() 3차 함수처럼 생겼기 때문에 3차 함수로 만들어서 회귀분석을 해본다. # y = ( a * x^3 ) + ( b * x^2 ) + ( c * x ) + d import statsmodels.formula...

공부 2022.11.21

파이썬 단순선형회귀분석 (feat. 다중회귀분석)

다음 데이터를 이용해 단순선형회귀분석을 해본다. chick_nm : 병아리 이름 weight : 병아리 몸무게 egg_weight : 병아리가 되기 전 알의 무게 movement : 병아리의 하루 평균 이동거리 food : 병아리의 하루 사료량 병아리 이름은 제외하고 데이터를 새로 만든다. chicks_dataset=chicks.iloc[:,1:5] statsmodels.formula.api 라이브러리에 있는 ols() 함수를 이용해 단순선형회귀분석을 해본다. ols() 함수로 모델을 만들고, fit() 함수로 훈련을 시킨 다음, summary() 함수로 결과를 보자. import statsmodels.formula.api as smf model_lr=smf.ols(formula='weight~egg_w..

공부 2022.11.20

파이썬 상관분석

상관분석 correlation analysis 은 두 변수 사이에 어떤 관계가 있는지를 분석하는 방법이다. 상관계수는 -1에서 1 사이의 값을 갖게 된다. 다만 상관계수는 인과관계를 나타내지는 않는다. 5개의 변수를 가진 30개의 데이터가 있다. 이름을 나타내는 첫 번째 변수를 제외하고 나머지 4개의 변수에 대해 상관관계가 있는지 알아보자. 우선 데이터의 전체적인 모양을 한번 보자. chicks.head() chicks.info() 첫번째 열은 이름이므로 제외하고 새로운 데이터를 만들자. chicks_dataset=chicks.ilic[:,1:5] 나머지 4개의 변수들 간에 어떤 상관관계가 있을지 그래프로 시각화해보자. import matplotlib.pyplot as plt import seaborn ..

공부 2022.11.18

파이썬 히스토그램과 박스플롯 그리기

판다스의 데이터프레임을 하나 만든다. 병아리 이름과 몸무게가 한 쌍으로 총 30개의 데이터다. 테이블에서 맨 위 다섯개의 행만 보려면 head() 함수를 이용한다. info() 와 describe() 함수를 통해 테이블의 요약정보를 보자. matplotlyb.pyplot 을 import 해서 히스토그램과 박스플롯을 그려보자. 두 그래프를 한 번에 그릴 수도 있다. 아래 깃허브에 들어가면 코랩 파일을 오픈해 볼 수 있다. 값을 바꿔가면서 해보자. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fi..

공부 2022.11.12

파이썬 데이터프레임을 딕셔너리로 변환하기

csv형식으로 저장된 파일은 파이썬 판다스에서 read_csv()로 읽을 수 있다. 읽어온 파일은 판다스의 데이터프레임 형식으로 저장된다. df=pd.read_csv('파일명.csv') to_dict()를 이용하면 데이터프레임을 딕셔너리 형태로 바꿀 수 있다. dic=df.to_dict('list') to_dict()는 파라미터 값을 변경해서 다양한 형태의 딕셔너리를 만들 수 있다. 깃허브에 올려놓은 코랩을 열어서 하나씩 실행해볼 수 있다. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fiel..

공부 2022.11.09

파이썬 기초 통계량 구하기와 바차트, 파이차트 그리기

여전히 '현장에서 바로 써먹는 데이터 분석 with 파이썬'을 보고 있다. 7개의 부화장과 각 부화장에서 태어난 병아리의 수로 데이터 테이블을 만들었다. 병아리 수 데이터를 이용해 합계, 평균, 표준편차, 중앙값, 최솟값, 최댓값과 같은 기초 통계량을 구해보았다. 데이터 정렬도 간단히 해보았다. 바 차트와 파이차트도 간단하게 그려보고 파라미터 값을 주어 다양하게 만들어보았다. 이 자료도 구글 코랩에 올려놨으니, 결과를 상상해보면서 하나씩 실행해보면 된다. 파라미터를 조금씩 바꿔가면어 다른 결과가 나오는 것을 볼 수 도 있다. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/..

공부 2022.11.07

판다스 결측치 처리하기

파이썬에 seaborn 이라는 라이브러리가 있다. 여기에 penguins 라는 데이터셋이 있다. 이 데이터를 불러와서 결측치 처리하는 실습을 해보았다. penguins 는 7열 344행으로 펭귄에 대한 데이터다. info 를 이용해 데이터를 살펴보면 Non-Null Count에 유효한 값의 개수가 나온다. 전체 344개의 행으로 이루어져 있기 때문에 Non-Null Count 값이 344보다 작다면 그 차이는 결측치라고 볼 수 있다. head(10) 를 이용해서 맨 위 10개의 행으로만 실습을 해보자. isnull 함수를 이용해서 결측치가 있는 값은 True로 표시해서 볼 수도 있다. 결측치는 그냥 두고 처리해도 되겠지만, 결측치가 포함된 행이나 열을 아예 지워버리고 데이터를 처리할 수도 있다. 아니면 ..

공부 2022.10.31

파이선 넘파이 기초 실습

현장에서 써먹는 데이터 분석 with 파이썬 책을 본격적으로 시작하기에 앞서 판다스 실습을 해보고, 깃허브에 코랩 실습 파일을 업로드했다. 이번에는 넘파이다. 아주 간단하게 넘파이로 배열을 생성해 봤다. 1,2,3 차원의 배열을 생성해보고 ndim 함수를 이용해 몇 차원인지 출력해본다. shape 함수를 이용해 몇 곱하기 몇 행렬인지 출력도 해보자. 배열은 좀 헷갈린다. 엑셀과 비슷한 듯하면서 다르다. 행(row)과 열(column)을 부르는 이름은 엑셀과 같다. 가로줄을 하나씩 아래로 읽어나가면 '행'이다. 세로줄을 하나씩 오른쪽으로 읽어나가면 '열'이다. 넘파이 Array 도 함수니까 가장 밖에는 ( ) 로 묶는다. 그 안에 원소는 [ ] 로 묶는다. [ ] 는 하나의 행을 의미한다고 보면 된다. 그..

공부 2022.10.30

현장에서 바로 써먹는 데이터분석 with 파이썬

현장에서 바로 써먹는 데이터 분석 with 파이썬 2022년 6월에 나온 책이다. 그동안 도서관에 갈 때마다 없었는데, 이제야 빌렸다. 데이터 분석이란 무엇인지 처음부터 쭈욱 한 번 맛보기 할 수 있는 책이다. 약 4백 페이지의 책이지만, 빽빽하지 않고 소스 코드와 그림이 많기 때문에 부담은 없어 보인다. 출퇴근하면서 전자책으로 끝까지 한 번 읽어보기만 했던 책이다. 이제 실습을 해봐야겠다. 108 페이까지는 간단한 이론과 파이썬에 대한 설명이므로 109 페이지부터 바로 시작이다. 이 책은 스토리가 있다. 김 대표는 양계장을 운영한다. 병아리를 키우면서 데이터 분석기법을 활용한다. 데이터 분석을 통해 병아리의 몸무게를 예측하고, 성별과 품종을 구분한다. 병아리가 닭이 되고 판매를 하면, 고객 리뷰를 분석..

공부 2022.10.24