공부 78

파이썬 히스토그램과 박스플롯 그리기

판다스의 데이터프레임을 하나 만든다. 병아리 이름과 몸무게가 한 쌍으로 총 30개의 데이터다. 테이블에서 맨 위 다섯개의 행만 보려면 head() 함수를 이용한다. info() 와 describe() 함수를 통해 테이블의 요약정보를 보자. matplotlyb.pyplot 을 import 해서 히스토그램과 박스플롯을 그려보자. 두 그래프를 한 번에 그릴 수도 있다. 아래 깃허브에 들어가면 코랩 파일을 오픈해 볼 수 있다. 값을 바꿔가면서 해보자. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fi..

공부 2022.11.12

파이썬 데이터프레임을 딕셔너리로 변환하기

csv형식으로 저장된 파일은 파이썬 판다스에서 read_csv()로 읽을 수 있다. 읽어온 파일은 판다스의 데이터프레임 형식으로 저장된다. df=pd.read_csv('파일명.csv') to_dict()를 이용하면 데이터프레임을 딕셔너리 형태로 바꿀 수 있다. dic=df.to_dict('list') to_dict()는 파라미터 값을 변경해서 다양한 형태의 딕셔너리를 만들 수 있다. 깃허브에 올려놓은 코랩을 열어서 하나씩 실행해볼 수 있다. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/Data_analysis_that_can_be_used_right_in_the_fiel..

공부 2022.11.09

파이썬 기초 통계량 구하기와 바차트, 파이차트 그리기

여전히 '현장에서 바로 써먹는 데이터 분석 with 파이썬'을 보고 있다. 7개의 부화장과 각 부화장에서 태어난 병아리의 수로 데이터 테이블을 만들었다. 병아리 수 데이터를 이용해 합계, 평균, 표준편차, 중앙값, 최솟값, 최댓값과 같은 기초 통계량을 구해보았다. 데이터 정렬도 간단히 해보았다. 바 차트와 파이차트도 간단하게 그려보고 파라미터 값을 주어 다양하게 만들어보았다. 이 자료도 구글 코랩에 올려놨으니, 결과를 상상해보면서 하나씩 실행해보면 된다. 파라미터를 조금씩 바꿔가면어 다른 결과가 나오는 것을 볼 수 도 있다. GitHub - gimpapa/Data_analysis_that_can_be_used_right_in_the_field_with_Python Contribute to gimpapa/..

공부 2022.11.07

판다스 결측치 처리하기

파이썬에 seaborn 이라는 라이브러리가 있다. 여기에 penguins 라는 데이터셋이 있다. 이 데이터를 불러와서 결측치 처리하는 실습을 해보았다. penguins 는 7열 344행으로 펭귄에 대한 데이터다. info 를 이용해 데이터를 살펴보면 Non-Null Count에 유효한 값의 개수가 나온다. 전체 344개의 행으로 이루어져 있기 때문에 Non-Null Count 값이 344보다 작다면 그 차이는 결측치라고 볼 수 있다. head(10) 를 이용해서 맨 위 10개의 행으로만 실습을 해보자. isnull 함수를 이용해서 결측치가 있는 값은 True로 표시해서 볼 수도 있다. 결측치는 그냥 두고 처리해도 되겠지만, 결측치가 포함된 행이나 열을 아예 지워버리고 데이터를 처리할 수도 있다. 아니면 ..

공부 2022.10.31

파이선 넘파이 기초 실습

현장에서 써먹는 데이터 분석 with 파이썬 책을 본격적으로 시작하기에 앞서 판다스 실습을 해보고, 깃허브에 코랩 실습 파일을 업로드했다. 이번에는 넘파이다. 아주 간단하게 넘파이로 배열을 생성해 봤다. 1,2,3 차원의 배열을 생성해보고 ndim 함수를 이용해 몇 차원인지 출력해본다. shape 함수를 이용해 몇 곱하기 몇 행렬인지 출력도 해보자. 배열은 좀 헷갈린다. 엑셀과 비슷한 듯하면서 다르다. 행(row)과 열(column)을 부르는 이름은 엑셀과 같다. 가로줄을 하나씩 아래로 읽어나가면 '행'이다. 세로줄을 하나씩 오른쪽으로 읽어나가면 '열'이다. 넘파이 Array 도 함수니까 가장 밖에는 ( ) 로 묶는다. 그 안에 원소는 [ ] 로 묶는다. [ ] 는 하나의 행을 의미한다고 보면 된다. 그..

공부 2022.10.30

현장에서 바로 써먹는 데이터분석 with 파이썬

현장에서 바로 써먹는 데이터 분석 with 파이썬 2022년 6월에 나온 책이다. 그동안 도서관에 갈 때마다 없었는데, 이제야 빌렸다. 데이터 분석이란 무엇인지 처음부터 쭈욱 한 번 맛보기 할 수 있는 책이다. 약 4백 페이지의 책이지만, 빽빽하지 않고 소스 코드와 그림이 많기 때문에 부담은 없어 보인다. 출퇴근하면서 전자책으로 끝까지 한 번 읽어보기만 했던 책이다. 이제 실습을 해봐야겠다. 108 페이까지는 간단한 이론과 파이썬에 대한 설명이므로 109 페이지부터 바로 시작이다. 이 책은 스토리가 있다. 김 대표는 양계장을 운영한다. 병아리를 키우면서 데이터 분석기법을 활용한다. 데이터 분석을 통해 병아리의 몸무게를 예측하고, 성별과 품종을 구분한다. 병아리가 닭이 되고 판매를 하면, 고객 리뷰를 분석..

공부 2022.10.24

코딩 부트캠프 with 파이썬

이 책은 파이썬 입문서다. 입문서 중에서도 쉬운 편에 속하는 것 같다. 예전에 파이썬 입문서로 유명한 '점프 투 파이썬'을 읽은 적이 있었는데, 양이 꽤 많았던 걸로 기억한다. 끝까지 집중력 있게 읽지 못했다. 그에 비해 이 책은 내용도 간결하고 따라 해 보는 예제도 많지 않다. 2017년도 책인 게 단점이지만, 이후의 최신 정보를 업데이트할 필요가 없을 정도로 기초적인 내용이다. 금방 끝내고 본격적인 파이썬 입문서를 하나 시작해보자. 마음 먹으면 하루면 다 볼 수 있다. 틈틈이 봐도 일주일을 안에 다 볼 수 있다. 그럴 바에는 처음부터 '점프 투 파이썬' 같은 입문서를 읽으면 되지 않겠냐고 반문할 수도 있다. 그저 개인 취향이다. 전체적으로 한 번 쭈욱 훑어보기 위한 목적도 있고, 책 한 권 다 읽었다..

공부 2022.09.25

파이썬 입문 강의 추천, 프로그래머스 스쿨

프로그래머스 스쿨에서 파이썬 입문 강의를 하나 완료했다. 다 듣고 나서 장점을 적어본다. 1. 내가 수강 완료한 '파이썬 입문'은 무료 강의다. 2. 한 강의가 평균 5분 내외로 잠깐 집중해서 들을 수 있다. 3. 진도가 나갈 때마다 문제 풀이가 있어서 배운 내용을 바로 복습할 수 있다. 4. 문제 풀이(실습)는 빈칸을 채우거나 특정 부분의 코드를 작성해 볼 수 있게 되어 있어 초보에게 좋다. 프로그래머스 스쿨은 구글 계정이 있으면 바로 연동해서 로그인할 수 있다. 홈페이지에 접속하면 이어 보기 버튼이 있어서 언제든지 바로 듣던 강의를 이어서 들을 수 있다. 다만 2016년 강의라 업데이트 해야 할 내용이 살짝 눈에 띄었다는 점은 조금 아쉽다. 하지만 나 같은 초보에게는 그리 중요한 내용은 아닌 것 같다..

공부 2022.09.24

AI 공부, 파이썬 선택

AI는 코딩을 몰라도 활용할 수 있다. 코딩 대신 마우스 클릭으로 데이터를 업로드하고, 데이터를 정제하고, 알고리즘을 선택하고 결과를 확인하는 개발환경을 이용할 수 있기 때문이다. 하지만 이런 개발환경은 아무 때나 이용할 수 있는 게 아니다. 그리고 지금은 실무적으로 활용을 하는 단계가 아니라 학습을 하는 단계이므로 코딩부터 차근차근 공부해보려 한다. 코딩 언어로는 파이썬을 선택했다 프로그래밍 언어는 종류도 많고 나름대로 장단점이 있다. 그 중에서 파이썬을 선택한 이유는 책이나 동영상 강의가 많기 때문이다. 유튜브에도 좋은 파이썬 강의가 많고, 도서관에도 파이썬 책이 많다. 다른 좋은 언어도 많지만 상대적으로 배우기 쉽고 관련 자료를 구하기도 쉽다. 무료이고 라이브러리도 많고 템플릿을 구하기도 어렵지 않..

공부 2022.08.17

외환전문역2종 시험개요

한국금융연수원에서 주관하는 자격증이다. 기업 외환과 관련된 직무에서 필요한 능력을 테스트한다. 수출입 업무와 이와 관련된 국제무역규칙 그리고 외환과 관련된 여신업무가 여기에 속한다. 응시자격은 제한 없으며 시험은 2시간이며, 객관식 4지 선다형으로만 출제된다. 시험은 총 3과목이며 평균 60점 이상을 얻어야 한다. 과목당 40점 이상을 받아야 하므로 과락에 주의해야 한다. 1과목 수출입실무 : 35문제, 50점 2과목 국제무역규칙 : 25문제, 30점 3과목 외환관련여신 : 20문제, 20점 1과목 수출입실무 수출입 실무에 대한 기초지식, 수입 실무, 수출 실무에 대한 내용을 묻는다. 배점이 가장 높다. 2과목 국제무역규칙에 근거하여 업무처리를 하기 때문에 1과목을 열심히 하면 2과목에도 큰 도움이 된다..

공부 2022.02.05