데이터분석
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 6주차 미션데이터분석 2023. 2. 18. 18:07
드디어... 마지막 미션주간이구나. 그런데 뒤 7장이 또 있네?? 그대로 여기까지 왔는데 다음주에 7장 공부를 해봐야 겠다. 요번주는 복잡한 데이터 표현하기이다. https://colab.research.google.com/drive/1ZTQHeghLkhdBVP2vbS2uVAROD0ECuKVK?hl=ko#scrollTo=Dv5yZWjUylP8 Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com 6-1 객체지향 API로 그래프 꾸미기 - pyplot과 객체지향API로 그래프 그리기 pyplot방식은 하나의 figure객체에 데이터를 리스트형태로 전달 제목문자열과 매칭. 아래 예제처럼 하나의 리..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 5주차 미션데이터분석 2023. 2. 9. 23:10
5-1 맷플롯립 기본 요소 알아보기 이번절에서는 맷플롯립을 이용하여 다양한 그래프 조작 방법을 알아보겠습니다. https://colab.research.google.com/drive/1EqQlJ1KWQjW3ZAgV_jB7Y9y3ha9AERe9?hl=ko#scrollTo=hA68XuwfgqDQ Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com - Figure 객체 figure 객체는 모든 그래프 구성요소를 담고 있는 최상위 객체입니다. scatter메소드도 자동으로 figure객체를 리턴합니다. figsize는 그래프의 캔버스 크기를 조절하는 것이라고 생각하고(실제 값은 픽셀을 DPI로 나눠..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 4주차 미션-2데이터분석 2023. 2. 5. 19:32
https://colab.research.google.com/drive/1REWHQE3n9P4e9HTkyUbW7qHtpSop-arj?hl=ko#scrollTo=RQjyIBaKDzJx Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com 04-2 분포 요약하기 전체 데이터를 한눈에 보려면 그래프가 효과적입니다. 데이터를 그림으로 요약하는 산점도(scatter plot),히스토그램(histogram),상자 수염그래프(box-and-whisker plot)를 알아보겠습니다. - 산점도 산점도는 데이터를 흩뿌린 것과 같이 표현하는 그래프입니다.그런데 중첩이 된 걸 잘 알 수가 없습니다.alpha 매개..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 4주차 미션-1데이터분석 2023. 2. 5. 16:57
https://colab.research.google.com/drive/1p1JzeIjM1b7gI05IXmO5pbaldW3XrPp2?hl=ko#scrollTo=bWloj_-llzv8 Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com 4-1 통계로 요약하기 - '기술통계'는 자료의 내용을 압축하여 설명하는 방법. 다른 말로는 '요약 통계'라고 부릅니다. 대표적인 통계량에는 평균, 표준편차 등이 있습니다. 데이터 시각화를 아우르는 이러한 데이터 분석방법을 탐색적 데이터 분석이라고 합니다. - 기술 통계 구하기 describe 메소드는 갯수, 평균, 표준편차, 최소,최대값, 일렬로 세웠을 때 2..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 3주차 미션데이터분석 2023. 1. 24. 01:28
3-1 불필요한 데이터 삭제하기 데이터에서 불필요한 부분을 제거하고 불완전한 값을 교체하는 등의 작업을 'data cleaning'(데이터 정제)라고 한다. - 열 삭제하기 drop은 데이터프레임에서 행과 열을 삭제하는 메소드이다. default는 axis=0으로 행이고 axis=1이면 열을 나타낸다. 리스트를 전달하여 여러개의 열을 삭제할 수도 있다. inplace 매개변수로 데이터프레임을 다른 변수에 저장하지 않고 바고 update할 수도 있다. - NaN 데이터 없애기 - 행 삭제하기 - 중복 된 행 찾기 1. 모든 열을 기준으로 중복 체크 따라서 애초에 중복이 될 수 없다. 번호열에서 중복이 나올 수 없기에 따라서 몇가지 열을 기준으로 중복을 체크할 수 있다. 2. keep매개변수를 False로 ..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 2주차 미션데이터분석 2023. 1. 15. 16:34
2주차 내용은 데이터 수집하기이다. 데이터가 수집이 안된다면 분석이 무슨 의미가 있을까? 2장은 2-1) API사용하기와 2-2) 웹스크래핑사용하기로 나누어져 있다. 2-1 API 사용하기 - API란? - 두 프로그램 사이에서 데이터를 주고 받는 방법? 규칙을 의미. 대표적인 예로 Web API가 있다. - 웹페이지를 전송하기 위한 통신 규약과 웹페이지 문서 : HTTP, HTML - WEB 서비스를 제공하기 위해서는 서버 소프트웨어가 필요하다. 대표적으로 NGINX, Apache가 존재한다. 이 서버 소프트웨어는 HTTP라는 프로토콜 기반으로 웹상에서 통신한다. - HTTP는 인터넷에서 웹페이지를 전송하는 기본 통신방법이고 HTML은 웹페이지를 구성하는 표준 언어이다. - Web API에서의 데이터 ..
-
[혼공학습단 9기]혼자 공부하는 데이터 분석 with 파이썬 1주차 미션데이터분석 2023. 1. 6. 18:15
1주차라 가볍게 진행했다. 오히려 데이터 분석,과학이 무엇인지 알아서 좋았던 시간이다. - 데이터 분석 : 탐색, 결정, 정제 - 데이터 과학 : 데이터 분석, 통계, 머신러닝, 데이터 마이닝. - 데이터 분석에서 통계학이란 : 기술통계, 탐색적 데이터 분석, 가설검정. - 데이터 분석가는 프로그래밍, 통계학, 비지니스 지식을 골고루 갖춘 사람. - 데이터 마이닝 vs 머신러닝 : 데이터 마이닝은 데이터에서 패턴 또는 지식 찾는 것. 머신러닝은 데이터에서 자동으로 규칙을 학습하여 문제를 해결하는 소프트웨어
-