반응형

아나콘다에는 seaborn이 있어서 따로 설치해주지 말고 import만 해주면 됩니다 (예전 anaconda는 없을 수도 있음)

데이터를 시각화 해보도록 합니다.

 

산점도 그래프

박스 그래프

히스토그램

 

Pie chart

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

numpy.nb.zip
0.00MB

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

저장을 하게 되면 data폴더 내에 thiees.csv 파일이 생기게 됩니다.

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

 

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

원래 인스톨 해줘야 하지만 우리는 아나콘다를 사용하고 있고 아나콘다 내부에 Matplotlib가 있기 때문에 

따로 설치해 줄 필요는 없습니다.

 

 

# Matplotlib 를 이용한 시각화
life_exp = df.groupby('year')['lifeExp'].mean() #Plot의 y축 데이터
life_exp.head()

 

%matplotlib inline   # notebook 안에다가 그래프를 그려줌.
#차트를 그려 봅니다.
# matplitlib를 임포트하면 DataFrame 내에 차트 메서드들이 동적으로 추가됩니다.
import matplotlib.pyplot as plt
# 별칭으로 plt를 사용하겠습니다.
life_exp.plot()

 

 

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

year

year로 그루핑

 

그룹핑된 데이터 셋의 기초 통계량 계산

 

여러 콜럼의 산술 평균

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

Pandas는 데이터 분석을 위한 파이썬 라이브러리입니다.

data.zip
0.03MB

위의 data.zip은 우리가 예제로 사용할 압축파일입니다.

이 압축파일을 사용하시는 jupyter폴더에 압축을 풀어주세요

쥬피터를 실행하시면 됩니다. 아래와 같은 화면이 나옵니다.

data를 확인해 보겠습니다.

이걸 확인하면 아래와 같은 정보가 있습니다.

이걸 가지고 실습을 시작하겠습니다.

 

메인화면에서 new - python3을 만들어 주겠습니다.

head()함수 : 앞에서부터 출력합니다. 기본값은 앞에서 5줄을 추출합니다.

tail()함수: 뒤에서부터 출력합니다. 기본은 5줄

type() 함수 : 데이터 타입의 확인

.clumns  : 어떠한 콜럼들을 가지고 있는가?

info() : 전반적인 정보 확인

.types : 자료형을 확인합니다.

단일 컬럼을 추출합니다.

복수개의 컬럼을 추출합니다.

특정 행을 추출합니다.

역 인덱싱

콜럼의 범위 지정

 

반응형
블로그 이미지

꽃꽂이하는개발자

,