반응형

numpy.nb.zip
0.00MB

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

저장을 하게 되면 data폴더 내에 thiees.csv 파일이 생기게 됩니다.

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

 

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

원래 인스톨 해줘야 하지만 우리는 아나콘다를 사용하고 있고 아나콘다 내부에 Matplotlib가 있기 때문에 

따로 설치해 줄 필요는 없습니다.

 

 

# Matplotlib 를 이용한 시각화
life_exp = df.groupby('year')['lifeExp'].mean() #Plot의 y축 데이터
life_exp.head()

 

%matplotlib inline   # notebook 안에다가 그래프를 그려줌.
#차트를 그려 봅니다.
# matplitlib를 임포트하면 DataFrame 내에 차트 메서드들이 동적으로 추가됩니다.
import matplotlib.pyplot as plt
# 별칭으로 plt를 사용하겠습니다.
life_exp.plot()

 

 

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

year

year로 그루핑

 

그룹핑된 데이터 셋의 기초 통계량 계산

 

여러 콜럼의 산술 평균

반응형
블로그 이미지

꽃꽂이하는개발자

,
반응형

Pandas는 데이터 분석을 위한 파이썬 라이브러리입니다.

data.zip
0.03MB

위의 data.zip은 우리가 예제로 사용할 압축파일입니다.

이 압축파일을 사용하시는 jupyter폴더에 압축을 풀어주세요

쥬피터를 실행하시면 됩니다. 아래와 같은 화면이 나옵니다.

data를 확인해 보겠습니다.

이걸 확인하면 아래와 같은 정보가 있습니다.

이걸 가지고 실습을 시작하겠습니다.

 

메인화면에서 new - python3을 만들어 주겠습니다.

head()함수 : 앞에서부터 출력합니다. 기본값은 앞에서 5줄을 추출합니다.

tail()함수: 뒤에서부터 출력합니다. 기본은 5줄

type() 함수 : 데이터 타입의 확인

.clumns  : 어떠한 콜럼들을 가지고 있는가?

info() : 전반적인 정보 확인

.types : 자료형을 확인합니다.

단일 컬럼을 추출합니다.

복수개의 컬럼을 추출합니다.

특정 행을 추출합니다.

역 인덱싱

콜럼의 범위 지정

 

반응형
블로그 이미지

꽃꽂이하는개발자

,

Jupyter Notebook

2020/Python 2019. 11. 22. 16:36
반응형

Jupyter Notebook은 web을 통하여 파이썬 코드를 작성하고 실행해 볼 수 있는 개발도구이다.

만약 자신이 아나콘다(Anaconda)를 설치해서 사용하고 있다면 함께 설치되어 Jupyter를 사용할 수 있다.

하지만 아나콘다를 사용하지 않는 경우 pip를  통해 Jupyter 패키지를 설치할 수 있다.

 

아나콘다를 사용할 경우 자신이 사용할 폴더에 새로운 텍스트 파일을 만들어 준다.

이곳에 가상환경 세팅을 해 줍니다

activate bitenv && jupyter notebook .

이렇게 입력해주고 저장한 후 파일명과 확장자명을 바꿔주었습니다.

더블클릭 하게 되면

 

이러한 창이 뜨게 됩니다.

이때 cmd창을 끄면 안됩니다. 끄면 쥬피터도 꺼집니다.

 

그 후에 Beautiful Soup를 설치해 보겠습니다

Beautiful Soup 라이브러리는 Python에서 기본적으로 제공하는 라이브러리가 아니기 때문에 별도의 설치가 필요합니다

cmd창을 열고 (윈도우+r을 눌러 cmd를 입력) pip install bs4를 입력하시면 설치가 됩니다

(pip는 Python 설치 디렉토리의 Scirpts 폴더 밑에 있어서 해당 위치로 이동하여 명령어를 실행해주세요)

 

 

반응형
블로그 이미지

꽃꽂이하는개발자

,