1. 표 불러오기

births = pd.read_csv('https://raw.githubusercontent.com/jakevdp/data-CDCbirths/master/births.csv')
births.head()
     
출력>
year	month	day	gender	births
0	1969	1	1.0	F	4046
1	1969	1	1.0	M	4440
2	1969	1	2.0	F	4454
3	1969	1	2.0	M	4548
4	1969	1	3.0	F	4548

 

2. 10년 단위 항목을 추가해보기

births['decade'] = births['year'] // 10 * 10        # // 나누고 나머지는 버림(몫)
births.head()

출력>
	year	month	day	gender	births	decade
0	1969	1	1.0	F	4046	1960
1	1969	1	1.0	M	4440	1960
2	1969	1	2.0	F	4454	1960
3	1969	1	2.0	M	4548	1960
4	1969	1	3.0	F	4548	1960

 

3. 그래프 방향 설정(= 피봇팅) 및 원하는 직계함수(aggfunc)로 표 수정

births.pivot_table('births', index='decade',columns = 'gender',aggfunc='sum')

출력>
gender	F	M
decade		
1960	1753634	1846572
1970	16263075	17121550
1980	18310351	19243452
1990	19479454	20420553
2000	18229309	19106428

 

4. .plot을 붙여 그래프로 시각화 한다

births.pivot_table('births', index='year',columns = 'gender',aggfunc='sum').plot()

+ Recent posts