1. 표 불러오기
births = pd.read_csv('https://raw.githubusercontent.com/jakevdp/data-CDCbirths/master/births.csv')
births.head()
출력>
year month day gender births
0 1969 1 1.0 F 4046
1 1969 1 1.0 M 4440
2 1969 1 2.0 F 4454
3 1969 1 2.0 M 4548
4 1969 1 3.0 F 4548
2. 10년 단위 항목을 추가해보기
births['decade'] = births['year'] // 10 * 10 # // 나누고 나머지는 버림(몫)
births.head()
출력>
year month day gender births decade
0 1969 1 1.0 F 4046 1960
1 1969 1 1.0 M 4440 1960
2 1969 1 2.0 F 4454 1960
3 1969 1 2.0 M 4548 1960
4 1969 1 3.0 F 4548 1960
3. 그래프 방향 설정(= 피봇팅) 및 원하는 직계함수(aggfunc)로 표 수정
births.pivot_table('births', index='decade',columns = 'gender',aggfunc='sum')
출력>
gender F M
decade
1960 1753634 1846572
1970 16263075 17121550
1980 18310351 19243452
1990 19479454 20420553
2000 18229309 19106428
4. .plot을 붙여 그래프로 시각화 한다
births.pivot_table('births', index='year',columns = 'gender',aggfunc='sum').plot()

'python > [modules] Pandas' 카테고리의 다른 글
| 10. 데이터 정제 예시 (0) | 2023.04.26 |
|---|---|
| 9. pandas의 핵심기능 'Group by' (0) | 2023.04.26 |
| 8. 웹주소로 csv파일 불러오기, pandas의 기초분석(기술 통계량)과 활용예시 (0) | 2023.04.26 |
| 7. 데이터의 정렬방법 (0) | 2023.04.26 |
| 6. 데이터의 기본연산 (0) | 2023.04.26 |