1. 파일이 없어도 웹상의 csv파일을 불러올 수 있다 pd.read_csv('주소')
german_sample = pd.read_csv('http://freakonometrics.free.fr/german_credit.csv') # 부르기 쉽게 변수로 지정
2. 기초분석 (기술 통계량)
| count | NA를 제외한 개수 |
| min, max | 최소 / 최대값 |
| sum | 합 |
| comprod | 누적합 |
| mean | 평균 |
| median | 중앙값 |
| quantile | 분위수 |
| var | 표본분산 |
| std | 표본 정규분산 |
| describe | 요약 통계량 |
활용
german_sample = pd.read_csv('http://freakonometrics.free.fr/german_credit.csv')
△예시 소스
1. 불러온 데이터의 column값만 보기 : list(데이터구조)
list(german_sample.columns.values)
2. 특정 column값만 보기 : 데이터구조[['특정항목']]
german = german_sample[['Creditability', 'Duration of Credit (month)','Purpose','Credit Amount']]
3. 최소값/최대값/평균값 보기 : 데이터구조.min() / 데이터구조.max()
german.min()
german.max()
german.mean()
4. 전체 데이터를 맛보기식으로 보여주기 ()를 붙이면 함수가 돼서 다른 분산된 데이터를 보여주니 여기선 ()를 쓰지않는다.
데이터구조.describe
german.describe
5. 앞에 5개 데이터만 샘플로 보여주기
데이터구조.head()
german.head()
'python > [modules] Pandas' 카테고리의 다른 글
| 10. 데이터 정제 예시 (0) | 2023.04.26 |
|---|---|
| 9. pandas의 핵심기능 'Group by' (0) | 2023.04.26 |
| 7. 데이터의 정렬방법 (0) | 2023.04.26 |
| 6. 데이터의 기본연산 (0) | 2023.04.26 |
| 5. DataFrame을 다뤄보자 (0) | 2023.04.26 |