1. 파일이 없어도 웹상의 csv파일을 불러올 수 있다 pd.read_csv('주소')

german_sample = pd.read_csv('http://freakonometrics.free.fr/german_credit.csv') # 부르기 쉽게 변수로 지정

 

2. 기초분석 (기술 통계량)

count NA를 제외한 개수
min, max 최소 / 최대값
sum
comprod 누적합
mean 평균
median 중앙값
quantile 분위수
var 표본분산
std 표본 정규분산
describe 요약 통계량

 


활용

 

german_sample = pd.read_csv('http://freakonometrics.free.fr/german_credit.csv')

△예시 소스

 

1. 불러온 데이터의 column값만 보기 : list(데이터구조)

list(german_sample.columns.values)

2. 특정 column값만 보기 : 데이터구조[['특정항목']]

german = german_sample[['Creditability', 'Duration of Credit (month)','Purpose','Credit Amount']]

3. 최소값/최대값/평균값 보기 : 데이터구조.min() / 데이터구조.max()

german.min()   
german.max()    
german.mean()

4. 전체 데이터를 맛보기식으로 보여주기 ()를 붙이면 함수가 돼서 다른 분산된 데이터를 보여주니 여기선 ()를 쓰지않는다.

데이터구조.describe

german.describe

 

5. 앞에 5개 데이터만 샘플로 보여주기

데이터구조.head()

german.head()

 

'python > [modules] Pandas' 카테고리의 다른 글

10. 데이터 정제 예시  (0) 2023.04.26
9. pandas의 핵심기능 'Group by'  (0) 2023.04.26
7. 데이터의 정렬방법  (0) 2023.04.26
6. 데이터의 기본연산  (0) 2023.04.26
5. DataFrame을 다뤄보자  (0) 2023.04.26

+ Recent posts