기초 통계 함수 이전 알아야 할 개념 : axis
axis?
다차원 배열의 차원을 나타내는 매개변수.
각 차원(axis)에 따라 연산이 수행되거나 배열의 모양(shape)이 결정된다. axis는 일반적으로 numpy 함수의 매개변수로 사용됩니다. 예를 들어, numpy.sum() 함수의 경우 axis 매개변수는 어느 축(axis)을 따라 합산을 수행할지 지정한다.
axis의 값은 정수이며, 배열의 차원 수에 따라 다릅니다. 예를 들어, 2차원 배열의 경우 axis=0은 행(row) 방향을 의미하고, axis=1은 열(column) 방향을 의미한다. axis=-1은 마지막 차원(axis)을 나타내며, axis=None은 모든 요소를 합산하거나 연산하는 것을 의미한다.
즉 연산기능을 쓸 때 axis = 0일때는 세로축을 구하고, axis = 1일때는 가로축 값을 구한다
대표적인 기초 통계 함수
| sum | 합계 |
| mean | 평균 |
| std | 표준 편차: 데이터들이 기준선에 가까운지 측정할 때 주로 사용하며 정확성을 판단할 때 사용. 허나 데이터가 기준선에 촘촘히 붙어있어보여도 데이터 자체 크기가 크지 않아 설득력 없는 자료일 때도 있으니 유의할 것 |
| var | 분산(std의 제곱), 데이터의 크기가 크지 않을 때 더 자세히 볼 수 있게 해준다 |
| min | 최소값 |
| max | 최대값 |
예시1. 전체 데이터의 합계 / 동일한 항목끼리의 합계 / 동일한 항목끼리의 평균값
print(redwine.sum())
print(redwine.sum(axis=0))
print(redwine.mean(axis=0))
예시2. 각 데이터 항목별 최고점/ 최저점만 뽑기
print(redwine.max(axis=0)) # 최고 점수만 뽑기
print(redwine.min(axis=0)) # 최저 점수만 뽑기
예시3. 0번축만(첫번째 column) 평균 구하기
print(redwine[:,0].mean()) # 전체 데이터 출력인데 0으로 슬라이스 기법으로 0번축만, 평균을 구해라
'python > [modules] Numpy' 카테고리의 다른 글
| 7. 파일을 numpy로 불러오기 (0) | 2023.04.26 |
|---|---|
| 6. ndarray 배열 슬라이싱 하기, 특정 데이터만 골라내기 (0) | 2023.04.26 |
| 5. Numpy 배열의 연산 (0) | 2023.04.26 |
| 4. ndarray 배열의 타입 전환 (0) | 2023.04.26 |
| 3. ndarray 배열의 모양, 차수, 데이터 타입 확인해보기 (0) | 2023.04.26 |