Pandas DataFrame으로 아래 세가지 일을 진행해보자
- 값 뽑아내기
-새로운 항목 추가
-항목 삭제하기
1. 필요한 값만 뽑아내기
(1) column 방식 : 데이터프레임['행이름']
fruitFrame['fruitName']
출력>
0 apple
1 banana
2 cherry
3 peer
Name: fruitName, dtype: object
(1) 속성 방식 : 데이터프레임.속성이름
fruitFrame.fruitName
출력>
0 apple
1 banana
2 cherry
3 peer
Name: fruitName, dtype: object
2. 새로운 항목 추가
데이터프레임['새로운 항목이름'] = 값
fruitFrame['Year'] = 2023 # 존재하지 않는 columns생성
fruitFrame
출력:
fruitPrice num fruitName Year
0 2500 10 apple 2023
1 3800 5 banana 2023
2 6000 3 cherry 2023
3 1200 8 peer 2023
+ 새로 만든 항목 자리에 값이 없으면 NaN값이 들어감
variable = Series([4,2,1], index=[0,2,3])
fruitFrame['stock'] = variable
fruitFrame
출력>
fruitPrice num fruitName Year stock
0 2500 10 apple 2023 4.0
1 3800 5 banana 2023 NaN
2 6000 3 cherry 2023 2.0
3 1200 8 peer 2023 1.
3. 항목 삭제
(1) 항목 자체 삭제
데이터구조명.drop('떨굴 데이터')
<예시용 데이터구조, 시리즈>
fruit = Series([2500,3800,1200,6000],
index=['apple','banana','peer','cherry'])
new_fruit = fruit.drop('banana') # 여러 항목을 숨기고 싶다면 더 써도 좋다 (예시) new_fruit = fruit.drop(['banana','apple'])
new_fruit
출력>
apple 2500
peer 1200
cherry 6000
dtype: int64
이때 알아야 할 점은 banana가 원본 데이터구조에는 살아있다는 것이다.
new_fruit에서만 바나나를 삭제한 데이터를 리턴해준거지, 아예 원본에서 삭제한게 아니다
(2) 값만 삭제하기
데이터구조['삭제할 데이터'] = 0
fruit['banana'] = 0
fruit
출력>
apple 2500
banana 0
peer 1200
cherry 6000
dtype: int64
0으로 초기화 시켜준 것이다
(3) column 삭제하는 방법 : 데이터구조.drop('항목', axis = 0/1)
fruitPrice num
apple 2500 10
banana 3800 5
cherry 6000 3
peer 1200 8
<△예시용 데이터프레임>
fruitFrame.drop('num', axis = 1)
출력>
fruitPrice
apple 2500
banana 3800
cherry 6000
peer 1200
(4) DataFrame 슬라이싱
fruitFrame['banana':'cherry'] # 숫자와 달리 문자는 슬라이싱할때 문자:문자2 에서 문자2까지 포함해줌
출력>
fruitPrice num
banana 3800 5
cherry 6000 3'python > [modules] Pandas' 카테고리의 다른 글
| 7. 데이터의 정렬방법 (0) | 2023.04.26 |
|---|---|
| 6. 데이터의 기본연산 (0) | 2023.04.26 |
| 4. DataFrame 객체를 만들기 (0) | 2023.04.26 |
| 3. Series 객체 다루기 (0) | 2023.04.26 |
| 2. pandas를 임포트 하고 Series를 만들어보자 (0) | 2023.04.26 |