Pandas DataFrame으로 아래 세가지 일을 진행해보자

 

- 값 뽑아내기

-새로운 항목 추가

-항목 삭제하기

 


1. 필요한 값만 뽑아내기 

 

(1) column 방식 : 데이터프레임['행이름']

fruitFrame['fruitName']

출력>
0     apple
1    banana
2    cherry
3      peer
Name: fruitName, dtype: object

(1) 속성 방식 : 데이터프레임.속성이름

fruitFrame.fruitName

출력>
0     apple
1    banana
2    cherry
3      peer
Name: fruitName, dtype: object

 


2. 새로운 항목 추가

데이터프레임['새로운 항목이름'] = 값

 

fruitFrame['Year'] = 2023     # 존재하지 않는 columns생성
fruitFrame

출력:
	fruitPrice	num	fruitName	Year
0	2500	10	apple	2023
1	3800	5	banana	2023
2	6000	3	cherry	2023
3	1200	8	peer	2023

+ 새로 만든 항목 자리에 값이 없으면 NaN값이 들어감

variable = Series([4,2,1], index=[0,2,3])  
fruitFrame['stock'] = variable
fruitFrame

출력>

fruitPrice	num	fruitName	Year	stock
0	2500	10	apple	2023	4.0
1	3800	5	banana	2023	NaN
2	6000	3	cherry	2023	2.0
3	1200	8	peer	2023	1.

3. 항목 삭제

(1) 항목 자체 삭제

데이터구조명.drop('떨굴 데이터')

<예시용 데이터구조, 시리즈>

fruit = Series([2500,3800,1200,6000],
               index=['apple','banana','peer','cherry'])
new_fruit = fruit.drop('banana')        # 여러 항목을 숨기고 싶다면 더 써도 좋다 (예시) new_fruit = fruit.drop(['banana','apple'])  
new_fruit                              

출력>
apple     2500
peer      1200
cherry    6000
dtype: int64

이때 알아야 할 점은 banana가 원본 데이터구조에는 살아있다는 것이다.

new_fruit에서만 바나나를 삭제한 데이터를 리턴해준거지, 아예 원본에서 삭제한게 아니다

(2) 값만 삭제하기

데이터구조['삭제할 데이터'] = 0

fruit['banana'] = 0
fruit

출력>
apple     2500
banana       0
peer      1200
cherry    6000
dtype: int64

0으로 초기화 시켜준 것이다

 

(3) column 삭제하는 방법 : 데이터구조.drop('항목', axis = 0/1)

fruitPrice	num
apple	2500	10
banana	3800	5
cherry	6000	3
peer	1200	8

<△예시용 데이터프레임>

fruitFrame.drop('num', axis = 1)   

출력>

fruitPrice
apple	2500
banana	3800
cherry	6000
peer	1200

(4) DataFrame 슬라이싱

fruitFrame['banana':'cherry']  # 숫자와 달리 문자는 슬라이싱할때 문자:문자2 에서 문자2까지 포함해줌

출력>
fruitPrice	num
banana	3800	5
cherry	6000	3

'python > [modules] Pandas' 카테고리의 다른 글

7. 데이터의 정렬방법  (0) 2023.04.26
6. 데이터의 기본연산  (0) 2023.04.26
4. DataFrame 객체를 만들기  (0) 2023.04.26
3. Series 객체 다루기  (0) 2023.04.26
2. pandas를 임포트 하고 Series를 만들어보자  (0) 2023.04.26

DataFrame ?

Series가 여러개 묶인 것

 


DataFrame 만들기(1)

기본적인 방법, 시리즈를 만들어줄 때와 다르게 데이터프레임을 만들 때는 인덱스가 먼저오고 그다음에 값들이 온다.

fruitData = {'fruitName':['apple','banana','cherry','peer'],
 'fruitPrice':[2500,3800,6000,1200],
 'num':[10,5,3,8]
 }
 
 
 출력>
 DataFrame(fruitData)  

fruitName	fruitPrice	num
0	apple	2500	10
1	banana	3800	5
2	cherry	6000	3
3	peer	1200	8

 

DataFrame 만들기(2)

필요하다면 column의 순서를 바꿔주기

fruitFrame = DataFrame(fruitData, columns = ['fruitPrice','num','fruitName'])
fruitFrame


출력>
fruitPrice	num	fruitName
0	2500	10	apple
1	3800	5	banana
2	6000	3	cherry
3	1200	8	peer

 

'python > [modules] Pandas' 카테고리의 다른 글

6. 데이터의 기본연산  (0) 2023.04.26
5. DataFrame을 다뤄보자  (0) 2023.04.26
3. Series 객체 다루기  (0) 2023.04.26
2. pandas를 임포트 하고 Series를 만들어보자  (0) 2023.04.26
1. pandas란?  (0) 2023.04.26

 예시용 Series

fruit = Series([2500,3800,1200,6000], index=['apple','banana','peer','cherry'])     # 시리즈 객체 생성
fruit

출력>
apple     2500
banana    3800
peer      1200
cherry    6000
dtype: int64

 

Pandas Series로 아래 두 가지를 진행해봅시다. 

 

(1) 값 or 인덱스만 뽑기

(2) Series에 이름 붙이기


(1)값 or 인덱스만 뽑기

print(fruit.values)           # 값만 뽑기
print(fruit.index)            # 인덱스만 뽑기

출력>
[2500 3800 1200 6000]
Index(['apple', 'banana', 'peer', 'cherry'], dtype='object')

 

(2)Series에 이름 붙이기

fruit.name = 'fruitPrice'
fruit.index.name = 'fruitName'            # clumm의 이름 = 색인
print(fruit)

출력>
fruitName
apple     2500
banana    3800
peer      1200
cherry    6000
Name: fruitPrice, dtype: int64

'python > [modules] Pandas' 카테고리의 다른 글

6. 데이터의 기본연산  (0) 2023.04.26
5. DataFrame을 다뤄보자  (0) 2023.04.26
4. DataFrame 객체를 만들기  (0) 2023.04.26
2. pandas를 임포트 하고 Series를 만들어보자  (0) 2023.04.26
1. pandas란?  (0) 2023.04.26

1. import 방법

import pandas as pd                    #pandas 임포트 및 별명 명명
from pandas import Series, DataFrame   #두가지 모듈 부르기 , 엑셀과 비슷한 기능을 해준다

 

2. Series 생성방법 (1)

값과 인덱스를 차례로 []에 넣어주면 됩니다. 인덱스가 뒤에 오는걸 유의

fruit = Series([2500,3800,1200,6000], index=['apple','banana','peer','cherry'])     # 시리즈 객체 생성
fruit

출력>
apple     2500
banana    3800
peer      1200
cherry    6000
dtype: int64

 

Series 생성방법 (2) 딕셔너리로 만들기

 Series(딕셔너리이름) 해주면 됩니다

fruitData = {'apple':2500, 'banana':3800, 'peer':1200, 'cherry':6000}
print(type(fruitData))
fruit = Series(fruitData)
print(type(fruit))
print(fruit)

출력>
<class 'dict'>
<class 'pandas.core.series.Series'>
apple     2500
banana    3800
peer      1200
cherry    6000
dtype: int64

'python > [modules] Pandas' 카테고리의 다른 글

6. 데이터의 기본연산  (0) 2023.04.26
5. DataFrame을 다뤄보자  (0) 2023.04.26
4. DataFrame 객체를 만들기  (0) 2023.04.26
3. Series 객체 다루기  (0) 2023.04.26
1. pandas란?  (0) 2023.04.26

Pandas

1. 데이터를 전처리할 때 가장 많이 사용하는 모듈, numpy의 확장

2. 두가지 객체를 만들 수 있는데, Series 객체는 인덱스(색인)-밸류(값)이 있는 하나의 column, 이 시리즈들이 쭈루룩 붙으면 하나의 표가 될 텐데 그러면 그게 Data frame 객체입니다.

거꾸로 말하자면 데이터 프레임 안에 요소 하나하나는 numpy로 이뤄져있고 이 numpy 요소를 하나하나 모으면 시리즈 객체, 시리즈를 모으면 데이터 프레임입니다.

'python > [modules] Pandas' 카테고리의 다른 글

6. 데이터의 기본연산  (0) 2023.04.26
5. DataFrame을 다뤄보자  (0) 2023.04.26
4. DataFrame 객체를 만들기  (0) 2023.04.26
3. Series 객체 다루기  (0) 2023.04.26
2. pandas를 임포트 하고 Series를 만들어보자  (0) 2023.04.26

+ Recent posts