colab에서 진행


필요한 패키지, 모듈 임포트

import numpy as np                           
import pandas as pd
import sklearn 
import matplotlib.pyplot as plt

예제용 붓꽃데이터 불러오기

from sklearn.datasets import load_iris         
iris = load_iris()

data, label, features를 불러오기 쉽게 변수 지정

더보기
data = iris.data                    # 전체 feature 데이터
label = iris.target                  # 꽃 세가지 라벨 정보
columns = iris.feature_names          #각 칼럼의 항목 이름

dara frame으로 바꿔줍니다.

data = pd.DataFrame(data, columns=columns)
data.head()

 

학습용, 테스트용으로 데이터 쪼개기.

 data에서  x_train : 훈련용 feature, x_test: 테스트용쪼개지고 label에서는 y_train : 훈련용 label, y_test: 테스트용 label이 쪼개지고, test_size는 0.2는 20%를 쪼개고 random_state는 얼마만한 힘으로 데이터를 뒤섞을지 정한다, 값이 자꾸 편향되게 나오면 다른 숫자로 섞어줘라.

from sklearn.model_selection import train_test_split    # 쪼개주는 모듈 임포트
  X_train, X_test, y_train, y_test = train_test_split(data, label, test_size=0.2, random_state=2023)

 

 

+ Recent posts