colab에서 진행
필요한 패키지, 모듈 임포트
import numpy as np
import pandas as pd
import sklearn
import matplotlib.pyplot as plt
예제용 붓꽃데이터 불러오기
from sklearn.datasets import load_iris
iris = load_iris()
data, label, features를 불러오기 쉽게 변수 지정
dara frame으로 바꿔줍니다.
data = pd.DataFrame(data, columns=columns)
data.head()

학습용, 테스트용으로 데이터 쪼개기.
data에서 x_train : 훈련용 feature, x_test: 테스트용쪼개지고 label에서는 y_train : 훈련용 label, y_test: 테스트용 label이 쪼개지고, test_size는 0.2는 20%를 쪼개고 random_state는 얼마만한 힘으로 데이터를 뒤섞을지 정한다, 값이 자꾸 편향되게 나오면 다른 숫자로 섞어줘라.
from sklearn.model_selection import train_test_split # 쪼개주는 모듈 임포트
X_train, X_test, y_train, y_test = train_test_split(data, label, test_size=0.2, random_state=2023)
'machine_learning' 카테고리의 다른 글
| sklearn_regression 1. 예시용 당뇨병 데이터 정리 (0) | 2023.04.28 |
|---|---|
| sklearn_classification 평가 방법 (0) | 2023.04.28 |
| sklearn_classification 4. Decision Tree(의사결정 나무), Random Forest (0) | 2023.04.28 |
| sklearn_classification 3. Support Vector Machine (0) | 2023.04.28 |
| sklearn_classification 2. Logistic Regression (0) | 2023.04.28 |












