cost function은 모델의 예측과 실제값 간의 차이를 측정하고, w와 b라는 매개변수 값을 최적화하여 훈련 데이터에 가장 적합한 직선을 찾는 데 사용된다. w와 b 값을 조절하여 다양한 직선을 만들 수 있으며, cost function J을 사용하여 예측값과 실제값 간의 차이를 측정할 수 있다. J은 w와 b의 값을 최소화하는 것이 목표이다.


linear regression model 에서 w와 b의 값을 최적화하는 방법에 대한 예시

 

 

간단한 모델에서는 w값만 최적화하며, 이 경우 J은 w의 함수이다. w값이 변화함에 따라 f(x)와 J의 그래프도 변화하게 된다.

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Cost function formula  (0) 2023.04.29
Linear regression model part 2  (0) 2023.04.29
Linear regression model part 1  (0) 2023.04.29
Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27

머신러닝의 기초 - 선형 회귀 한 번에 제대로 이해하기 (30분만 투자해봐요!) - YouTube

이해 도움되는 유투브

 

 

Cost function

모델이 얼마나 잘 작동하는지 보고 더 보완할 수 있다.

학습 알고리즘이 모델의 예측과 실제 값의 차이를 평가하는 방법.


f(x) = wx + b 함수로 돌아가보자.

함수는 아래와 같이 작동한다.

 

그런데 linear model을 학습시킬 때 많은 m(총 x⒤,y⒤ 쌍의 합)중에서서 어떻게 함수 안에 들어갈 w,b 값을 정하게 되는 것일까? 이를 위해 cost function을 알아야 한다. 이제 편의성을 위해 n⒤를 n^i로 대체하여 쓰겠다.

 

(1) y-hat^i에서 y^i의 값을 뺀다 (=error)

(2) error의 값을 제곱한다.

(3) 모든 training set에서의 error 정도를 알기 위해 1부터 시작하는 i의 모든 수(m)를 합한 값을 곱해준다

(4)  다시 1/2m 사이즈로 줄여준다

 

 

이 방식은 squared error cost function이라 부른다.


 

Q. The cost function used for linear regression is


Which of these are the parameters of the model that can be adjusted?

 

 

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Cost function intuition  (0) 2023.04.29
Linear regression model part 2  (0) 2023.04.29
Linear regression model part 1  (0) 2023.04.29
Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27

training set은 features와 targets 정보를 포함하고 이를 알고리듬으로 학습시킨다.

그렇게 되면 어떠한 function(f)이 나온다. 즉 모델이 생기는 것이고 여기에 새로운 input x(feature)를 넣으면

y-hat을 결과로 예측하게 된다.


linear regression은 아래와 같은 함수로 작동한다.

 

fw,b(x) = wx + b

f(x) = wx + b

y = mx + b

여기서 b는 y를 지나는 점(시작점), 이고 m은 기울기를 나타낸다 

 

 

또한 linear regression은 하나의 feature만 가지고 있다.

 

 

Q. For linear regression, the model is represented by .  Which of the following is the output or "target" variable?

 

더보기
y-hat은 estimate한 값이라서 정답이 아닌 것 같다

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Cost function intuition  (0) 2023.04.29
Cost function formula  (0) 2023.04.29
Linear regression model part 1  (0) 2023.04.29
Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27

지도학습에서 우리는 맞는 정답을 가진 데이터로 학습하는 linear regression model로

집값을 예측하는 것을 공부했었다. (그리고 지도학습 중 classification은 카테고리나 가능성 있는 작은 범위 숫자 내에서 예측하는 일을 했었다.)

 

그리고 linear regression model로 그린 그래프는 각각의 x,y축이 data table로 정리될 수 있고 여기서

data set을 두가지로 나눠볼 수 있다.

 

training set :  dataset 중 모델을 훈련시키기 위한 것

test set : 모델에 테스트하기 위한 것

x = feauture, input 

y = target, output 

m = training set의 총합

(x⒤,y⒤) =⒤번째 training set 데이터를 칭할 때

 

 

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Cost function formula  (0) 2023.04.29
Linear regression model part 2  (0) 2023.04.29
Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27
Unsupervised learning part 1  (0) 2023.04.27

coursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.


Jupyter Notebooks

데이터 사이언티스트 실무와 머신 러닝에서 가장 널리 쓰이는 툴.

Jupyter Notebooks에는 두 종류의 셀(cell)이 존재

 

1. Markdown cell : text 작성을 해서 코드를 설명

2. code cell : 셀제로 코드를 입력하는 창, 쉬프트+엔터로 코드를 실행한다.

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Linear regression model part 2  (0) 2023.04.29
Linear regression model part 1  (0) 2023.04.29
Unsupervised learning part 2  (0) 2023.04.27
Unsupervised learning part 1  (0) 2023.04.27
Supervised learning part 2  (0) 2023.04.27

coursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.


 

비지도 학습

input x가 필요하지만 label y는 사용하지 않는다.

알고리즘은 데이터에서 구조를 찾는다.

 

비지도 학습 -  clustering(군집)

비슷한 데이터끼리 그룹핑한다.

 

비지도 학습 -  Anomaly detection(변칙 처리)

비정상적인 데이터(움직임)을 감지

 

비지도 학습 -  Dimensionality reduction(차원의 축소)

데이터를 더 적은 수로 압축시킨다.

 

 

Q. Of the following examples, which would you address using an unsupervised learning algorithm?  (Check all that apply.)

 

1. Given a set of news articles found on the web, group them into sets of articles about the same stories.

2.

Given email labeled as spam/not spam, learn a spam filter.

3. Given a database of customer data, automatically discover market segments and group customers into different market segments.

4. Given a dataset of patients diagnosed as either having diabetes or not, learn to classify new patients as having diabetes or not.

 

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Linear regression model part 1  (0) 2023.04.29
Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 1  (0) 2023.04.27
Supervised learning part 2  (0) 2023.04.27
Supervised learning part 1  (0) 2023.04.27

+ Recent posts