ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 🤖Machine Learning?
    머신러닝 2024. 2. 20. 14:48

    머신러닝을 공부하기 전에 머신러닝(Machine Learning)과 인공지능(Artificial Intelligence), 딥러닝(Deep Learning) 간의 차이와 특징이 무엇인지 알고 가자.

    인공지능 ⊃ 머신러닝 ⊃ 딥러닝 순으로 포함되는 관계로 인공지능이 가장 큰 범주에 속한다.

    인공지능은 사람을 표현하는 기계의 모든 것으로 사람을 흉내 낼 수 있는 기술이나 알고리즘 같은 모든 것을 인공지능이라고 한다.

    반면 머신러닝은 전문가가 준 데이터를 기계가 학습하는 것으로 정의할 수 있다.

    따라서 머신러닝은 전문가(사람), 데이터, 학습할 기계가 필요하고 사람이 준 데이터를 기계가 학습할 수 있도록 알고리즘을 설계하고 구현하는 것이다.

    딥러닝은 머신러닝과 마찬가지로 전문가가 준 데이터를 기계가 학습하는 것이지만 그 기계가 어떤 '신경망'이라 하는 구조를 가진 기계가 학습을 하는 것이 차이점이다.

     

    💡머신러닝과 딥러닝의 가장 큰 차이점

    조금 더  통계적이고 작은 구조의 기계를 사용하는 것이 머신 러닝.

    신경망이라는 굉장히 크기가 큰 기계(학습을 시켜야하는 파라미터의 수가 굉장히 많다)를 사용하는 것이 딥러닝.

    파라미터가 많으면 관계를 표현할 수 있는 능력이 커지고, 능력이 커지면 더욱 좋은 모델을 뽑을 수 있지만 파라미터가 크게 되면 데이터 수가 굉장히 많아야하고 최적화 연산을 할 수 있는 속도도 빨라야 한다.

    ** 실제, 기업에서 사용할 경우에는 데이터가 굉장히 적고 연산 속도도 신경써여 할 경우도 많기에 딥러닝이라도 룰 베이스드나 머신러닝의 모델을 사용하기도 한다.

     

    머신 러닝은(Machine Learning)이라는 단어에서 할 수 있듯이 기계를 학습하는 것이다.

    여기서 기계는 인간이 제공한 데이터에 존재하는 관계/관계식을 표현할 수 있는 모델(=함수 * 피처와 라벨 사이의 관계식), 학습은 데이터를 가장 잘 표현할 수 있는 모델을 찾는 것(= 모델의 파라미터 최적화)를 의미한다.

    ** 앞에서 말했듯 모델은 함수를 의미하고 만일, y = ax+b라는 함수를 가정하면 기울기 a와 절편 b값을 알 수 있고 이 두 가지 가중치를 파라미터라고 한다.

    학습은 통계적인(경사하강법), 수학적인 방법을 통해 최적의 파라미터를 찾는 것을 통해 수행된다.

     

    어떤 형태의 데이터가 머신에게 주어지는지에 따라 머신 러닝의 분야를 나눠볼 수 있다.

     데이터의 형태가 피처와 라벨처럼 주어지는 것을 '지도 학습'을 한다라고 얘기하고( 라벨이라는 정답지가 존재하는 상황)

    정답지가 존재하지 않는 상황을 '비지도 학습'이라 한다. (모든 라벨 데이터를 얻기는 현실적으로 불가능하기에)

    머신 러닝에서는 보통 비지도 학습을 위해 데이터가 들어왔을 때, 클러스터링(군집화)이나  차원 축소를 수행한다.

    ** 데이터(피처)가 매우 커 모델 학습에 들어가는 시간과 돈을 효율적으로 활용가 필요가 있기에

     

    '강화 학습'은 state(상태), reward(보상)의 개념이 들어간 머신러닝으로 한 상태에서 다른 상태로 이동할 때 보상이 주어지는 것으로 점차 보상을 키워주는 방식으로 모델을 학습하는 것으로 알파고가 그 예에 속한다.

    ** 알파고 : 바둑돌을 어떤 위치(state)에 두는지에 따라 집(reward)을 얻을 수 있다.

     

    강화 학습은 지도학습, 비지도학습과 완전히 다른 개념이기에 우선, 지도학습과 비지도학습에 대해 먼저 공부해 보자.

     

     

Designed by Tistory.