ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Machine Learning
    공부 !/ML·NLP 2021. 1. 8. 01:23
    반응형

    Machine Learning 시작해보자 !

    Machine Learning 즉, 기계학습 !

    인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘이나 기술을 개발하는 분야이다 ...

     

    말이 어렵지만 한마디로 컴퓨터를 학습시켜 우리의 판단 능력을 확장시킬 수 있는 좋은 기술이다  !


    Teachable machine

    가볍게 기계학습을 돌려볼 수 있는 좋은 사이트이다.

    teachablemachine.withgoogle.com/

     

    Teachable Machine

    Train a computer to recognize your own images, sounds, & poses. A fast, easy way to create machine learning models for your sites, apps, and more – no expertise or coding required.

    teachablemachine.withgoogle.com

    Teachable Machine 사이트를 통해 이미지 트레이닝을 시킨 결과 !

    사진을 보고 고양이인지 강아지인지 판단하는 모델을 만들어보았다

    Class, grouping 된 것들을 기준으로 model 이 만들어진다 !

     

    Model 이란 곧 판단력이 된다 !

    모델을 만드는 과정을 학습이라고 하며

    좋은 추측 결과를 내기 위해서는 학습을 통해 좋은 모델을 만들어내면 된다 !

     


    머신러닝의 기반은 데이터 !

    많은 양의 데이터를 학습 시킨다면 더 좋은 결과를 도출해낼 수 있다

    하지만 엉뚱한 데이터가 섞인다면 좋은 결과를 도출해 내기 힘들다

    따라서, 양과 질이 좋은 데이터를 판단해 학습시켜야한다

     

    머신러닝에서 표는 data set 이라 표현되며

    표의 행과 열은 데이터가 된다.

     

    주로 행은 개체, 관측치로 표현되고 열은 특성, 속성으로 표현된다.

    아래 표를 보면 행은 해당 날짜 자체를 의미하고

    열은 해당 날짜의 특징을 잘 나타낸다.

     

    날짜 온도 판매량
    2020/01/07 20 40
    2020/01/08 21 42

     


    독립변수 ? 종속변수 ?

    독립변수는 즉 원인이 되는 변수를 의미한다

    종속변수는 독립변수에 영향을 받은 변수를 의미한다

     

    날짜 온도 판매량
    2020/01/07 20 40
    2020/01/08 21 42

     

    표를 다시 살펴보면 온도는 판매량의 두배라는 것을 확인할 수 있다온도 원인이 되는 열, 판매량 결과가 되는 열이다

     

    독립변수와 종속변수는 원인과 결과라는 인과 관계를 이룬다인과 관계는 상관관계에 속한다

     

    모든 변수가 인과 관계를 가지진 않지만 상관관계를 이룬다이런 변수간의 관계를 잘 파악해야어떤 학습 방법을 선택할지에 대한 판단을 할 수 있다 !

     


    머신러닝의 분류

    기계학습법에 여러 학습법이 존재한다

    하나씩 살펴보자 !

     

     

    지도학습 (supervised learning)

    주어진 데이터를 학습시켜 정답을 도출해낼 수 있도록 하는 방법이다

    온도라는 변수와 이에 영향을 받는 판매량이라는 종속변수를 통해

    다음 판매량을 예측해낼 수 있는 것과 같은 방식이 지도학습을 이용한 것이다

    주어진 정답지를 보며 다음 정답을 유추해내가는 방식이라고 이해하면된다

     

    비지도학습 (unsupervised learning)

    지도학습에 포함되지 않는 방법들로 데이터 간의 관계를 분류할때 사용한다

    데이터에 대한 통찰력을 키우는 방법이라고 이해하면 된다

    관찰을 통해 데이터들의 새로운 의미나 관계를 밝혀내는 방법이다

     

    강화학습 (reinforcement learning)

    학습을 통해 능력을 향상시킨다는 점에서 지도학습과 유사하지만

    게임 레벨업하는 방식과 같다고 이해하면 된다

    정답을 보면 더 나은 방식을 찾아간다기보다 

    주어진 상황에서 어떠한 행동을 통해 상벌이 주어진다

    이에 기계가 더 나은 상을 받기 위해 노력하는 방법이다 

     


    지도학습 - 회귀와 분류 (2)

     

    지도학습은 크게 '회귀' 와 '분류' 로 나누어진다

    가진 데이터들이 독립변수와 종속변수로 이루어져 있어야한다

    '회귀 (regression)'

    예측하고 싶은 종속 변수가 숫자일때 

    양적인 결과를 도출하고 싶을때 사용한다

     

    예를 들면

    공부시간이라는 독립변수와 시험점수라는 종속 변수를 토대로

    공부시간과 시험점수를 입력받아 데이터를 학습시키면 된다

    '분류 (classification)'

    예측하고 싶은 종속변수가 문자일때

    범주형인 결과를 도출하고 싶을때 사용한다.

     

    예를 들어

    공부시간이라는 독립변수와 합격여부라는 종속 변수를 토대로

    공부시간과 합격/불합격 여부를 입력받아 학습시키면 된다

     


    비지도학습 - 군집화, 연관 규칙 학습, 변환 (3)

    '군집화 (clustering)'

    유사한 속성을 가진 관측치들을 그룹핑하는 방법으로

    예를들어 표에서 비슷한 행들을 찾아내는 것과 같다

     

    '연관규칙학습 (association rule learning)'

    주어진 데이터들의 서로 연관된 특징을 사용해 그룹핑한다

    표에서 비슷한 열끼리을 찾아주는 것과 같다

    예를 들어 특성 사이의 상관관계를 가진 영화 추천 기능 등에서 사용한다

     

    '변환 (transformation)'

    data 를 좀 더 편리하게 사용할 수 있도록 가공하는 방법이다

    예를 들어 텍스트 문서에서 주제를 추출하는 사례 등이 있다

     


    강화학습 (reinforcement learning)

     

    지도학습이 배움을 통해 실력을 키우는 것에 반해 강화학습은 경험을 통해 실력을 쌓아가는 것이다

     

    게임의 레벨업 방법과 유사하게 주어진 게임(environment) 의 화면(state)를 보며게이머 (agent) 는 판단(policy) 을 내리고 게임에 참여 (action) 을 한다이 행동에 따라 보상(reward) , 상 또는 벌을 받게된다

     

    강화학습의 핵심은 더 많은 보상을 받을 수 있는 정책을 만드는 것이다

     

    예를 들면 알파고나 자동차의 자율주행 기능 등이 있다


    참고

    opentutorials.org/course/4548

     

     

    반응형

    댓글

Designed by SooJI