types machine learning
이 튜토리얼은 간단한 예를 통해 기계 학습의 유형, 즉 감독, 비지도, 강화 및 반지도 학습을 설명합니다. 또한지도 학습과 비지도 학습의 차이점을 배우게됩니다.
에서 이전 튜토리얼 , 우리는 기계 학습, 그 작동 및 응용 프로그램에 대해 배웠습니다. 우리는 또한 기계 학습과 인공 지능의 비교를 보았습니다.
기계 학습은 경험을 통해 학습하고 결과를 예측하는 컴퓨터 프로그램을 다루는 과학 분야입니다.
ML의 주요 기능은 경험에서 배우는 것입니다. 학습은 학습 입력 데이터가 공급 된 시스템이 매개 변수를 변경하고 원하는 출력을 제공하도록 자체적으로 조정할 때 발생합니다. 출력은 훈련 데이터에 정의 된 목표 값입니다.
=> 완전한 기계 학습 교육 시리즈 읽기
학습 내용 :
기계 학습의 유형
머신 러닝 프로그램은 아래와 같이 3 가지 유형으로 분류됩니다.
- 감독
- 감독되지 않음
- 강화 학습
이것들을 자세히 이해합시다 !!
# 1)지도 학습
감독 학습은 교사의 도움을 받아 어린 아이가 수행하는 학습과 마찬가지로 감독자의 면전에서 발생합니다. 어린이가 교사의 감독하에 과일, 색상, 숫자를 인식하도록 훈련을 받았기 때문에이 방법은 감독 학습입니다.
이 방법에서는 교사가 아동의 모든 단계를 확인하고 아동은 자신이 생산해야하는 결과물에서 학습합니다.
지도 학습은 어떻게 작동합니까?
지도 ML 알고리즘에서 출력은 이미 알려져 있습니다. 입력과 출력의 매핑이 있습니다. 따라서 모델을 생성하기 위해 머신에는 많은 훈련 입력 데이터 (입력 및 해당 출력이 알려져 있음)가 제공됩니다.
학습 데이터는 생성 된 데이터 모델의 정확도 수준을 달성하는 데 도움이됩니다. 이제 빌드 된 모델에 새로운 입력 데이터를 제공하고 결과를 예측할 준비가되었습니다.
자바에서 문자열 배열 만들기
레이블이있는 데이터 세트 란?
주어진 입력에 대해 알려진 출력이있는 데이터 세트를 레이블이있는 데이터 세트라고합니다. 예를 들면 과일 이름과 함께 과일 이미지가 알려져 있습니다. 따라서 새로운 과일 이미지가 표시되면 학습 세트와 비교하여 답을 예측합니다.
지도 학습은 정확도가 높은 빠른 학습 메커니즘입니다. 지도 학습 문제에는 회귀 및 분류 문제가 포함됩니다.
지도 학습 알고리즘 중 일부는 다음과 같습니다.
- 의사 결정 나무,
- K-Nearest Neighbor,
- 선형 회귀,
- 서포트 벡터 머신 및
- 신경망.
지도 학습의 예
- 첫 번째 단계에서는 훈련 데이터 세트가 기계 학습 알고리즘에 제공됩니다.
- 훈련 데이터 세트를 사용하면 기계가 매개 변수를 변경하여 논리 모델을 구축하여 스스로 조정합니다.
- 그런 다음 빌드 된 모델은 결과를 예측하기위한 새로운 데이터 세트에 사용됩니다.
지도 학습 알고리즘의 유형
- 분류: 이러한 유형의 문제에서 우리는 응답을 '예'또는 '아니오'와 같은 특정 클래스로 예측합니다. 2 개의 클래스 만있는 경우 이진 분류라고합니다. 2 개 이상의 클래스 값을 다중 클래스 분류라고합니다. 예측 반응 값은 이산 값입니다. 예를 들면 태양이나 달의 이미지입니까? 분류 알고리즘은 데이터를 클래스로 분리합니다.
- 회귀 : 회귀 문제는-무한대에서 무한대까지의 값을 예측하는 것과 같이 응답을 연속 값으로 예측합니다. 많은 값이 필요할 수 있습니다. 예를 들면 적용되는 선형 회귀 알고리즘은 위치, 인근 공항, 집 크기 등과 같은 많은 매개 변수를 기반으로 집 비용을 예측합니다.
# 2) 비지도 학습
비지도 학습은 물고기가 스스로 수영하는 법을 배우는 것처럼 감독자의 도움없이 발생합니다. 그것은 독립적 인 학습 과정입니다.
이 모델에서는 입력에 매핑 된 출력이 없으므로 대상 값은 알 수 없거나 레이블이 지정되지 않습니다. 시스템은 데이터 입력으로부터 스스로 학습하고 숨겨진 패턴을 감지해야합니다.
라벨이없는 데이터 세트 란?
모든 입력 값에 대해 알 수없는 출력 값이있는 데이터 세트를 레이블이없는 데이터 세트라고합니다.
비지도 학습은 어떻게 작동합니까?
입력과 출력 사이에 논리 모델을 구축하는 데 사용할 수있는 알려진 출력 값이 없기 때문에 유사한 유형의 데이터 규칙, 패턴 및 데이터 그룹을 마이닝하는 데 일부 기술이 사용됩니다. 이러한 그룹은 최종 사용자가 데이터를 더 잘 이해하고 의미있는 결과를 찾는 데 도움이됩니다.
공급 된 입력은 훈련 데이터와 같은 적절한 구조의 형태가 아닙니다 (지도 학습에서). 특이 치, 노이즈 데이터 등이 포함될 수 있습니다. 이러한 입력은 함께 시스템에 공급됩니다. 모델을 훈련하는 동안 입력은 클러스터를 형성하도록 구성됩니다.
비지도 학습 알고리즘에는 다음과 같은 클러스터링 및 연관 알고리즘이 포함됩니다.
- 선험적으로,
- K- 평균 클러스터링 및 기타 연관 규칙 마이닝 알고리즘.
새 데이터가 모델에 제공되면 입력이 속한 클래스 레이블로 결과를 예측합니다. 클래스 레이블이 없으면 새 클래스가 생성됩니다.
데이터에서 패턴을 발견하는 과정을 거치는 동안 모델은 자체적으로 매개 변수를 조정하므로 자체 구성이라고도합니다. 클러스터는 입력 간의 유사성을 찾아서 형성됩니다.
예를 들어 온라인으로 제품을 구매하는 동안 버터를 장바구니에 넣으면 빵, 치즈 등을 구매할 것을 제안합니다. 감독되지 않은 모델은 데이터 포인트를보고 제품과 관련된 다른 속성을 예측합니다.
비지도 학습의 예
비지도 알고리즘의 유형
- 클러스터링 알고리즘 : 동일한 모양, 크기, 색상, 가격 등 데이터 항목 간의 유사점을 찾아서 그룹화하여 클러스터를 형성하는 방법은 클러스터 분석입니다.
- 이상치 감지 :이 방법에서 데이터 세트는 데이터의 모든 종류의 불일치 및 이상을 검색합니다. 예를 들면 사기 감지를 위해 시스템에서 신용 카드의 고 가치 거래를 감지합니다.
- 연관 규칙 마이닝 :이 유형의 마이닝에서는 가장 빈번하게 발생하는 항목 집합 또는 요소 간의 연관을 찾습니다. '함께 구매하는 제품이 많음'등과 같은 협회
- 오토 인코더 : 입력은 코딩 된 형식으로 압축되고 잡음이있는 데이터를 제거하기 위해 다시 생성됩니다. 이 기술은 이미지 및 비디오 품질을 향상시키는 데 사용됩니다.
# 3) 강화 학습
이러한 유형의 학습에서 알고리즘은 피드백 메커니즘과 과거 경험을 통해 학습합니다. 목표에 도달하기 위해 알고리즘의 각 단계를 수행하는 것이 항상 바람직합니다.
따라서 다음 단계를 수행 할 때마다 이전 단계의 피드백과 함께 다음 단계가 될 수있는 최상의 단계를 예측하기 위해 경험을 통해 학습합니다. 이 프로세스는 목표에 도달하기위한 시행 착오 프로세스라고도합니다.
강화 학습은 장기적인 반복 프로세스입니다. 피드백 수가 많을수록 시스템이 더 정확 해집니다. 기본 강화 학습은 Markov Decision Process라고도합니다.
강화 학습의 예
강화 학습의 예는 플레이어가 특정 수준의 게임을 완료하고 보상 포인트를 획득하는 비디오 게임입니다. 게임은 플레이어의 성능을 향상시키기 위해 보너스 동작을 통해 플레이어에게 피드백을 제공합니다.
강화 학습은 로봇, 자율 주행 자동차, 재고 자동 관리 등에 사용됩니다.
강화 학습의 인기있는 알고리즘은 다음과 같습니다.
- Q- 학습,
- 심층 적대 네트워크
- 시간적 차이
아래 그림은 강화 학습의 피드백 메커니즘을 설명합니다.
- 입력은 AI 요소 인 에이전트에 의해 관찰됩니다.
- 이 AI 에이전트는 내린 결정에 따라 환경에서 작동합니다.
- 환경의 응답은 피드백으로 다시 보상의 형태로 AI에 전송됩니다.
- 환경에서 수행 된 상태 및 작업도 저장됩니다.
(영상 출처 )
감독 및 비지도 학습의 실제 사례
지도 학습의 경우 :
#1) 양파, 당근, 무, 토마토 등을 담은 야채 바구니의 예를 들어 보겠습니다. 그룹 형태로 배열 할 수 있습니다.
#두) 지도 학습을 이해하기 위해 학습 데이터 테이블을 만듭니다.
훈련 데이터 테이블은 다음을 기반으로 야채를 특성화합니다.
- 모양
- 색깔
- 크기
모양 | 색깔 | 크기 | 야채 |
---|---|---|---|
입력 데이터와 해당 출력이 잘 알려져 있고 기계가 예측 만하면되기 때문에 비지도 학습보다 더 정확합니다. | 입력 데이터에 레이블이 지정되지 않았기 때문에 정확도가 떨어집니다. 따라서 기계는 먼저 데이터를 이해하고 레이블을 지정한 다음 예측을 제공해야합니다. | ||
일주 | 갈색 | 큰 | 양파 |
일주 | 그물 | 매질 | 토마토 |
원통형 | 하얀 | 큰 | 무 |
원통형 | 그물 | 매질 | 당근 |
이 훈련 데이터 테이블이 기계에 공급되면 야채의 모양, 색상, 크기 등을 사용하여 논리 모델을 작성하여 결과 (야채)를 예측합니다.
이 모델에 새로운 입력이 제공되면 알고리즘이 매개 변수를 분석하고 과일의 이름을 출력합니다.
비지도 학습의 경우 :
비지도 학습에서는 속성을 기반으로 그룹 또는 클러스터를 생성합니다. 위의 샘플 데이터 세트에서 야채의 매개 변수는 다음과 같습니다.
# 1) 모양
야채는 모양에 따라 그룹화됩니다.
- 일주: 양파와 토마토.
- 원통형 : 무와 당근.
크기와 같은 다른 매개 변수를 사용하십시오.
# 2) 크기
야채는 크기와 모양에 따라 분류됩니다.
- 중간 크기 및 원형 : 토마토
- 큰 크기 및 원형 : 양파
비지도 학습에서는 학습 데이터 세트와 결과 변수가 없지만지도 학습에서는 학습 데이터가 알려져 있으며 알고리즘 학습에 사용됩니다.
지도 학습과 비지도 학습의 차이점
감독 | 감독되지 않음 |
---|---|
지도 학습 알고리즘에서는 주어진 입력에 대한 출력이 알려져 있습니다. | 비지도 학습 알고리즘에서는 주어진 입력에 대한 출력을 알 수 없습니다. |
알고리즘은 레이블이 지정된 데이터 세트에서 학습합니다. 이 데이터는 훈련 데이터의 정확성을 평가하는 데 도움이됩니다. | 알고리즘은 데이터 항목 간의 패턴 및 연관성을 찾으려고하는 레이블이없는 데이터와 함께 제공됩니다. |
미래의 결과를 정확하게 예측하는 Predictive Modeling 기법입니다. | 요소의 실제 관계와 요소의 역사를 설명하는 기술 모델링 기법입니다. |
여기에는 분류 및 회귀 알고리즘이 포함됩니다. | 여기에는 클러스터링 및 연관 규칙 학습 알고리즘이 포함됩니다. |
지도 학습의 일부 알고리즘은 선형 회귀, Naïve Bayes 및 신경망입니다. | 비지도 학습을위한 일부 알고리즘은 k- 평균 클러스터링, Apriori 등입니다. |
이러한 유형의 학습은 레이블이 지정된 데이터가 필요하므로 비교적 복잡합니다. | 데이터를 이해하고 레이블을 지정할 필요가 없기 때문에 덜 복잡합니다. |
데이터 분석의 온라인 프로세스이며 사람의 상호 작용이 필요하지 않습니다. | 이것은 데이터의 실시간 분석입니다. |
준지도 학습
준지도 학습 접근 방식은 레이블이 지정된 교육 데이터와 레이블이없는 교육 데이터 입력을 모두 사용합니다. 이러한 유형의 학습은 레이블이없는 데이터에서 유용한 기능을 추출하기 어렵고 (지도 된 접근 방식) 데이터 전문가가 입력 데이터에 레이블을 지정하기 어려운 경우 (비지도 된 접근 방식)에 유용합니다.
이러한 알고리즘에서 레이블이 지정된 소량의 데이터 만 모델의 정확도로 이어질 수 있습니다.
예 준지도 학습에는 CT 스캔과 MRI가 포함됩니다. 여기에서 의료 전문가는 모든 스캔에 레이블을 지정하기 어렵지만 모든 질병에 대해 스캔에서 몇 가지 지점에 레이블을 지정할 수 있습니다.
결론
기계 학습 작업은 감독, 비지도, 반 감독 및 강화 학습 작업으로 크게 분류됩니다.
지도 학습은 레이블이 지정된 데이터의 도움으로 학습합니다. ML 알고리즘에는 향후 결과를 예측하기 위해 모든 입력 데이터에 대해 출력이 알려진 학습 데이터 세트가 제공됩니다.
이 모델은 매우 정확하고 빠르지 만 구축하는 데 높은 전문성과 시간이 필요합니다. 또한 이러한 모델은 데이터가 변경되면 다시 빌드해야합니다. 회귀 및 분류와 같은 ML 작업은지도 학습 환경에서 수행됩니다.
비지도 학습은 감독자의 도움없이 이루어집니다. ML 알고리즘에 제공된 입력 데이터는 레이블이 지정되지 않습니다. 즉, 모든 입력에 대해 출력이 알려지지 않았습니다. 알고리즘은 그 자체로 입력 데이터에서 추세와 패턴을 찾고 입력의 서로 다른 속성 간의 연관성을 생성합니다.
이러한 유형의 학습은 데이터에서 패턴을 찾고, 데이터 클러스터를 만들고, 실시간 분석에 유용합니다. 클러스터링, KNN 알고리즘 등과 같은 작업은 비지도 학습을받습니다.
준지도 학습 작업은 레이블이 지정된 데이터와 레이블이없는 데이터를 모두 사용하여 결과를 예측함으로써 감독 및 비지도 알고리즘의 이점을 모두 제공합니다. 강화 학습은 기계가 목표를 달성하기 위해 환경으로부터의 지속적인 피드백으로부터 학습하는 일종의 피드백 메커니즘입니다.
이러한 유형의 학습에서 AI 에이전트는 데이터에 대해 몇 가지 작업을 수행하고 환경은 보상을 제공합니다. 강화 학습은 어린 이용 멀티 플레이어 게임, 자율 주행 차 등에서 사용됩니다.
머신 러닝 및 인공 신경망에 대해 자세히 알아 보려면 다가오는 튜토리얼을 계속 지켜봐주십시오!
=> 독점적 인 기계 학습 시리즈를 보려면 여기를 방문하십시오