data mining vs machine learning vs artificial intelligence vs deep learning
데이터 마이닝 대 기계 학습 대 인공 지능 대 딥 러닝 대 데이터 과학의 차이점은 무엇입니까?
데이터 마이닝과 머신 러닝은 공통점이 많지만 서로 다른 목적을 가지고 있지만 서로에게서 영감을받은 영역입니다.
데이터 마이닝은 데이터 세트의 항목 간의 흥미로운 패턴을 찾기 위해 특정 데이터 세트에 대해 사람이 수행합니다. 데이터 마이닝은 결과를 예측하기 위해 기계 학습에서 개발 한 기술을 사용합니다.
기계 학습은 마이닝 된 데이터 세트에서 학습하는 컴퓨터의 기능입니다.
기계 학습 알고리즘은 데이터 세트의 항목 간의 관계를 나타내는 정보를 가져와 향후 결과를 예측할 수 있도록 모델을 구축합니다. 이러한 모델은 결과를 얻기 위해 기계가 취할 조치에 불과합니다.
이 기사에서는 데이터 마이닝 대 기계 학습 상세히.
학습 내용 :
- 데이터 마이닝이란?
- 머신 러닝이란?
- 기계 학습과 테이블 형식의 데이터 마이닝의 차이점
- 인공 지능이란 무엇입니까?
- 데이터 마이닝과 머신 러닝
- 데이터 마이닝, 머신 러닝 대 딥 러닝
- 데이터 마이닝, 기계 학습 대 데이터 과학
- 통계 분석
- 기계 학습의 몇 가지 예
- 결론
- 추천 도서
데이터 마이닝이란?
지식 발견 프로세스로도 알려진 데이터 마이닝은 데이터 세트의 속성을 알아내는 데 사용되는 과학 분야입니다. RDMS 또는 데이터웨어 하우스 또는 시계열, 공간 등과 같은 복잡한 데이터 세트에서 수집 된 대규모 데이터 세트를 마이닝하여 데이터 항목 간의 흥미로운 상관 관계 및 패턴을 추출합니다.
이러한 결과는 비즈니스 프로세스를 개선하여 비즈니스 통찰력을 얻는 데 사용됩니다.
추천 읽기 => 15 가지 무료 데이터 마이닝 도구
'데이터베이스의 지식 검색'(KDD)이라는 용어는 그레고리 피아 테츠 키 샤피로 '데이터 마이닝'이라는 용어는 1990 년에 데이터베이스 커뮤니티에 등장했습니다.
예제가있는 유닉스의 grep 명령
[ 영상 출처 ]
머신 러닝이란?
머신 러닝은 대용량 데이터를 처리하기위한 복잡한 알고리즘을 개발하여 사용자에게 결과를 제공하는 기술입니다. 경험을 통해 배우고 예측할 수있는 복잡한 프로그램을 사용합니다.
알고리즘은 훈련 데이터의 규칙적인 입력을 통해 자체적으로 개선됩니다. 기계 학습의 목표는 데이터를 이해하고 사람이 이해하고 사용할 수있는 데이터에서 모델을 구축하는 것입니다.
기계 학습이라는 용어는 1959 년 컴퓨터 게임 및 인공 지능 분야의 미국 선구자 인 Arthur Samuel이 만들었으며 '이는 명시 적으로 프로그래밍하지 않고도 컴퓨터에 학습 할 수있는 능력을 부여합니다'라고 말했습니다.
추천 읽기 => 가장 인기있는 기계 학습 도구
기계 학습은 두 가지 유형으로 분류됩니다.
- 비지도 학습
- 지도 학습
비지도 머신 러닝
비지도 학습은 결과를 예측하기 위해 훈련 된 데이터 세트에 의존하지 않지만 결과를 예측하기 위해 클러스터링 및 연관과 같은 직접적인 기술을 사용합니다. 훈련 된 데이터 세트는 출력이 알려진 입력을 의미합니다.
감독 된 기계 학습
지도 학습은 교사-학생 학습과 같습니다. 입력 변수와 출력 변수 사이의 관계가 알려져 있습니다. 기계 학습 알고리즘은 예상 결과와 비교할 입력 데이터의 결과를 예측합니다.
오류가 수정되고이 단계는 허용 가능한 성능 수준에 도달 할 때까지 반복적으로 수행됩니다.
[ 영상 출처 ]
기계 학습과 테이블 형식의 데이터 마이닝의 차이점
요인 | 데이터 수집 | 기계 학습 |
---|---|---|
7. 학습 능력 | 데이터 마이닝은 사람이 분석을 시작해야하므로 수동 기술입니다. | 머신 러닝은 데이터 마이닝에서 사용하는 것과 동일한 기술을 사용하여 변경 사항을 자동으로 학습하고 적용하므로 데이터 마이닝보다 한발 앞서 있습니다. 데이터 마이닝보다 더 정확합니다. |
1. 범위 | 데이터 마이닝은 패턴 및 데이터 시각화 기술을 통해 데이터 세트의 서로 다른 특성이 서로 어떻게 관련되어 있는지 알아내는 데 사용됩니다. 데이터 마이닝의 목표는 데이터 세트의 2 개 이상의 속성 간의 관계를 찾고이를 사용하여 결과 또는 작업을 예측하는 것입니다. | 기계 학습은 가격 추정 또는 기간 추정과 같은 결과를 예측하는 데 사용됩니다. 시간이 지남에 따라 경험을 통해 모델을 자동으로 학습합니다. 실시간 피드백 제공 |
2. 작업 | 데이터 마이닝은 유용한 정보를 추출하기 위해 데이터를 깊이 파고 드는 기술입니다. | 기계 학습은 훈련 된 데이터 세트를 반복적으로 공급하여 기계를 완벽에 가깝게 만들기 위해 복잡한 알고리즘을 개선하는 방법입니다. |
3. 용도 | 데이터 마이닝은 웹 마이닝, 텍스트 마이닝, 사기 탐지와 같은 연구 분야에서 더 자주 사용됩니다. | 기계 학습은 제품, 가격 추천, 배송에 필요한 시간 추정 등에 더 많이 사용됩니다. |
4. 개념 | 마이닝의 개념은 기술을 사용하여 정보를 추출하고 추세와 패턴을 찾는 것입니다. | 기계 학습은 기계가 기존 데이터에서 학습하고 스스로 학습하고 개선한다는 개념에서 실행됩니다. 머신 러닝은 데이터 마이닝 방법과 알고리즘을 사용하여 미래 결과를 예측하는 데이터이면의 논리에 대한 모델을 구축합니다. 알고리즘은 수학 및 프로그래밍 언어를 기반으로합니다. |
5. 방법 | 데이터 마이닝은 특정 시간에 배치 형식으로 분석을 수행하여 지속적인 기반이 아닌 결과를 생성합니다. | Machine Learning은 데이터 마이닝 기술을 사용하여 알고리즘을 개선하고 동작을 향후 입력으로 변경합니다. 따라서 데이터 마이닝은 기계 학습의 입력 소스 역할을합니다. 기계 학습 알고리즘은 자동으로 시스템 성능을 지속적으로 실행하고 개선하며 오류 발생시기를 분석합니다. 새로운 데이터가 있거나 변화가 트렌드 인 경우, 기계는 다시 프로그래밍하거나 사람의 간섭없이 변경 사항을 통합합니다. |
6. 자연 | 데이터 마이닝은 정보 추출 기술을 적용하기 위해 사람의 개입이 필요합니다. | 기계 학습은 자동으로 학습하므로 데이터 마이닝과 다릅니다. |
8. 구현 | 데이터 마이닝에는 데이터 마이닝 기술이 적용되는 모델 구축이 포함됩니다. CRISP-DM 모델과 같은 모델이 구축됩니다. 데이터 마이닝 프로세스는 지식 검색을 위해 데이터베이스, 데이터 마이닝 엔진 및 패턴 평가를 사용합니다. | 기계 학습은 인공 지능, 신경망, 신경 퍼지 시스템 및 의사 결정 트리 등에서 기계 학습 알고리즘을 사용하여 구현됩니다. 기계 학습은 신경망과 자동화 된 알고리즘을 사용하여 결과를 예측합니다. |
9. 정확도 | 데이터 마이닝의 정확성은 데이터 수집 방법에 따라 다릅니다. 데이터 마이닝은 기계 학습에서 사용되는 정확한 결과를 생성하여 기계 학습에서 더 나은 결과를 생성합니다. 데이터 마이닝에는 사람의 개입이 필요하므로 중요한 관계를 놓칠 수 있습니다. | 머신 러닝 알고리즘은 데이터 마이닝 기술보다 더 정확한 것으로 입증되었습니다. |
10. 응용 | 머신 러닝에 비해 데이터 마이닝은 적은 양의 데이터에서 결과를 생성 할 수 있습니다. | 기계 학습 알고리즘은 사용 가능한 알고리즘이 제한되는 표준 형식으로 데이터를 제공해야합니다. 기계 학습을 사용하여 데이터를 분석하려면 여러 소스의 데이터를 기계가 이해할 수 있도록 기본 형식에서 표준 형식으로 이동해야합니다. 또한 정확한 결과를 위해 많은 양의 데이터가 필요합니다. |
11. 예 | 데이터 마이닝이 사용되는 곳은 고객 유지를 위해 셀룰러 회사가 판매 패턴이나 추세를 식별하는 데 사용됩니다. | 머신 러닝은 마케팅 캠페인, 의료 진단, 이미지 인식 등에 사용됩니다. |
인공 지능이란 무엇입니까?
인공 지능은 지능형 기계의 생성을 다루는 과학의 한 분야입니다. 이 기계는 인간과 같은 자체 사고와 의사 결정 능력을 가지고 있기 때문에 지능이라고 불립니다.
예AI 기계에는 음성 인식, 이미지 처리, 문제 해결 등이 포함됩니다.
또한 읽기 => 최고의 인공 지능 소프트웨어 목록
인공 지능, 기계 학습 및 데이터 마이닝은 오늘날 세계에서 자주 사용됩니다. 이 단어들은 서로 밀접하게 관련되어 있으며 때로는 같은 의미로 사용됩니다.
따라서 각각을 자세히 비교해 보겠습니다.
인공 지능 및 데이터 마이닝
인공 지능은 인간처럼 작동 할 수있는 지능형 기계를 만드는 연구입니다. 학습이나 피드백에 의존하지 않고 제어 시스템을 직접 프로그래밍했습니다. AI 시스템은 계산을 통해 자체적으로 문제에 대한 해결책을 제시합니다.
마이닝 된 데이터의 데이터 마이닝 기술은 AI 시스템에서 솔루션을 만드는 데 사용됩니다. 데이터 마이닝은 인공 지능의 기반 역할을합니다. 데이터 마이닝은 AI 시스템에 필요한 정보와 데이터가 포함 된 프로그래밍 코드의 일부입니다.
인공 지능 및 기계 학습
인공 지능의 넓은 영역은 기계 학습입니다. 이것은 AI가 지능적인 행동을 위해 기계 학습 알고리즘을 사용한다는 것을 의미합니다. 컴퓨터는 오류가 지속적으로 감소하고 원하는 성능과 일치하는 경우 일부 작업에서 학습한다고합니다.
기계 학습은 자동으로 추출 작업을 수행하는 알고리즘을 연구합니다. 기계 학습은 통계에서 비롯되지만 실제로는 아닙니다. AI와 마찬가지로 기계 학습도 매우 넓은 범위를 가지고 있습니다.
데이터 마이닝과 머신 러닝
[ 영상 출처 ]
데이터 마이닝과 머신 러닝은 동일한 과학 세계에 속합니다. 이 용어는 서로 혼동되지만 몇 가지 주요 차이점이 있습니다.
# 1) 범위 : 데이터 마이닝은 패턴 및 데이터 시각화 기술을 통해 데이터 세트의 서로 다른 특성이 서로 어떻게 관련되어 있는지 알아내는 데 사용됩니다. 데이터 마이닝의 목표는 데이터 세트의 2 개 이상의 속성 간의 관계를 파악하고이를 사용하여 결과 또는 작업을 예측하는 것입니다.
기계 학습은 가격 추정 또는 기간 추정과 같은 결과를 예측하는 데 사용됩니다. 시간이 지남에 따라 경험을 통해 모델을 자동으로 학습합니다. 실시간 피드백을 제공합니다.
# 2) 기능 : 데이터 마이닝은 유용한 정보를 추출하기 위해 데이터를 깊이 파고 드는 기술입니다. Machine Learning은 훈련 된 데이터 세트를 반복적으로 공급하여 기계를 완벽에 가깝게 만들기 위해 복잡한 알고리즘을 개선하는 방법입니다.
# 3) 용도 : 데이터 마이닝은 연구 분야에서 더 자주 사용되는 반면 기계 학습은 제품, 가격, 시간 등을 추천하는 데 더 많이 사용됩니다.
# 4) 개념 : 데이터 마이닝의 개념은 기술을 사용하여 정보를 추출하고 추세와 패턴을 찾는 것입니다.
기계 학습은 기계가 기존 데이터에서 학습하고 자체적으로 향상된다는 개념에서 실행됩니다. 머신 러닝은 데이터 마이닝 방법과 알고리즘을 사용하여 미래 결과를 예측하는 데이터이면의 논리에 대한 모델을 구축합니다. 알고리즘은 수학 및 프로그래밍 언어를 기반으로합니다.
# 5) 방법 : Machine Learning은 데이터 마이닝 기술을 사용하여 알고리즘을 개선하고 동작을 향후 입력으로 변경합니다. 따라서 데이터 마이닝은 기계 학습의 입력 소스 역할을합니다.
머신 러닝 알고리즘은 지속적으로 시스템의 성능을 자동으로 실행하고 개선하며 장애 발생시기를 분석합니다. 새로운 데이터가 있거나 추세에 변화가있을 때 기계는 재 프로그래밍하거나 사람의 간섭없이 변경 사항을 통합합니다.
데이터 마이닝은 특정 시간에 배치 형식으로 분석을 수행하여 지속적인 기반이 아닌 결과를 생성합니다.
# 6) 자연 : 기계 학습은 자동으로 학습하는 반면 데이터 마이닝은 정보 추출 기술을 적용하기 위해 사람의 개입이 필요하므로 데이터 마이닝과 다릅니다.
배열 자바에 값을 추가하는 방법
# 7) 학습 능력 : 머신 러닝은 데이터 마이닝에서 사용하는 것과 동일한 기술을 사용하여 변경 사항을 자동으로 학습하고 적용하므로 데이터 마이닝보다 한발 앞서 있습니다. 데이터 마이닝보다 정확합니다. 데이터 마이닝은 사람이 분석을 시작해야하므로 수동 기술입니다.
# 8) 구현 : 데이터 마이닝에는 데이터 마이닝 기술이 적용되는 모델 구축이 포함됩니다. CRISP-DM 모델과 같은 모델이 구축됩니다. 데이터 마이닝 프로세스는 지식 검색을 위해 데이터베이스, 데이터 마이닝 엔진 및 패턴 평가를 사용합니다.
기계 학습은 인공 지능, 신경망, 신경 퍼지 시스템 및 의사 결정 트리 등에서 기계 학습 알고리즘을 사용하여 구현됩니다. 기계 학습은 신경망과 자동화 된 알고리즘을 사용하여 결과를 예측합니다.
# 9) 정확도 : 데이터 마이닝의 정확성은 데이터 수집 방법에 따라 다릅니다. 데이터 마이닝은 기계 학습에서 사용되는 정확한 결과를 생성하여 기계 학습이 더 나은 결과를 생성하도록합니다.
데이터 마이닝에는 사람의 개입이 필요하므로 중요한 관계를 놓칠 수 있습니다. 기계 학습 알고리즘은 데이터 마이닝 기술보다 더 정확한 것으로 입증되었습니다.
# 10) 응용 프로그램 : 기계 학습 알고리즘은 데이터를 표준 형식으로 제공해야하므로 사용 가능한 알고리즘이 많이 제한됩니다. 기계 학습을 사용하여 데이터를 분석하려면 여러 소스의 데이터를 기계가 이해할 수 있도록 기본 형식에서 표준 형식으로 이동해야합니다.
또한 정확한 결과를 위해서는 많은 양의 데이터가 필요합니다. 이것은 데이터 마이닝과 비교할 때 오버 헤드입니다.
#열한) 예 : 데이터 마이닝은 판매 패턴 또는 추세를 식별하는 데 사용되며 기계 학습은 마케팅 캠페인을 실행하는 데 사용됩니다.
데이터 마이닝, 머신 러닝 대 딥 러닝
[ 영상 출처 ]
기계 학습은 훈련 된 데이터 세트에서 학습하고 결과를 자동으로 예측하는 기계의 기능으로 구성됩니다. 인공 지능의 하위 집합입니다.
딥 러닝은 기계 학습의 하위 집합입니다. 인간의 뇌가 정보를 처리하는 것과 같은 방식으로 기계에서 작동합니다. 뇌가 이전에 기억 한 패턴과 비교하여 패턴을 식별 할 수있는 것처럼 딥 러닝도이 개념을 사용합니다.
딥 러닝은 원시 데이터에서 자동으로 속성을 찾을 수 있으며 기계 학습은 추가 처리가 필요한 이러한 기능을 수동으로 선택합니다. 또한 많은 숨겨진 레이어, 빅 데이터 및 높은 컴퓨터 리소스가있는 인공 신경망을 사용합니다.
데이터 마이닝은 기존 데이터에서 숨겨진 패턴과 규칙을 발견하는 프로세스입니다. 연관성, 의사 결정 과정을위한 상관 규칙 등과 같은 비교적 간단한 규칙을 사용합니다. 딥 러닝은 음성 인식 등과 같은 복잡한 문제 처리에 사용됩니다. 처리를 위해 많은 숨겨진 레이어가있는 인공 신경망을 사용합니다.
때때로 데이터 마이닝은 데이터 처리를 위해 딥 러닝 알고리즘을 사용합니다.
데이터 마이닝, 기계 학습 대 데이터 과학
[ 영상 출처 ]
데이터 과학은 기계 학습이 시작되는 광대 한 영역입니다. SPARK, HADOOP 등과 같은 많은 기술도 데이터 과학에 속합니다. 데이터 과학은 기술을 사용하여 방대한 데이터를 처리 할 수있는 능력을 가진 통계의 확장입니다.
요구 사항 분석, 이해, 유용한 데이터 추출 등과 같은 모든 실제 복잡한 문제 해결을 다룹니다.
데이터 과학은 인간이 생성 한 원시 데이터를 다루며 인간이하는 것처럼 데이터의 이미지와 오디오를 분석 할 수 있습니다. 데이터 과학에는 도메인 전문 지식, 데이터베이스에 대한 강력한 지식 등을 갖춘 높은 기술 세트가 필요합니다. 높은 계산 리소스, 높은 RAM 등이 필요합니다.
데이터 과학 모델은 사용 가능한 데이터로만 목표를 달성하려는 머신 러닝과 비교할 때 달성해야 할 이정표를 명확하게 정의했습니다.
데이터 과학 모델은 다음으로 구성됩니다.
- ETL- 데이터로드 및 변환을 추출합니다.
- 데이터 배포 및 처리.
- 결과에 대한 자동 모델 적용.
- 데이터 시각화
- 더 나은 이해를 위해 슬라이스 및 주사위 기능으로보고합니다.
- 데이터 백업, 복구 및 보안.
- 프로덕션으로 마이그레이션.
- 알고리즘으로 비즈니스 모델 실행.
통계 분석
통계는 데이터 마이닝 및 기계 학습 알고리즘의 주요 부분을 구성합니다. 통계 분석은 숫자 데이터를 사용하고 출력을 추론하기 위해 많은 수학적 방정식을 포함합니다.
대용량 데이터 분석에 적합한 도구와 기술을 제공합니다. 광범위한 데이터 분석 영역을 다루며 계획에서 분석, 보고서 제시 및 작성에 이르기까지 전체 데이터 라이프 사이클을 다룹니다.
다음과 같은 두 가지 유형의 통계 분석이 있습니다.
- 설명
- 추론
기술 분석은 데이터를 요약하고 추론 분석은 요약 된 데이터를 사용하여 결과를 도출합니다.
통계는 1 인당 인구를 결정하는 지리학, 수요와 공급을 연구하는 경제학, 하루 예금을 추정하는 은행 등 다양한 분야에 적용됩니다.
기계 학습의 몇 가지 예
다음은 머신 러닝의 몇 가지 예입니다.
# 1) 웹 사이트의 온라인 채팅 지원 : 즉각적인 고객 서비스를 제공하기 위해 여러 웹 사이트에서 사용하는 봇은 인공 지능으로 구동됩니다.
# 2) 이메일 메시지 : 그만큼 이메일 서비스 콘텐츠가 스팸인지 자동으로 감지합니다. 이 기술은 또한 첨부 파일과 콘텐츠를 조사하여 컴퓨터 사용자에게 의심 스러운지 유해한지 판단하는 AI로 구동됩니다.
# 3) 마케팅 캠페인 : 기계 학습은 고객에게 신제품 또는 유사 제품에 대한 제안을 제공합니다. 고객의 선택에 따라 고객이 구매를 유도하기 위해 실시간으로 거래를 자동으로 구성합니다. 예를 들면 , 아마존의 번개 거래.
결론
데이터는 기계 학습, 데이터 마이닝, 데이터 과학 및 딥 러닝의 가장 중요한 요소가됩니다. 데이터 분석 및 통찰력은 오늘날 세계에서 매우 중요합니다. 따라서 이러한 분석 기술에 대한 시간, 노력 및 비용을 투자하는 것은 비즈니스에 중요한 결정을 내리게됩니다.
데이터가 매우 빠른 속도로 증가함에 따라 이러한 방법은 새로운 데이터 세트를 통합하고 유용한 분석을 예측할 수있을만큼 충분히 빨라야합니다. 기계 학습은 데이터를 신속하게 처리하고 모델 형태로 더 빠른 결과를 자동으로 제공하는 데 도움이 될 수 있습니다.
데이터 마이닝 기술은 과거 데이터에서 패턴과 추세를 생성하여 향후 결과를 예측합니다. 이러한 결과는 그래프, 차트 등의 형태입니다. 통계 분석은 데이터 분석 가까운 장래에 더 높아질 것입니다.
이러한 기술은 향후 비즈니스 프로세스가 개선됨에 따라 엄청나게 성장할 것입니다. 이는 또한 기업이 수동 프로세스를 자동화하고 매출과 수익을 증가시켜 고객 유지에 도움이 될 것입니다.
데이터 마이닝 대 기계 학습에 대한 엄청난 지식을 얻었기를 바랍니다!
추천 도서
- 2021 년 가장 인기있는 11 가지 머신 러닝 소프트웨어 도구
- 10 최고의 인공 지능 소프트웨어 (2021 년 AI 소프트웨어 리뷰)
- 15 가지 최고의 무료 데이터 마이닝 도구 : 가장 포괄적 인 목록
- 사용자 정의 변수를 사용한 JMeter 데이터 매개 변수화
- 데이터 수집 전략을 갖춘 10 개 이상의 최고의 데이터 수집 도구
- 2021 년 데이터 요구 사항을 충족하는 10 개 이상의 최고의 데이터 거버넌스 도구
- 테스트 데이터 관리를위한 IBM Rational Quality Manager의 데이터 풀 기능
- 비즈니스 인텔리전스 (BI) 테스트를위한 4 단계 : 비즈니스 데이터 테스트 방법