data mining examples
이 자습서에서는 실제 생활에서 가장 인기있는 데이터 마이닝 예제를 다룹니다. 재무, 마케팅, 의료 및 CRM의 데이터 마이닝 애플리케이션에 대해 알아보십시오.
이것에 무료 데이터 마이닝 교육 시리즈 , 우리는 데이터 마이닝 프로세스 이전 튜토리얼에서. KDD (Knowledge Discovery in Databases)라고도하는 데이터 마이닝은 대규모 데이터 및 데이터웨어 하우스 집합에서 패턴을 검색하는 프로세스입니다.
회귀 분석, 연관성 및 클러스터링, 분류 및 특이 치 분석과 같은 다양한 기술이 데이터에 적용되어 유용한 결과를 식별합니다. 이러한 기술은 데이터를 분석하고 패턴을 보여주는 소프트웨어 및 백엔드 알고리즘을 사용합니다.
최고의 무료 팝업 차단기 크롬
잘 알려진 데이터 마이닝 방법 중 일부는 의사 결정 트리 분석, Bayes 정리 분석, 빈번한 항목 집합 마이닝 등입니다. 소프트웨어 시장에는 Weka, Rapid Miner 및 오렌지 데이터 마이닝 도구.
데이터 마이닝 프로세스는 통계 및 알고리즘을 사용하여 보고서와 패턴을 표시하는 데이터 마이닝 도구에 특정 데이터 입력을 제공하는 것으로 시작됩니다. 결과는 비즈니스 수정 및 개선을 수행하기 위해 이해하고 추가로 적용 할 수있는 이러한 도구를 사용하여 시각화 할 수 있습니다.
데이터 마이닝은 마케팅 전략을 수립하는 조직, 진단 도구를위한 병원, 웹 사이트 및 기타 여러 방법을 통한 교차 판매 제품을위한 전자 상거래에서 널리 사용됩니다.
일부 데이터 마이닝 예제는 참조를 위해 아래에 제공됩니다.
학습 내용 :
- 실제 데이터 마이닝의 예
- 금융 분야의 데이터 마이닝 예
- 마케팅에서 데이터 마이닝의 응용
- 의료 분야의 데이터 마이닝 응용 사례
- 데이터 마이닝 및 추천 시스템
- CRM 용 데이터 마이닝 (고객 관계 관리)
- 의사 결정 트리를 사용한 데이터 마이닝 예제
- 데이터 마이닝의 가장 인기있는 예 : 마케팅 및 판매
- 데이터 마이닝을 사용하는 대기업
- 결론
- 추천 도서
실제 데이터 마이닝의 예
데이터 마이닝 및 분석의 중요성은 실생활에서 날로 증가하고 있습니다. 오늘날 대부분의 조직은 빅 데이터 분석을 위해 데이터 마이닝을 사용합니다.
이러한 기술이 우리에게 어떻게 도움이되는지 살펴 보겠습니다.
# 1) 모바일 서비스 제공 업체
모바일 서비스 제공 업체는 데이터 마이닝을 사용하여 마케팅 캠페인을 설계하고 고객이 다른 공급 업체로 이동하지 못하도록합니다.
청구 정보, 이메일, 문자 메시지, 웹 데이터 전송 및 고객 서비스와 같은 대량의 데이터에서 데이터 마이닝 도구는 공급 업체를 변경하려는 고객에게 알려주는 '이탈'을 예측할 수 있습니다.
이 결과로 확률 점수가 제공됩니다. 그러면 모바일 서비스 제공 업체는 이탈 위험이 높은 고객에게 인센티브를 제공하고 제안을 할 수 있습니다. 이러한 종류의 채굴은 광대역, 전화, 가스 제공 업체 등과 같은 주요 서비스 제공 업체에서 자주 사용합니다.
(영상 출처 )
# 2) 소매 부문
데이터 마이닝은 슈퍼마켓 및 소매 부문 소유자가 고객의 선택을 알 수 있도록 도와줍니다. 고객의 구매 내역을 살펴보면 데이터 마이닝 도구는 고객의 구매 선호도를 보여줍니다.
이러한 결과의 도움으로 슈퍼마켓은 진열대에 제품 배치를 설계하고 일치하는 제품에 대한 쿠폰 및 일부 제품에 대한 특별 할인과 같은 항목에 대한 제안을 제공합니다.
이러한 캠페인은 RFM 그룹을 기반으로합니다. RFM은 최근 성, 빈도 및 통화 그룹을 나타냅니다. 프로모션 및 마케팅 캠페인은 이러한 세그먼트에 맞게 사용자 정의됩니다. 많이 소비하지만 빈도가 낮은 고객은 2-3 일마다 구매하지만 금액은 적은 고객과 다르게 취급됩니다.
데이터 마이닝은 제품 추천 및 항목 상호 참조에 사용할 수 있습니다.
다른 데이터 소스에서 소매 부문의 데이터 마이닝.
(영상 출처 )
# 3) 인공 지능
시스템은 관련 패턴을 제공하여 인공적으로 지능적으로 만들어집니다. 이러한 패턴은 데이터 마이닝 출력에서 비롯됩니다. 인공 지능 시스템의 출력도 데이터 마이닝 기술을 사용하여 관련성에 대해 분석됩니다.
추천 시스템은 데이터 마이닝 기술을 사용하여 고객이 기계와 상호 작용할 때 개인화 된 추천을합니다. 인공 지능은 Amazon에서 고객의 과거 구매 내역을 기반으로 상품 추천을 제공하는 등 마이닝 된 데이터에 사용됩니다.
# 4) 전자 상거래
많은 전자 상거래 사이트는 데이터 마이닝을 사용하여 제품의 교차 판매 및 상향 판매를 제공합니다. Amazon, Flipkart와 같은 쇼핑 사이트는 사이트와 상호 작용하는 고객에게 '사람도 본 사람', '함께 자주 구매'를 보여줍니다.
이러한 권장 사항은 웹 사이트 고객의 구매 내역에 대한 데이터 마이닝을 사용하여 제공됩니다.
# 5) 과학 및 공학
데이터 마이닝의 출현으로 과학 응용 프로그램은 이제 통계 기술에서 '데이터 수집 및 저장'기술 사용으로 이동 한 다음 새로운 데이터에 대한 마이닝을 수행하고 새로운 결과를 출력하며 프로세스를 실험하고 있습니다. 천문학, 지질학, 위성 센서, 위성 위치 확인 시스템 등과 같은 과학 영역에서 많은 양의 데이터가 수집됩니다.
컴퓨터 과학의 데이터 마이닝은 시스템 상태를 모니터링하고, 성능을 개선하고, 소프트웨어 버그를 찾고, 표절을 발견하고, 결함을 찾는 데 도움이됩니다. 데이터 마이닝은 제품, 기사에 대한 사용자 피드백을 분석하여 의견과 의견을 추론하는데도 도움이됩니다.
# 6) 범죄 예방
데이터 마이닝은 방대한 양의 데이터에서 이상 값을 감지합니다. 범죄 데이터에는 발생한 범죄의 모든 세부 정보가 포함됩니다. 데이터 마이닝은 패턴과 추세를 연구하고 더 나은 정확도로 향후 이벤트를 예측합니다.
기관은 어느 지역이 범죄에 더 취약하고, 얼마나 많은 경찰을 배치해야하는지, 어떤 연령대를 대상으로해야하는지, 차량 번호를 면밀히 조사해야하는 등을 알아낼 수 있습니다.
# 7) 연구
연구원들은 데이터 마이닝 도구를 사용하여 대기 오염과 같은 환경 조건 및 대상 지역의 사람들 사이에 천식과 같은 질병의 확산과 같은 연구중인 매개 변수 간의 연관성을 탐색합니다.
# 8) 농업
농부들은 데이터 마이닝을 사용하여 식물에 필요한 물의 양으로 야채의 수확량을 알아냅니다.
# 9) 자동화
데이터 마이닝을 사용하여 컴퓨터 시스템은 비교중인 매개 변수 간의 패턴을 인식하는 방법을 학습합니다. 시스템은 향후 비즈니스 목표를 달성하는 데 유용한 패턴을 저장합니다. 이 학습은 기계 학습을 통해 목표를 달성하는 데 도움이되는 자동화입니다.
# 10) 동적 가격
데이터 마이닝은 택시 서비스와 같은 서비스 공급자가 수요와 공급에 따라 고객에게 동적으로 요금을 부과 할 수 있도록 도와줍니다. 기업 성공의 핵심 요소 중 하나입니다.
# 11) 운송
데이터 마이닝은 창고에서 아울렛으로 차량 이동을 예약하고 제품 로딩 패턴을 분석하는 데 도움이됩니다.
# 12) 보험
데이터 마이닝 방법은 정책을 구매하는 고객을 예측하고 함께 사용되는 의료 청구를 분석하며 사기 행위 및 위험한 고객을 찾는 데 도움이됩니다.
금융 분야의 데이터 마이닝 예
( 영상 출처 )
금융 부문에는 은행, 보험 회사 및 투자 회사가 포함됩니다. 이 기관들은 엄청난 양의 데이터를 수집합니다. 데이터는 종종 완전하고 신뢰할 수 있으며 고품질이며 체계적인 데이터 분석이 필요합니다.
재무 데이터를 저장하기 위해 데이터 큐브 형태로 데이터를 저장하는 데이터웨어 하우스가 구성됩니다. 이 데이터를 분석하기 위해 고급 데이터 큐브 개념이 사용됩니다. 클러스터링 및 특이 치 분석, 특성화와 같은 데이터 마이닝 방법은 재무 데이터 분석 및 마이닝에 사용됩니다.
데이터 마이닝이 사용되는 금융 사례는 다음과 같습니다.
# 1) 대출 지급 예측
속성 선택 및 속성 순위와 같은 데이터 마이닝 방법은 고객 지불 내역을 분석하고 지불 대 소득 비율, 신용 내역, 대출 기간 등과 같은 중요한 요소를 선택합니다. 결과는 은행이 대출 부여 정책을 결정하는 데 도움이 될 것입니다. 또한 요인 분석에 따라 고객에게 대출을 제공합니다.
# 2) 타겟 마케팅
클러스터링 및 분류 데이터 마이닝 방법은 은행에 대한 고객의 결정에 영향을 미치는 요소를 찾는 데 도움이됩니다. 유사한 행동을 보이는 고객의 식별은 타겟 마케팅을 용이하게합니다.
# 3) 금융 범죄 탐지
은행 데이터는 다양한 출처, 다양한 도시 및 은행 위치에서 가져옵니다. 큰 가치 거래와 같은 비정상적인 추세를 연구하고 감지하기 위해 여러 데이터 분석 도구가 배포됩니다. 데이터 시각화 도구, 이상치 분석 도구, 클러스터링 도구 등은 행동의 관계와 패턴을 식별하는 데 사용됩니다.
아래 그림은 여러 국가에서 온라인 시스템을 뱅킹하려는 고객의 의지를 보여주는 Infosys의 연구입니다. Infosys는이 연구에 빅 데이터 분석을 사용했습니다.
(영상 출처 )
마케팅에서 데이터 마이닝의 응용
데이터 마이닝은 회사의 마케팅 전략을 강화하고 비즈니스를 촉진합니다. 기업 성공의 핵심 요소 중 하나입니다. 판매, 고객 쇼핑, 소비 등에 대한 방대한 양의 데이터가 수집됩니다.이 데이터는 전자 상거래로 인해 날로 증가하고 있습니다.
데이터 마이닝은 고객 구매 행동을 식별하고, 고객 서비스를 개선하고, 고객 유지에 집중하고, 판매를 강화하고, 비즈니스 비용을 줄이는 데 도움이됩니다.
마케팅 데이터 마이닝의 몇 가지 예는 다음과 같습니다.
# 1) 예측 시장
시장을 예측하기 위해 마케팅 전문가는 회귀와 같은 데이터 마이닝 기술을 사용하여 고객 행동, 변화 및 습관, 고객 반응 및 마케팅 예산, 기타 발생 비용 등과 같은 기타 요인을 연구합니다. 앞으로 전문가에게는 더 쉬울 것입니다. 요인이 변경 될 경우 고객을 예측합니다.
# 2) 이상 탐지
데이터 마이닝 기술은 시스템에 모든 종류의 결함을 일으킬 수있는 데이터의 이상을 감지하기 위해 배포됩니다. 시스템은이 작업을 수행하기 위해 수천 개의 복잡한 항목을 스캔합니다.
# 3) 시스템 보안
데이터 마이닝 도구는 데이터베이스를 손상시킬 수있는 침입을 감지하여 전체 시스템에 더 큰 보안을 제공합니다. 이러한 침입은 중복 항목의 형태, 해커의 데이터 형태의 바이러스 등일 수 있습니다.
의료 분야의 데이터 마이닝 응용 사례
(영상 출처 )
의료 분야에서 데이터 마이닝은 점점 인기를 얻고 필수 요소가되고 있습니다.
의료에서 생성 된 데이터는 복잡하고 방대합니다. 의료 사기 및 남용을 방지하기 위해 데이터 마이닝 도구를 사용하여 사기 항목을 감지하여 손실을 방지합니다.
자바 코딩 인터뷰 질문 코드 작성
의료 산업의 일부 데이터 마이닝 예는 참조를 위해 아래에 제공됩니다.
# 1) 의료 관리
데이터 마이닝 방법은 만성 질환을 식별하고, 질병이 확산되기 쉬운 고위험 지역을 추적하고, 질병 확산을 줄이기위한 프로그램을 설계하는 데 사용됩니다. 의료 전문가는 병원에 최대로 입원하는 환자의 질병, 지역을 분석합니다.
이 데이터를 사용하여 사람들이 질병을 인식하고 예방하는 방법을 볼 수 있도록 지역 캠페인을 설계합니다. 이것은 병원에 입원하는 환자의 수를 줄일 것입니다.
# 2) 효과적인 치료
데이터 마이닝을 사용하여 치료를 개선 할 수 있습니다. 증상, 원인, 의약품의 지속적인 비교를 통해 데이터 분석을 수행하여 효과적인 치료를 할 수 있습니다. 데이터 마이닝은 또한 특정 질병의 치료 및 치료의 부작용 연관에도 사용됩니다.
# 3) 사기 및 악의적 인 데이터
데이터 마이닝 애플리케이션은 실험실, 의사의 결과, 부적절한 처방, 허위 의료 청구와 같은 비정상적인 패턴을 찾는 데 사용됩니다.
데이터 마이닝 및 추천 시스템
Recommender 시스템은 사용자가 관심을 가질 수있는 제품 권장 사항을 고객에게 제공합니다.
추천 항목은 사용자가 과거에 조회 한 항목과 유사하거나 사용자와 유사한 취향을 가진 다른 고객 선호도를 살펴보면 유사합니다. 이러한 접근 방식을 콘텐츠 기반 접근 방식이라고하며 적절한 협업 접근 방식이라고합니다.
정보 검색, 통계, 기계 학습 등과 같은 많은 기술이 추천 시스템에서 사용됩니다.
추천 시스템은 키워드, 사용자 프로필, 사용자 트랜잭션, 항목 간의 공통 기능을 검색하여 사용자에 대한 항목을 추정합니다. 이러한 시스템은 또한 유사한 구매 이력을 가진 다른 사용자를 찾아 해당 사용자가 구매할 수있는 항목을 예측합니다.
이 접근 방식에는 많은 문제가 있습니다. 추천 시스템은 수백만 개의 데이터를 실시간으로 검색해야합니다.
Recommender Systems에서 발생하는 오류에는 두 가지 유형이 있습니다.
거짓 음성 및 거짓 양성.
거짓 음성 시스템에서 권장하지 않았지만 고객이 원하는 제품입니다. 거짓 양성 시스템에서 권장했지만 고객이 원하지 않는 제품입니다. 또 다른 문제는 구매 내역이없는 신규 사용자를위한 추천입니다.
지능형 쿼리 응답 기술은 쿼리를 분석하고 쿼리와 관련된 일반화 된 관련 정보를 제공하는 데 사용됩니다. 예를 들면 : 검색 한 음식점의 주소와 전화 번호 대신 음식점 리뷰를 표시합니다.
CRM 용 데이터 마이닝 (고객 관계 관리)
고객 관계 관리는 데이터 마이닝으로 강화 될 수 있습니다. 좋은 고객 관계는 더 적합한 고객을 유치하고 교차 판매 및 상향 판매를 개선하고 유지율을 개선함으로써 구축 할 수 있습니다.
데이터 마이닝은 다음을 통해 CRM을 향상시킬 수 있습니다.
- 데이터 마이닝은 기업이 더 높은 응답과 더 나은 ROI를 위해 대상 프로그램을 만드는 데 도움이 될 수 있습니다.
- 기업은 상향 판매 및 교차 판매를 통해 고객이 원하는대로 더 많은 제품과 서비스를 제공하여 고객 만족도를 높일 수 있습니다.
- 데이터 마이닝을 통해 기업은 어떤 고객이 다른 옵션을 찾고 있는지 감지 할 수 있습니다. 이 정보를 사용하여 회사는 고객이 떠나지 못하도록 아이디어를 구축 할 수 있습니다.
데이터 마이닝은 다음과 같은 분야에서 CRM을 지원합니다.
- 데이터베이스 마케팅 : 마케팅 소프트웨어를 통해 기업은 고객에게 메시지와 이메일을 보낼 수 있습니다. 이 도구는 데이터 마이닝과 함께 타겟 마케팅을 수행 할 수 있습니다. 데이터 마이닝, 자동화 및 작업 스케줄링을 수행 할 수 있습니다. 더 나은 의사 결정에 도움이됩니다. 또한 어떤 종류의 고객이 신제품에 관심을 갖고 있는지, 어떤 시장 영역이 제품 출시에 적합한 지에 대한 기술적 결정에 도움이 될 것입니다.
- 고객 확보 캠페인 : 데이터 마이닝을 통해 시장 전문가는 제품이나 신규 구매자를 알지 못하는 잠재 고객을 식별 할 수 있습니다. 그들은 그러한 고객을위한 제안과 이니셔티브를 디자인 할 수있을 것입니다.
- 캠페인 최적화 : 기업은 캠페인의 효과를 위해 데이터 마이닝을 사용합니다. 마케팅 제안에 대한 고객 반응을 모델링 할 수 있습니다.
의사 결정 트리를 사용한 데이터 마이닝 예제
의사 결정 트리 알고리즘을 CART (분류 및 회귀 트리)라고합니다. 지도 학습 방법입니다. 트리 구조는 선택한 기능, 분할 조건 및 중지시기에 따라 작성됩니다. 의사 결정 트리는 이전 학습 데이터에서 학습 한 내용을 기반으로 클래스 변수의 값을 예측하는 데 사용됩니다.
내부 노드는 속성을 나타내고 리프 노드는 클래스 레이블을 나타냅니다.
(영상 출처 )
다음 단계는 의사 결정 트리 구조를 빌드하는 데 사용됩니다.
- 트리 (루트)의 맨 위에 최상의 속성을 배치하십시오.
- 하위 집합은 각 하위 집합이 특성에 대해 동일한 값을 가진 데이터를 나타내는 방식으로 생성됩니다.
- 동일한 단계를 반복하여 모든 분기의 리프 노드를 찾습니다.
클래스 레이블을 예측하기 위해 레코드의 속성을 트리의 루트와 비교합니다. 비교시 다음 분기가 선택됩니다. 도달 한 리프 노드가 클래스 변수를 예측할 때까지 내부 노드도 동일한 방식으로 비교됩니다.
의사 결정 트리 유도에 사용되는 일부 알고리즘에는 Hunt의 알고리즘, CART, ID3, C4.5, SLIQ 및 SPRINT가 있습니다.
데이터 마이닝의 가장 인기있는 예 : 마케팅 및 판매
마케팅 및 판매는 기업이 대량의 데이터를 보유하는 도메인입니다.
# 1) 은행 신용 평가에 도움이되는 데이터 마이닝 기술의 최초 사용자입니다. 데이터 마이닝은 고객이 은행에서 제공하는 서비스, ATM 카드를 사용하는 고객 유형 및 카드를 사용하여 일반적으로 구매하는 항목 (교차 판매)을 분석합니다.
은행은 데이터 마이닝을 사용하여 고객 이탈을 줄이기 위해 은행을 변경하기 전에 고객이 수행하는 거래를 분석합니다. 또한 거래의 일부 이상 값은 사기 감지를 위해 분석됩니다.
# 2) 휴대 전화 기업 데이터 마이닝 기술을 사용하여 이탈을 방지합니다. 이탈은 서비스를 떠나는 고객의 수를 나타내는 척도입니다. 고객이 서비스를 통해 고객을 유지하는 방법을 보여주는 패턴을 감지합니다.
# 3) 시장 바구니 분석 상점에서 함께 구매 한 품목 그룹을 찾는 기술입니다. 거래 분석은 빵과 버터와 같이 자주 함께 구매되는 품목이나 금요일 맥주와 같이 특정 날짜에 판매량이 많은 품목과 같은 패턴을 보여줍니다.
이 정보는 매장 레이아웃을 계획하는 데 도움이되며, 수요가 적은 품목에 대해 특별 할인을 제공하고, '2 회 구매시 1 회 무료'또는 '두 번째 구매시 50 % 적립'과 같은 제안을 생성합니다.
(영상 출처 )
데이터 마이닝을 사용하는 대기업
데이터 마이닝 기술을 사용하는 일부 온라인 회사는 다음과 같습니다.
- 아마존: Amazon은 Text Mining을 사용하여 제품의 최저 가격을 찾습니다.
- MC Donald의 : McDonald ’s는 빅 데이터 마이닝을 사용하여 고객 경험을 향상시킵니다. 고객의 주문 패턴, 대기 시간, 주문 크기 등을 연구합니다.
- NETFLIX : Netflix는 데이터 마이닝 인사이트를 사용하여 고객에게 인기있는 영화 또는 시리즈를 만드는 방법을 알아냅니다.
결론
데이터 마이닝은 은행, 마케팅, 의료, 통신 산업 및 기타 여러 분야와 같은 다양한 애플리케이션에서 사용됩니다.
데이터 마이닝 기술은 기업이 프로세스 및 운영을 조정하여 지식이 풍부한 정보를 얻고 수익성을 높이는 데 도움이됩니다. 숨겨진 패턴 및 트렌드 분석을 통해 비즈니스 의사 결정을 돕는 빠른 프로세스입니다.
의사 결정 트리 데이터 마이닝 알고리즘에 대해 자세히 알아 보려면 다가오는 자습서를 확인하십시오!