15 best etl tools 2021
자세한 비교와 함께 최고의 오픈 소스 ETL 도구 목록 :
ETL은 Extract, Transform 및 Load를 의미합니다. 데이터 소스에서 데이터를 추출하고 저장 및 향후 참조 목적을 위해 적절한 형식으로 변환하는 프로세스입니다.
마지막으로이 데이터는 데이터베이스에로드됩니다. 현재 기술 시대에 '데이터'라는 단어는 대부분의 비즈니스가이 데이터, 데이터 흐름, 데이터 형식 등을 중심으로 운영되기 때문에 매우 중요합니다. 최신 애플리케이션과 작업 방법론은 처리 목적과이를 위해 실시간 데이터를 필요로합니다. 이 목적을 충족시키기 위해 시장에 다양한 ETL 도구가 있습니다.
이러한 데이터베이스와 ETL 도구를 사용하면 데이터 관리 작업이 훨씬 쉬워지고 동시에 데이터웨어 하우징이 향상됩니다.
시장에서 사용 가능한 ETL 플랫폼은 비용과 시간을 크게 절약합니다. 그중 일부는 상업용 라이선스 도구이고 일부는 오픈 소스 무료 도구입니다.
이 기사에서는 시장에서 사용할 수있는 가장 인기있는 ETL 도구에 대해 자세히 살펴 보겠습니다.
학습 내용 :
- 시장에서 가장 인기있는 ETL 도구
- Hevo – 권장 ETL 도구
- # 1) Xplenty
- # 2) 스카이 비아
- # 3) IRI 탐욕
- # 4) 뿌리기
- # 5) DBConvert Studio By SLOTIX s.r.o.
- # 6) IT-PowerCenter
- # 7) IBM – Infosphere Information Server
- # 8) Oracle Data Integrator
- # 9) Microsoft – SQL Server 통합 서비스 (SSIS)
- # 10) ab initio
- # 11) Talend – 데이터 통합을위한 Talend Open Studio
- # 12) CloverDX 데이터 통합 소프트웨어
- # 13) Pentaho 데이터 통합
- # 14) 아파치가 아니라면
- # 15) SAS-데이터 통합 스튜디오
- # 16) SAP – BusinessObjects Data Integrator
- # 17) Oracle Warehouse Builder
- # 18) Sybase ETL
- # 19) DBSoftlab
- # 20) 재스퍼
- 결론
시장에서 가장 인기있는 ETL 도구
다음은 비교 세부 정보와 함께 최고의 오픈 소스 및 상용 ETL 소프트웨어 시스템 목록입니다.
Hevo – 권장 ETL 도구
코드없는 데이터 파이프 라인 플랫폼 인 Hevo는 모든 소스 (데이터베이스, 클라우드 애플리케이션, SDK 및 스트리밍)에서 모든 대상으로 실시간으로 데이터를 이동할 수 있도록 도와줍니다.
주요 특징들:
- 간편한 구현 : Hevo는 단 몇 분만에 설정하고 실행할 수 있습니다.
- 자동 스키마 감지 및 매핑 : Hevo의 강력한 알고리즘은 들어오는 데이터의 스키마를 감지하고 수동 개입없이 데이터웨어 하우스에서 동일하게 복제 할 수 있습니다.
- 실시간 아키텍처 : Hevo는 데이터가웨어 하우스에 실시간으로로드되도록하는 실시간 스트리밍 아키텍처를 기반으로합니다.
- ETL 및 ELT : Hevo에는 데이터를웨어 하우스로 이동하기 전과 후에 데이터를 정리, 변환 및 강화할 수있는 강력한 기능이 있습니다. 이를 통해 항상 분석 가능한 데이터를 확보 할 수 있습니다.
- 엔터프라이즈 급 보안 : Hevo는 GDPR, SOC II 및 HIPAA를 준수합니다.
- 경고 및 모니터링 : Hevo는 상세한 경고와 세분화 된 모니터링 설정을 제공하므로 항상 데이터를 파악할 수 있습니다.
# 1) Xplenty
Xplenty 클라우드 기반 ETL 솔루션은 광범위한 소스 및 대상에 걸쳐 자동화 된 데이터 흐름을위한 간단한 시각화 데이터 파이프 라인을 제공합니다.
이 회사의 강력한 온 플랫폼 변환 도구를 통해 고객은 규정 준수 모범 사례를 준수하면서 데이터를 정리, 정규화 및 변환 할 수 있습니다.
주요 특징들:
- BI를위한 데이터를 중앙 집중화하고 준비합니다.
- 내부 데이터베이스 또는 데이터웨어 하우스간에 데이터를 전송하고 변환합니다.
- 추가 타사 데이터를 Heroku Postgres (그런 다음 Heroku Connect를 통해 Salesforce로) 또는 Salesforce로 직접 보냅니다.
- Xplenty는 유일한 Salesforce to Salesforce ETL 도구입니다.
- 마지막으로 Xplenty는 Rest API 커넥터를 지원하여 모든 Rest API에서 데이터를 가져옵니다.
# 2) 스카이 비아
스카이 비아 Devart에서 개발 한 코딩없는 데이터 통합, 백업, 관리 및 액세스를위한 클라우드 데이터 플랫폼입니다. Devart 회사는 데이터 액세스 솔루션, 데이터베이스 도구, 개발 도구 및 기타 소프트웨어 제품을 제공하는 유명하고 신뢰할 수있는 제공 업체로 두 개의 R & D 부서에서 4 만 명 이상의 감사하는 고객을 보유하고 있습니다.
Skyvia에는 CSV 파일, 데이터베이스 (SQL Server, Oracle, PostgreSQL, MySQL), 클라우드 데이터웨어 하우스 (Amazon Redshift, Google BigQuery) 및 클라우드 애플리케이션 (Salesforce, HubSpot, Dynamics CRM, 그리고 많은 다른 사람들).
또한 클라우드 데이터 백업 도구, 온라인 SQL 클라이언트 및 OData 서비스로서의 서버 솔루션이 포함됩니다.
주요 특징들:
- Skyvia는 상용, 구독 기반 클라우드 솔루션 무료 요금제입니다.
- 마법사 기반의 코딩없는 통합 구성에는 많은 기술 지식이 필요하지 않습니다.
- 상수, 조회 및 데이터 변환을위한 강력한식이 포함 된 고급 매핑 설정.
- 일정에 따른 통합 자동화.
- 대상에서 소스 데이터 관계를 보존하는 기능.
- 중복없이 가져 오기.
- 양방향 동기화.
- 일반적인 통합 사례를위한 사전 정의 된 템플릿.
#삼)IRI 탐욕
폭식 는 기본 CoSort 엔진의 '적당한 양의 속도'가치와 구축 된 풍부한 데이터 검색, 통합, 마이그레이션, 거버넌스 및 분석 기능으로 가장 잘 알려진 온 프레미스 및 클라우드 지원 ETL 및 데이터 관리 플랫폼입니다. -in 및 Eclipse에서.
Voracity는 수백 개의 데이터 소스를 지원하고 BI 및 시각화 대상을 '생산 분석 플랫폼'으로 직접 제공합니다.
Voracity 사용자는 이미 최적화 된 E, T 및 L 작업을 결합하는 실시간 또는 배치 작업을 설계하거나 플랫폼을 사용하여 성능 또는 가격 책정상의 이유로 Informatica와 같은 기존 ETL 도구를 '속도를 높이거나 종료'할 수 있습니다. Voracity 속도는 Ab Initio에 가깝지만 비용은 Pentaho에 가깝습니다.
주요 특징들:
- 정형, 반 및 비정형 데이터, 정적 및 스트리밍, 레거시 및 최신, 온 프레미스 또는 클라우드를위한 다양한 커넥터.
- 함께 지정된 여러 변환, 데이터 품질 및 마스킹 기능을 포함하여 작업 및 IO 통합 데이터 조작.
- 다중 스레드, 리소스 최적화 IRI CoSort 엔진에 의해 구동되거나 MR2, Spark, Spark Stream, Storm 또는 Tez에서 상호 교환 가능한 변환.
- 사전 정렬 된 대량로드, 테스트 테이블, 사용자 지정 형식 파일, 파이프 및 URL, NoSQL 컬렉션 등을 포함한 동시 대상 정의
- 데이터 매핑 및 마이그레이션은 엔디안, 필드, 레코드, 파일 및 테이블 구조를 다시 포맷하고 대리 키를 추가하는 등의 작업을 수행 할 수 있습니다.
- ETL, 부분 집합 화, 복제, 변경 데이터 캡처, 느리게 변경되는 차원, 테스트 데이터 생성 등을위한 기본 제공 마법사
- 값을 찾고, 필터링, 통합, 교체, 검증, 규제, 표준화 및 합성하는 데이터 정리 기능 및 규칙.
- 동일 패스보고, 랭 글링 (Cognos, Qlik, R, Tableau, Spotfire 등) 또는 분석을 위해 Splunk 및 KNIME과의 통합.
- 강력한 작업 설계, 예약 및 배포 옵션과 Git 및 IAM 지원 메타 데이터 관리.
- Erwin Mapping Manager (레거시 ETL 작업 변환 용) 및 Metadata Integration Model Bridge와의 메타 데이터 호환성.
Voracity는 오픈 소스가 아니지만 여러 엔진이 필요한 경우 Talend보다 가격이 저렴합니다. 구독 가격에는 지원, 문서, 무제한 클라이언트 및 데이터 소스가 포함되며 영구 및 런타임 라이선스 옵션도 사용할 수 있습니다.
=> Voracity에 대해 알아보고 무료 평가판 또는 라이브 데모를 보려면 클릭하십시오.# 4) 뿌리기
소량 는 사용자가 여러 데이터 소스에서 데이터를 수집하고 데이터를 선호하는 데이터웨어 하우스로 이동하여 이동 중에 보고서를 작성하는 것부터 완전한 데이터 여정을 바로 자동화 할 수있는 종단 간 데이터 관리 및 분석 플랫폼입니다. Sprinkle은 SaaS와 온 프레미스 배포 옵션을 모두 제공합니다.
Sprinkle의 실시간 데이터 파이프 라인 솔루션을 통해 기업은 비즈니스 의사 결정을 더 빠르게 내릴 수 있으므로 전반적인 비즈니스 성장에 기여할 수 있습니다. Sprinkle의 향상된 데이터 보안은 데이터가 고객 사내 외부로 나가지 않도록하여 100 % 데이터 보안을 보장합니다.
Sprinkle의 코드없는 플랫폼을 사용하면 기술 역량에 관계없이 조직 전체의 모든 직원이 데이터에 액세스 할 수 있습니다. 이는 비즈니스 팀이 더 이상 통찰력을 제공하기 위해 데이터 과학 팀에 의존하지 않아도되므로 비즈니스 결정을 더 빠르게 할 수 있습니다.
Sprinkle에는 드릴 다운 기능이있는 끌어서 놓기 보고서가있는 대화 형 대시 보드를 구축하는 데 사용할 수있는 선택적 통합 고급보고 및 BI 모듈이 있습니다.
뿌리의 특징 :
- 제로 코드 수집 : 자동 스키마 검색 및 데이터 유형을웨어 하우스 유형에 매핑합니다. JSON 데이터도 지원합니다.
- 독점 변환 코드 없음 : Sprinkle은 ELT를 수행합니다 (레거시 ETL보다 훨씬 더 많은 유연성과 확장 성을 제공합니다). SQL 또는 Python으로 변환을 작성합니다.
- Jupyter 노트북 ML 파이프 라인을 구축하기위한 인터페이스.
- 즉시 사용 가능한 증분 변환 : 이름에서 알 수 있듯이 변경 / 새 데이터에만 변환을 적용하는 것을 의미합니다.
- 고객의 네트워크를 벗어나는 데이터 없음 : Sprinkle은 고객의 클라우드 내에서 고객의 VM에서 실행할 수있는 엔터프라이즈 버전을 제공합니다.
# 5)DBConvert Studio By SLOTIX s.r.o.
DBConvert Studio 독점 할인 : 쿠폰 코드로 20 % 할인 “20OffSTH” 결제 중.
DBConvert Studio는 온 프레미스 및 클라우드 데이터베이스를위한 데이터 ETL 솔루션입니다. Oracle, MS SQL, MySQL, PostgreSQL, MS FoxPro, SQLite, Firebird, MS Access, DB2 및 Amazon RDS, Amazon Aurora, MS Azure SQL, Google Cloud 클라우드 데이터와 같은 다양한 데이터베이스 형식간에 데이터를 추출, 변환 및로드합니다.
GUI 모드를 사용하여 마이그레이션 설정을 조정하고 변환 또는 동기화를 시작합니다. 명령 줄 모드에서 저장된 작업 실행을 예약합니다.
첫째, DBConvert studio는 데이터베이스에 대한 동시 연결을 생성합니다. 그런 다음 마이그레이션 / 복제 프로세스를 추적하기위한 별도의 작업이 생성됩니다. 데이터는 단방향 또는 양방향 방식으로 마이그레이션하거나 동기화 할 수 있습니다.
데이터베이스 구조 및 개체의 복사는 데이터 유무에 관계없이 가능합니다. 잠재적 인 최종 오류를 방지하기 위해 각 개체를 검토하고 사용자 지정할 수 있습니다.
주요 특징들:
- DBConvert Studio는 상업용 라이선스 도구입니다.
- 무료 평가판을 테스트 할 수 있습니다.
- 자동 스키마 마이그레이션 및 데이터 유형 매핑.
- 마법사 기반의 코딩없는 조작이 필요합니다.
- 스케줄러 또는 명령 줄을 통해 실행되는 세션 / 작업을 자동화합니다.
- 단방향 동기화
- 양방향 동기화
- 보기 및 쿼리 마이그레이션.
- 프로세스를 모니터링하기 위해 마이그레이션 및 동기화 로그를 생성합니다.
- 대용량 데이터베이스를 마이그레이션하는 대량 기능이 포함되어 있습니다.
- 테이블, 필드, 인덱스, 쿼리 / 뷰로 모든 요소의 변환을 활성화 / 비활성화 할 수 있습니다.
- 마이그레이션 또는 동기화 프로세스가 시작되기 전에 데이터 유효성 검사가 가능합니다.
# 6) IT-PowerCenter
Informatica는 500 개 이상의 글로벌 파트너와 월 1 조 건 이상의 트랜잭션을 보유한 엔터프라이즈 클라우드 데이터 관리의 리더입니다. 미국 캘리포니아에 본사를두고 1993 년에 설립 된 소프트웨어 개발 회사입니다. 매출은 10 억 5 천만 달러이고 총 직원 수는 약 4,000 명입니다.
PowerCenter는 데이터 통합을 위해 Informatica에서 개발 한 제품입니다. 데이터 통합 라이프 사이클을 지원하고 중요한 데이터와 가치를 비즈니스에 제공합니다. PowerCenter는 방대한 양의 데이터와 모든 데이터 유형 및 데이터 통합을위한 모든 소스를 지원합니다.
주요 특징들:
- PowerCenter는 상업용 라이선스 도구입니다.
- 쉽게 사용할 수있는 도구이며 쉬운 교육 모듈이 있습니다.
- 데이터 분석, 애플리케이션 마이그레이션 및 데이터웨어 하우징을 지원합니다.
- PowerCenter는 다양한 클라우드 애플리케이션을 연결하고 Amazon Web Services 및 Microsoft Azure에서 호스팅됩니다.
- PowerCenter는 민첩한 프로세스를 지원합니다.
- 다른 도구와 통합 할 수 있습니다.
- 개발, 테스트 및 프로덕션 환경에서 자동화 된 결과 또는 데이터 유효성 검사.
- 비전문가가 작업을 실행하고 모니터링 할 수 있으므로 비용이 절감됩니다.
공식 사이트를 방문하십시오. 여기 .
# 7) IBM – Infosphere Information Server
IBM은 1911 년에 설립 된 다국적 소프트웨어 회사로 미국 뉴욕에 본사를두고 있으며 170 개국 이상에 지사를두고 있습니다. 2016 년 기준으로 790 억 1 천만 달러의 매출을 올렸으며 현재 근무하는 총 직원 수는 38 만 명입니다.
Infosphere Information Server는 2008 년에 개발 된 IBM의 제품입니다. 비즈니스에 중요한 가치를 이해하고 제공하는 데 도움이되는 데이터 통합 플랫폼의 선두 주자입니다. 주로 빅 데이터 회사 및 대규모 기업을 위해 설계되었습니다.
주요 특징들 :
- 상업적으로 사용이 허가 된 도구입니다.
- Infosphere Information Server는 종단 간 데이터 통합 플랫폼입니다.
- Oracle, IBM DB2 및 Hadoop System과 통합 할 수 있습니다.
- 다양한 플러그인을 통해 SAP를 지원합니다.
- 데이터 거버넌스 전략을 개선하는 데 도움이됩니다.
- 또한 비용 절감을 위해 비즈니스 프로세스를 자동화하는 데 도움이됩니다.
- 모든 데이터 유형에 대해 여러 시스템에서 실시간 데이터 통합.
- 기존 IBM의 라이센스 도구는 쉽게 통합 할 수 있습니다.
공식 사이트를 방문하십시오. 여기 .
# 8) Oracle Data Integrator
Oracle은 캘리포니아에 본사를두고있는 미국의 다국적 기업으로 1977 년에 설립되었습니다. 2017 년 기준 매출은 372 억 2 천만 달러이고 총 직원 수는 138,000 명입니다.
ODI (Oracle Data Integrator)는 데이터 통합을 구축하고 관리하기위한 그래픽 환경입니다. 이 제품은 마이그레이션 요구 사항이 빈번한 대규모 조직에 적합합니다. 대용량 데이터, SOA 지원 데이터 서비스를 지원하는 포괄적 인 데이터 통합 플랫폼입니다.
주요 특징들 :
- Oracle Data Integrator는 상용 라이센스가있는 RTL 도구입니다.
- 흐름 기반 인터페이스의 재 설계로 사용자 경험을 개선합니다.
- 데이터 변환 및 통합 프로세스를위한 선언적 설계 접근 방식을 지원합니다.
- 더 빠르고 간단한 개발 및 유지 관리.
- 결함있는 데이터를 자동으로 식별하고 대상 애플리케이션으로 이동하기 전에 재활용합니다.
- Oracle Data Integrator는 IBM DB2, Teradata, Sybase, Netezza, Exadata 등과 같은 데이터베이스를 지원합니다.
- 고유 한 E-LT 아키텍처는 ETL 서버가 필요하지 않으므로 비용이 절감됩니다.
- 기존 RDBMS 기능을 사용하여 데이터를 처리하고 변환하기 위해 다른 Oracle 제품과 통합됩니다.
공식 사이트를 방문하십시오. 여기 .
# 9) Microsoft – SQL Server 통합 서비스 (SSIS)
.net 인터뷰 질문 및 답변
Microsoft Corporation은 워싱턴을 기반으로 1975 년에 설립 된 미국의 다국적 기업입니다. 총 직원 수는 124,000 명이며 매출은 894 억 5 천만 달러입니다.
SSIS는 Microsoft 제품이며 데이터 마이그레이션을 위해 개발되었습니다. 데이터 통합은 통합 프로세스와 데이터 변환이 메모리에서 처리되므로 훨씬 더 빠릅니다. Microsoft 제품이므로 SSIS는 Microsoft SQL Server 만 지원합니다.
주요 특징들 :
- SSIS는 상업용 라이선스 도구입니다.
- SSIS 가져 오기 / 내보내기 마법사를 사용하면 원본에서 대상으로 데이터를 이동할 수 있습니다.
- SQL Server 데이터베이스의 유지 관리를 자동화합니다.
- SSIS 패키지 편집을위한 끌어서 놓기 사용자 인터페이스.
- 데이터 변환에는 텍스트 파일 및 기타 SQL Server 인스턴스가 포함됩니다.
- SSIS에는 프로그래밍 코드 작성에 사용할 수있는 기본 제공 스크립팅 환경이 있습니다.
- 플러그인을 사용하여 salesforce.com 및 CRM과 통합 할 수 있습니다.
- 디버깅 기능 및 흐름을 쉽게 처리하는 오류.
- SSIS는 TFS, GitHub 등과 같은 변경 제어 소프트웨어와 통합 될 수도 있습니다.
공식 사이트를 방문하십시오. 여기 .
# 10) ab initio
Ab Initio는 미국 매사추세츠에서 1995 년에 설립 된 미국 민간 기업 소프트웨어 회사입니다. 영국, 일본, 프랑스, 폴란드, 독일, 싱가포르 및 호주에 전 세계에 지사를두고 있습니다. Ab Initio는 애플리케이션 통합 및 대용량 데이터 처리에 특화되어 있습니다.
여기에는 Co> Operating System, The Component Library, Graphical Development Environment, Enterprise Meta> Environment, Data Profiler, Conduct> It 등 6 개의 데이터 처리 제품이 포함되어 있습니다. “Ab Initio Co> Operating System”은 끌어서 놓기 기능이있는 GUI 기반 ETL 도구입니다.
주요 특징들 :
- Ab Initio는 상업용 라이선스 도구이며 시장에서 가장 비싼 도구입니다.
- Ab Initio의 기본 기능은 배우기 쉽습니다.
- Ab Initio Co> 운영 체제는 데이터 처리 및 나머지 도구 간의 통신을위한 일반 엔진을 제공합니다.
- Ab Initio 제품은 병렬 데이터 처리 애플리케이션을위한 사용자 친화적 인 플랫폼에서 제공됩니다.
- 병렬 처리는 많은 양의 데이터를 처리 할 수있는 기능을 제공합니다.
- Windows, Unix, Linux 및 Mainframe 플랫폼을 지원합니다.
- 일괄 처리, 데이터 분석, 데이터 조작 등과 같은 기능을 수행합니다.
- Ab Initio 제품을 사용하는 사용자는 NDA에 서명하여 기밀을 유지해야합니다.
공식 사이트를 방문하십시오. 여기 .
# 11) Talend – 데이터 통합을위한 Talend Open Studio
Talend는 미국 캘리포니아에 본사를두고 2005 년에 설립 된 미국 기반 소프트웨어 회사입니다. 현재 총 직원 수는 약 600 명입니다.
데이터 통합을위한 Talend Open Studio는 2006 년에 소개 된 회사의 첫 번째 제품입니다. 데이터웨어 하우징, 마이그레이션 및 프로파일 링을 지원합니다. 데이터 통합 및 모니터링을 지원하는 데이터 통합 플랫폼입니다. 회사는 데이터 통합, 데이터 관리, 데이터 준비, 엔터프라이즈 응용 프로그램 통합 등을위한 서비스를 제공합니다.
주요 특징들 :
- Talend는 무료 오픈 소스 ETL 도구입니다.
- 데이터 통합을위한 최초의 상용 오픈 소스 소프트웨어 공급 업체입니다.
- 다양한 데이터 소스를 연결하기위한 900 개 이상의 내장 구성 요소.
- 드래그 앤 드롭 인터페이스.
- GUI 및 내장 구성 요소를 사용하여 배포에 필요한 생산성과 시간을 향상시킵니다.
- 클라우드 환경에서 쉽게 배포 할 수 있습니다.
- 데이터를 병합하고 기존 및 빅 데이터를 Talend Open Studio로 변환 할 수 있습니다.
- 온라인 사용자 커뮤니티는 모든 기술 지원을받을 수 있습니다.
공식 사이트를 방문하십시오. 여기 .
# 12) CloverDX 데이터 통합 소프트웨어
CloverDX는 중견 기업에서 대기업 수준의 기업이 세계에서 가장 어려운 데이터 관리 과제를 해결할 수 있도록 지원합니다.
CloverDX 데이터 통합 플랫폼은 조직에 고급 개발자 도구와 확장 가능한 자동화 및 오케스트레이션 백엔드가 포함 된 데이터 집약적 운영을 위해 설계된 강력하면서도 끝없이 유연한 환경을 제공합니다.
2002 년에 설립 된 CloverDX는 현재 100 명 이상의 팀을 보유하고 있으며 모든 분야의 개발자와 컨설팅 전문가를 결합하여 기업이 데이터를 지배 할 수 있도록 전 세계적으로 운영됩니다.
주요 특징들 :
- CloverDX는 상용 ETL 소프트웨어입니다.
- CloverDX에는 Java 기반 프레임 워크가 있습니다.
- 설치가 쉽고 사용자 인터페이스가 간단합니다.
- 다양한 소스의 단일 형식으로 비즈니스 데이터를 결합합니다.
- Windows, Linux, Solaris, AIX 및 OSX 플랫폼을 지원합니다.
- 데이터 변환, 데이터 마이그레이션, 데이터웨어 하우징 및 데이터 정리에 사용됩니다.
- Clover 개발자로부터 지원을받을 수 있습니다.
- 소스의 데이터를 사용하여 다양한 보고서를 작성하는 데 도움이됩니다.
- 데이터 및 프로토 타입을 사용한 신속한 개발.
공식 사이트를 방문하십시오. 여기 .
# 13) Pentaho 데이터 통합
Pentaho는 Pentaho Data Integration (PDI)으로 알려진 제품을 제공하는 소프트웨어 회사이며 Kettle이라고도합니다. 미국 플로리다에 본사를두고 있으며 데이터 통합, 데이터 마이닝 및 STL 기능과 같은 서비스를 제공합니다. 2015 년에 Pentaho는 Hitachi Data System에 인수되었습니다.
Pentaho Data Integration을 통해 사용자는 다양한 소스의 데이터를 정리하고 준비 할 수 있으며 애플리케이션간에 데이터를 마이그레이션 할 수 있습니다. PDI는 오픈 소스 도구이며 Pentaho 비즈니스 인텔리전트 제품군의 일부입니다.
주요 특징들 :
- PDI는 Enterprise 및 Community 에디션에서 사용할 수 있습니다.
- 엔터프라이즈 플랫폼에는 Pentaho 플랫폼의 기능을 향상시키는 추가 구성 요소가 있습니다.
- 사용하기 쉽고 배우고 이해하기 쉽습니다.
- PDI는 구현을 위해 메타 데이터 접근 방식을 따릅니다.
- 끌어서 놓기 기능이있는 사용자 친화적 인 그래픽 인터페이스.
- ETL 개발자는 자신의 작업을 만들 수 있습니다.
- 공유 라이브러리는 ETL 실행 및 개발 프로세스를 단순화합니다.
공식 사이트를 방문하십시오. 여기 .
# 14) 아파치가 아니라면
우분투가 창에 비해 얼마나 좋은지
Apache Nifi는 Apache Software Foundation에서 개발 한 소프트웨어 프로젝트입니다. Apache Software Foundation (ASF)은 1999 년 미국 메릴랜드에 본사를두고 설립되었습니다. ASF에서 개발 한 소프트웨어는 Apache 라이선스에 따라 배포되며 무료 및 오픈 소스 소프트웨어입니다.
Apache Nifi는 자동화를 사용하여 다양한 시스템 간의 데이터 흐름을 단순화합니다. 데이터 흐름은 프로세서로 구성되며 사용자는 자신의 프로세서를 만들 수 있습니다. 이러한 흐름은 템플릿으로 저장하고 나중에 더 복잡한 흐름과 통합 할 수 있습니다. 그런 다음 이러한 복잡한 흐름을 최소한의 노력으로 여러 서버에 배포 할 수 있습니다.
주요 특징들:
- Apache Nifi는 오픈 소스 소프트웨어 프로젝트입니다.
- 사용하기 쉽고 데이터 흐름을위한 강력한 시스템입니다.
- 데이터 흐름에는 데이터를 전송, 수신, 전송, 필터링 및 이동하는 사용자가 포함됩니다.
- 웹 기반 애플리케이션을 지원하는 흐름 기반 프로그래밍 및 간단한 사용자 인터페이스.
- GUI는 특정 요구 사항에 따라 사용자 지정됩니다.
- 종단 간 데이터 흐름 추적.
- HTTPS, SSL, SSH, 다중 테넌트 인증 등을 지원합니다.
- 다양한 데이터 흐름을 구축, 업데이트 및 제거하기위한 최소한의 수동 개입.
공식 사이트를 방문하십시오. 여기 .
# 15) SAS-데이터 통합 스튜디오
SAS Data Integration Studio는 데이터 통합 프로세스를 구축하고 관리하기위한 그래픽 사용자 인터페이스입니다.
데이터 소스는 통합 프로세스를위한 모든 애플리케이션 또는 플랫폼이 될 수 있습니다. 개발자가 작업을 빌드, 예약, 실행 및 모니터링 할 수있는 강력한 변환 논리가 있습니다.
주요 특징들 :
- 데이터 통합 프로세스의 실행 및 유지 관리를 단순화합니다.
- 사용하기 쉽고 마법사 기반 인터페이스.
- SAS Data Integration Studio는 데이터 통합 문제에 대응하고 극복 할 수있는 유연하고 안정적인 도구입니다.
- 속도와 효율성으로 문제를 해결하여 데이터 통합 비용을 절감합니다.
공식 사이트를 방문하십시오. 여기 .
# 16) SAP – BusinessObjects Data Integrator
BusinessObjects Data Integrator는 데이터 통합 및 ETL 도구입니다. 주로 데이터 통합 자 작업 서버와 데이터 통합 자 디자이너로 구성됩니다. BusinessObjects 데이터 통합 프로세스는 데이터 통합, 데이터 프로파일 링, 데이터 감사 및 데이터 정리로 나뉩니다.
SAP BusinessObjects Data Integrator를 사용하면 모든 소스에서 데이터를 추출하여 모든 데이터웨어 하우스에로드 할 수 있습니다.
주요 특징들 :
- 분석 환경에서 데이터를 통합하고로드하는 데 도움이됩니다.
- Data Integrator는 데이터웨어 하우스, 데이터 마트 등을 구축하는 데 사용됩니다.
- Data Integrator 웹 관리자는 다양한 저장소, 메타 데이터, 웹 서비스 및 작업 서버를 관리 할 수있는 웹 인터페이스입니다.
- 배치 작업을 예약, 실행 및 모니터링하는 데 도움이됩니다.
- Windows, Sun Solaris, AIX 및 Linux 플랫폼을 지원합니다.
공식 사이트를 방문하십시오. 여기 .
# 17) Oracle Warehouse Builder
오라클은 Oracle Warehouse Builder (OWB)로 알려진 ETL 도구를 도입했습니다. 데이터 통합 프로세스를 구축하고 관리하는 데 사용되는 그래픽 환경입니다.
OWB는 통합 목적으로 데이터웨어 하우스의 다양한 데이터 소스를 사용합니다. OWB의 핵심 기능은 데이터 프로파일 링, 데이터 정리, 완전히 통합 된 데이터 모델링 및 데이터 감사입니다. OWB는 Oracle 데이터베이스를 사용하여 다양한 소스의 데이터를 변환하고 다양한 타사 데이터베이스를 연결하는 데 사용됩니다.
주요 특징들 :
- OWB는 데이터 통합 전략을위한 포괄적이고 유연한 도구입니다.
- 사용자가 ETL 프로세스를 설계하고 구축 할 수 있습니다.
- 다양한 공급 업체의 40 개의 메타 데이터 파일을 지원합니다.
- OWB는 플랫 파일, Sybase, SQL Server, Informix 및 Oracle Database를 대상 데이터베이스로 지원합니다.
- OWB는 숫자, 텍스트, 날짜 등과 같은 데이터 유형을 지원합니다.
공식 사이트를 방문하십시오. 여기 .
# 18) Sybase ETL
Sybase는 데이터 통합 시장에서 강력한 플레이어입니다. Sybase ETL 도구는 다른 데이터 소스에서 데이터를로드 한 다음이를 데이터 세트로 변환하고 마지막으로이 데이터를 데이터웨어 하우스로로드하기 위해 개발되었습니다.
Sybase ETL은 Sybase ETL Server 및 Sybase ETL Development와 같은 하위 구성 요소를 사용합니다.
주요 특징들 :
- Sybase ETL은 데이터 통합을위한 자동화를 제공합니다.
- 데이터 통합 작업을 생성하는 간단한 GUI.
- 이해하기 쉽고 별도의 교육이 필요하지 않습니다.
- Sybase ETL 대시 보드는 프로세스가 정확히 어디에 있는지 빠르게 보여줍니다.
- 실시간보고 및 더 나은 의사 결정 프로세스.
- Windows 플랫폼 만 지원합니다.
- 데이터 통합 및 추출 프로세스에 대한 비용, 시간 및 인적 노력을 최소화합니다.
공식 사이트를 방문하십시오. 여기 .
# 19) DBSoftlab
DB 소프트웨어 연구소는 세계적인 기업에 종단 간 데이터 통합 솔루션을 제공하는 ETL 도구를 도입했습니다. DBSoftlab 디자인 제품은 비즈니스 프로세스를 자동화하는 데 도움이됩니다.
이 자동화 된 프로세스를 사용하면 사용자는 언제든 ETL 프로세스를보고 정확히 어디에 있는지 볼 수 있습니다.
주요 특징들 :
- 상업적으로 라이센스 된 ETL 도구입니다.
- 사용하기 쉽고 빠른 ETL 도구입니다.
- Text, OLE DB, Oracle, SQL Server, XML, Excel, SQLite, MySQL 등과 함께 사용할 수 있습니다.
- 이메일과 같은 데이터 소스에서 데이터를 추출합니다.
- 엔드 투 엔드 비즈니스 자동화 프로세스.
공식 사이트를 방문하십시오. 여기 .
# 20) 재스퍼
Jaspersoft는 미국 캘리포니아에 본사를두고 1991 년에 시작된 데이터 통합 분야의 리더입니다. 다른 다양한 소스에서 데이터를 추출, 변환 및로드하여 데이터웨어 하우스로 보냅니다.
Jaspersoft는 Jaspersoft Business Intelligent 제품군의 일부입니다. Jaspersoft ETL은 고성능 ETL 기능을 갖춘 데이터 통합 플랫폼입니다.
주요 특징들 :
- Jaspersoft ETL은 오픈 소스 ETL 도구입니다.
- 작업 실행 및 성능을 모니터링하는 데 도움이되는 활동 모니터링 대시 보드가 있습니다.
- SugarCRM, SAP, Salesforce.com 등과 같은 애플리케이션에 연결되어 있습니다.
- 또한 BigData 환경 Hadoop, MongoDB 등에 연결됩니다.
- ETL 프로세스를보고 편집 할 수있는 그래픽 편집기를 제공합니다.
- GUI를 사용하여 사용자가 데이터 이동, 변환 등을 설계, 예약 및 실행할 수 있습니다.
- 실시간, 엔드 투 엔드 프로세스 및 ETL 통계 추적.
- 중소기업에 적합합니다.
공식 사이트를 방문하십시오. 여기 .
# 21) 즉흥
Improvado 마케팅 담당자가 모든 데이터를 한곳에 보관할 수 있도록 도와주는 데이터 분석 소프트웨어입니다. 이 마케팅 ETL 플랫폼을 사용하면 마케팅 API를 모든 시각화 도구에 연결할 수 있으며이를 위해 기술적 인 기술이 필요하지 않습니다.
100 개 이상의 데이터 소스 유형과 연결하는 기능이 있습니다. 데이터 소스와 연결하기위한 커넥터 세트를 제공합니다. 클라우드 또는 온 프레미스에서 하나의 플랫폼을 통해 이러한 데이터 소스를 연결하고 관리 할 수 있습니다.
주요 특징들:
- 요구 사항에 따라 원시 또는 매핑 된 데이터를 제공 할 수 있습니다.
- 비즈니스 결정에 도움이되는 교차 채널 메트릭을 비교하는 기능이 있습니다.
- 기여 모델을 변경하는 기능이 있습니다.
- Google Analytics 데이터를 광고 데이터와 매핑하는 기능이 있습니다.
- Improvado 대시 보드에서 또는 원하는 BI 도구를 사용하여 데이터를 시각화 할 수 있습니다.
# 22) 마 틸리 온
Matillion 클라우드 데이터웨어 하우스를위한 데이터 변환 솔루션입니다. Matillion은 클라우드 데이터웨어 하우스의 기능을 활용하여 대규모 데이터 세트를 통합하고 데이터 분석을 준비하는 데 필요한 데이터 변환을 신속하게 수행합니다.
우리의 솔루션은 Amazon Redshift, Snowflake 및 Google BigQuery를 위해 특별히 제작되어 다양한 소스에서 데이터를 추출하고 회사가 선택한 클라우드 데이터웨어 하우스에로드하고 해당 데이터를 사일로 상태에서 유용하고 결합 된 상태로 변환합니다. 규모에 맞는 분석 준비 데이터.
이 제품은 데이터의 숨겨진 잠재력을 열어 기업이 단순성, 속도, 확장 성 및 비용 절감을 달성 할 수 있도록 지원합니다. Matillion의 소프트웨어는 Bose, GE, Siemens, Fox, Accenture와 같은 글로벌 기업과 Vistaprint, Splunk, Zapier와 같은 기타 고성장 데이터 중심 기업을 포함하여 40 개국의 650 명 이상의 고객이 사용하고 있습니다.
이 회사는 또한 고객의 사용자 만족도 점수만으로도 편파적이지 않은 피드백을 기반으로 한 TrustRadius의 데이터 통합 부문에서 2019 년 최고 등급 어워드 수상자로 선정되었습니다. 이 회사는 또한 AWS Marketplace에서 가장 높은 등급의 ETL 제품을 보유하고 있으며 고객의 90 %가 Matillion을 추천하겠다고 말했습니다.
주요 특징들:
- 선호하는 클라우드 플랫폼에서 제품을 실행하고 몇 분 내에 ETL 작업 개발을 시작하십시오.
- 몇 분 안에 70 개 이상의 커넥터를 사용하여 다양한 소스에서 데이터를로드합니다.
- 트랜잭션, 의사 결정 및 루프가 포함 된 정교한 워크 플로의 시각적 오케스트레이션을위한 로우 코드 / 노 코드 브라우저 기반 환경입니다.
- 재사용 가능한 매개 변수 기반 작업을 설계합니다.
- 자체 문서화 데이터 변환 프로세스를 구축합니다.
- ETL 작업을 예약하고 검토합니다.
- 고성능 BI / 시각화를 위해 데이터를 모델링합니다.
- 종량제 청구.
목록에 몇 가지 다른 :
# 23) 정보 빌더 – iWay 소프트웨어
iWay DataMigrator는 ETL 프로세스를 단순화하는 강력한 데이터 통합 도구이자 B2B 통합 도구입니다.
XML, 관계형 데이터베이스 및 JSON에서 데이터를 검색합니다. iWay Data-migrator는 UNIX, Linux 및 Windows와 같은 거의 모든 플랫폼에서 실행됩니다. 또한 JDBC, ODBC 연결을 사용하여 다양한 데이터베이스 액세스에 연결합니다.
공식 사이트를 방문하십시오. 여기.
# 24) Cognos 데이터 관리자
IBM Cognos Data Manager는 ETL 프로세스 및 고성능 비즈니스 인텔리전스를 수행하는 데 사용됩니다.
그것은 글로벌 데이터 통합 플랫폼을 만들 수있는 다국어 지원의 특별한 기능을 가지고 있습니다. IBM Cognos Data Manager는 비즈니스 프로세스를 자동화하며 Windows, UNIX 및 Linux 플랫폼을 지원합니다.
공식 사이트를 방문하십시오. 여기 .
# 25) QlikView Expressor
QlikView Expressor는 ETL 도구를 간단하고 이해하기 쉽습니다. 이제 Qlik과 통합되었습니다. Qlik은 메타 데이터 관리 및 ETL 도구입니다.
Free Desktop Edition, Standard Edition 및 Enterprise Edition의 세 가지 버전이 있습니다. 그리고 QlikView Expressor는 데스크톱, 데이터 통합 엔진 및 리포지토리의 세 가지 구성 요소로 구성됩니다.
공식 사이트를 방문하십시오. 여기 .
# 26) 퍼베이시브 데이터 통합 자
Pervasive Data Integrator 도구는 ETL 도구입니다. 데이터 소스와 응용 프로그램을 빠르게 연결하는 데 도움이됩니다.
실시간 데이터 교환 및 데이터 마이그레이션을 지원하는 강력한 데이터 통합 플랫폼입니다. 도구에서 사용되는 구성 요소는 재사용이 가능하므로 이러한 구성 요소를 여러 번 배포 할 수 있습니다.
공식 사이트를 방문하십시오. 여기 .
# 27) Apache Airflow
Apache Airflow는 조기 상태이며 ASF (Apache Software Foundation)에서 지원합니다.
Apache Airflow는 프로그래밍 방식으로 워크 플로를 생성, 예약 및 모니터링합니다. 또한 필요할 때 작업을 실행하도록 스케줄러를 수정할 수 있습니다.
공식 사이트를 방문하십시오. 여기 .
결론
지금까지 시장에서 사용할 수있는 다양한 ETL 도구를 자세히 살펴 보았습니다. 현재 시장에서 ETL 도구는 상당한 가치를 가지고 있으며 추출, 변환 및 로딩 방법의 단순화 된 방법을 식별하는 데 매우 중요합니다.
시장에서 사용할 수있는 다양한 도구는 작업을 완료하는 데 도움이되지만 요구 사항에 따라 다릅니다.
에 lso 읽기 = >> 최고의 데이터웨어 하우스 자동화 도구
여러 회사가 데이터웨어 하우스 개념을 사용하고 있으며 기술과 분석의 결합으로 데이터웨어 하우스가 지속적으로 성장하여 ETL 도구의 사용이 증가 할 것입니다.
= >> 문의하기 여기에 목록을 제안합니다.추천 도서
- 최고의 소프트웨어 테스트 도구 2021 (QA 테스트 자동화 도구)
- ETL 프로세스에 유용한 10 가지 최고의 데이터 매핑 도구 (2021 목록)
- 완벽한 데이터 무결성을위한 13 가지 최고의 데이터 마이그레이션 도구 (2021 목록)
- 15 가지 최고의 무료 데이터 마이닝 도구 : 가장 포괄적 인 목록
- ETL 테스트 데이터웨어 하우스 테스트 자습서 (전체 가이드)
- 데이터 수집 전략을 갖춘 10 개 이상의 최고의 데이터 수집 도구
- 2021 년 상위 10 개 ETL 테스트 도구
- 2021 년 상위 15 개 빅 데이터 도구 (빅 데이터 분석 도구)