top 32 best datastage interview questions
다가오는 인터뷰를 준비하는 데 도움이되는 가장 자주 묻는 Datastage 인터뷰 질문 및 답변 목록 :
DataStage는 현재 시장에서 사용 가능한 매우 인기있는 ETL 도구입니다.
이 기사에서는 IBM Datastage 인터뷰를위한 매우 유용한 질문과 대답을 공유합니다. 아래 Datastage 인터뷰 질문을 통해 인터뷰를 쉽게 진행할 수 있습니다.
신입생과 경험 많은 전문가에게 도움이 될 Datastage 인터뷰 질문에 대한 자세한 답변을 다루었습니다.
추천 읽기 => ETL 테스트 인터뷰 질문
가장 일반적인 Datastage 인터뷰 질문 및 답변
시작하자!
Q # 1) Datastage 란 무엇입니까?
대답: Datastage는 ETL 도구 주어진 IBM GUI를 사용하여 데이터 통합 솔루션을 설계합니다. 이것은 병렬화 개념을 제공 한 최초의 ETL 도구였습니다.
다음 3 가지 버전으로 제공됩니다.
- 서버 에디션
- 기업용 에디션
- MVS 에디션
Q # 2) Datastage의 주요 기능을 강조 하시겠습니까?
대답: Datastage의 주요 기능은 다음과 같습니다.
- IBM Infosphere 정보 서버의 데이터 통합 구성 요소입니다.
- GUI 기반 도구입니다. Datastage 개체를 끌어서 놓기 만하면 Datastage 코드로 변환 할 수 있습니다.
- ETL 작업 (추출, 변환,로드)을 수행하는 데 사용됩니다.
- 동시에 여러 소스 및 여러 대상에 대한 연결을 제공합니다.
- Datastage 작업이 방대한 양의 데이터를 훨씬 빠르게 처리 할 수 있도록 파티셔닝 및 병렬 처리 기술을 제공합니다.
- 엔터프라이즈 수준의 연결이 있습니다.
Q # 3) Datastage 도구의 주요 용도는 무엇입니까?
대답: Datastage는 주로 소스 시스템에서 데이터를 추출하고 해당 데이터를 변환하고 최종적으로 대상 시스템에로드하는 데 사용되는 ETL 도구입니다.
Q # 4) 7.x 버전과 8.x 버전의 DataStage간에 관찰 한 주요 차이점은 무엇입니까?
대답: 여기 두 버전의 주요 차이점은
7.x | 8.x |
---|---|
7.x 버전은 플랫폼에 따라 다릅니다. | 이 버전은 플랫폼에 독립적입니다. |
Unix 서버 위에 데이터 스테이지가 구축되는 2 계층 아키텍처 | 하단에는 UNIX 서버 데이터베이스가 있고 저장소 역할을하는 XMETA 데이터베이스가 있고 상단에는 데이터 스테이지가있는 3 계층 아키텍처가 있습니다. |
매개 변수 집합의 개념이 없습니다. | 프로젝트 어디에서나 사용할 수있는 매개 변수 세트가 있습니다. |
우리는 디자이너와 매니저를 두 명의 고객으로 두었습니다. | 이 버전에서는 관리자 클라이언트가 디자이너 클라이언트로 병합되었습니다. |
이 버전에서 작업을 수동으로 검색해야했습니다. | 여기에 작업을 쉽게 검색 할 수있는 저장소의 빠른 찾기 옵션이 있습니다. |
Q # 5) IBM Infosphere 정보 서버의 주요 기능을 강조 할 수 있습니까?
대답: IBM Infosphere 정보 서버 제품군의 주요 기능은 다음과 같습니다.
C ++ 내장 함수
- 데이터 통합을위한 단일 플랫폼을 제공합니다. 여러 소스 시스템에 연결하고 여러 대상 시스템에 쓸 수있는 기능이 있습니다.
- 중앙 집중식 레이어를 기반으로합니다. 제품군의 모든 구성 요소는 제품군의 기본 아키텍처를 공유 할 수 있습니다.
- 통합 된 메타 데이터 서비스 및 공통 병렬 엔진을위한 통합 저장소를위한 계층이 있습니다.
- 데이터 분석, 정리, 모니터링, 변환 및 전달을위한 도구를 제공합니다.
- 대규모 병렬 처리 기능이 있습니다. 처리 속도가 매우 빠릅니다.
Q # 6) 정보 서버 아키텍처의 다른 계층은 무엇입니까?
대답: 다음은 정보 서버 아키텍처의 여러 계층입니다.
- 통합 사용자 인터페이스
- 공통 서비스
- 통합 병렬 처리
- 통합 메타 데이터
- 일반적인 연결
Q # 7) 데이터 소스 시스템이란 무엇입니까?
대답: 데이터베이스 테이블, 플랫 파일 또는 People Soft와 같은 외부 애플리케이션이 될 수 있습니다.
Q # 8) 개발자로서 작업 할 인터페이스는 무엇입니까?
대답: Datastage 개발자로서 우리는 로컬 시스템에 설치해야하는 Datastage 디자이너로 알려진 Datastage 클라이언트 인터페이스에서 작업합니다. 백엔드에서는 Datastage 서버에 연결됩니다.
Q # 9) Datastage의 다른 공통 서비스는 무엇입니까?
대답: 다음은 Datastage의 일반적인 서비스 목록입니다.
- 메타 데이터 서비스
- 통합 서비스 배포
- 보안 서비스
- 루핑 및보고 서비스.
Q # 10) Datastage 프로젝트 개발을 어떻게 시작합니까?
대답: 첫 번째 단계는 Datastage 서버에서 Datastage 작업을 만드는 것입니다. 우리가 만드는 모든 Datastage 개체는 Datastage 프로젝트에 저장됩니다. Datastage 프로젝트는 작업, 테이블, 정의 및 루틴을위한 별도의 서버 환경입니다.
Datastage 프로젝트는 작업, 테이블, 정의 및 루틴을위한 별도의 서버 환경입니다.
Q # 11) DataStage 작업이란 무엇입니까?
대답: Datastage 작업은 단순히 개발자로서 생성하는 DataStage 코드입니다. 여기에는 데이터와 프로세스 흐름을 정의하기 위해 서로 연결된 여러 단계가 포함되어 있습니다.
단계는 구현되는 기능 일뿐입니다.
예를 들면 : 판매 금액의 합계를 원한다고 가정 해 보겠습니다. 이는 한 단계에서 수행되는 '그룹 별'작업 일 수 있습니다.
이제 결과를 대상 파일에 쓰고 싶습니다. 따라서이 작업은 다른 단계에서 수행됩니다. 두 단계를 모두 정의했으면 '그룹 별'단계에서 대상 파일 단계로의 데이터 흐름을 정의해야합니다. 이 데이터 흐름은 DataStage 링크로 정의됩니다.
두 단계를 모두 정의했으면 '그룹 별'단계에서 대상 파일 단계로의 데이터 흐름을 정의해야합니다. 이 데이터 흐름은 DataStage 링크로 정의됩니다.
Q # 12) DataStage 시퀀스 란 무엇입니까?
대답: Datastage 시퀀스는 논리적 흐름에서 DataStage 작업을 연결합니다.
Q # 13) 다른 작업에 동일한 코드를 사용하고 싶다면 어떻게해야할까요?
리눅스에서 파일을 비교하는 방법
대답: 이는 공유 컨테이너를 사용하여 수행 할 수 있습니다. 재사용을 위해 컨테이너를 공유했습니다. 공유 컨테이너는 단계와 링크로 구성된 재사용 가능한 작업 요소입니다. 다른 Datastage 작업에서 공유 컨테이너를 호출 할 수 있습니다.
Q # 14) Datastage 작업은 어디에 저장됩니까?
대답: Datastage 작업은 저장소에 저장됩니다. Datastage 작업을 저장할 수있는 다양한 폴더가 있습니다.
Q # 15) 디자이너의 다른 단계는 어디에서 보나요?
대답: 모든 단계는 ' 팔레트 ' . 스테이지가 제공하는 기능의 종류에 따라 다양한 카테고리가 있습니다.
팔레트의 다양한 단계 범주는 일반, 데이터 품질, 데이터베이스, 개발, 파일, 처리 등입니다.
Q # 16) 처리 단계는 무엇입니까?
대답: 처리 단계를 통해 실제 데이터 변환을 적용 할 수 있습니다.
예를 들면 , ' Processing 카테고리 아래의 aggregator '단계를 통해 모든'group by '작업을 적용 할 수 있습니다. 마찬가지로, 두 개의 서로 다른 입력 스트림에서 오는 데이터를 결합 할 수있는 '조인'단계와 같은 처리 단계가 있습니다.
Q # 17) 간단한 기본 Datastage 작업을 생성하는 데 필요한 단계는 무엇입니까?
대답: 파일-> 새로 만들기-> 병렬 작업 선택을 클릭하고 확인을 누르십시오. 병렬 작업 창이 열립니다. 이 병렬 작업에서 서로 다른 단계를 구성하고 이들 사이의 데이터 흐름을 정의 할 수 있습니다. 가장 간단한 DataStage 작업은 ETL 작업입니다.
여기서는 먼저 파일 스테이지 또는 데이터베이스 스테이지를 사용할 수있는 소스 시스템에서 데이터를 추출해야합니다. 내 소스 시스템은 데이터베이스 테이블 또는 파일 일 수 있기 때문입니다.
텍스트 파일에서 데이터를 읽는다고 가정합니다. 이 경우 'Sequential File'스테이지를 병렬 작업 창으로 끌어다 놓습니다. 이제이 데이터 위에 몇 가지 변환을 수행해야합니다. Processing 카테고리에서 사용할 수있는 'Transformer'단계를 사용합니다. Transformer 단계에서 모든 로직을 작성할 수 있습니다.
마지막으로 처리 된 데이터를 일부 대상 테이블에로드해야합니다. 내 대상 데이터베이스가 DB2라고 가정 해 보겠습니다. 따라서이를 위해 DB2 커넥터 단계를 선택합니다. 그런 다음 순차 링크를 통해 이러한 데이터 상태를 연결합니다.
금후 , 올바른 파일 시스템이나 데이터베이스를 가리 키도록 스테이지를 구성해야합니다.
예를 들면 Sequential 파일 단계의 경우 파일 이름, 파일 위치, 열 메타 데이터와 같은 필수 매개 변수를 정의해야합니다.
그런 다음 Datastage 작업을 컴파일해야합니다. 작업을 컴파일하면 작업 구문을 확인하고 런타임에 실행할 수있는 Datastage 작업에 대한 실행 파일이 생성됩니다.
Q # 18) Datastage에서 다른 정렬 방법의 이름을 지정하십시오.
대답: 사용 가능한 두 가지 방법이 있습니다.
- 링크 정렬
- 내장 Datastage 정렬
Q # 19) 배치에서 작업이 중간에 실패하고 처음부터가 아닌 특정 작업에서 배치를 다시 시작하려는 경우 어떻게 하시겠습니까?
대답: Datastage에는 작업 순서에 옵션이 있습니다. '실패시 시퀀스를 다시 시작할 수 있도록 체크 포인트 추가' . 이 옵션을 선택하면 실패한 지점부터 작업 순서를 다시 실행할 수 있습니다.
Q # 20) Datastage 작업을 어떻게 가져오고 내보내나요?
답변 : F 또는 이것에 대한 명령 줄 기능 아래
- 수입: dsimport.exe
- 수출: dsexport.exe
Q # 21) Datastage의 루틴은 무엇입니까? 다양한 유형의 루틴을 등록하십시오.
답변 : 일상 DS 관리자가 정의한 기능 세트입니다. 변압기 단계를 통해 실행됩니다.
루틴에는 3 가지 종류가 있습니다.
- 병렬 루틴
- 메인 프레임 루틴
- 서버 루틴
Q # 22) DataStage에서 중복 값을 제거하려면 어떻게해야합니까?
대답: 중복 값을 처리하는 두 가지 방법이 있습니다.
- 중복 제거 단계를 사용하여 중복을 제거 할 수 있습니다.
- Sort 단계를 사용하여 중복을 제거 할 수 있습니다. 정렬 단계에는 '중복 허용'이라는 속성이 있습니다. 이 속성을 false로 설정하면 정렬 결과에서 중복 된 값이 나타나지 않습니다.
Q # 23) Datastage 디렉터에서 사용할 수있는 다양한보기 유형은 무엇입니까?
대답: Datastage 디렉터에서는 3 가지 종류의보기를 사용할 수 있습니다. 그들은:
- 로그보기
- 상태보기
- 직업보기
Q # 24) Informatica와 Datastage를 구별하십시오. 어떤 것을 선택하고 그 이유는 무엇입니까?
대답: Informatica와 DataStage는 모두 강력한 ETL 도구입니다.
등록 포인트는 두 도구를 구분합니다.
컴퓨팅 | 데이터 스테이지 | |
---|---|---|
병렬 처리 | Informatica는 병렬 처리를 지원하지 않습니다. | 이와 대조적으로 datastage는 병렬 처리를위한 메커니즘을 제공합니다. |
SCD 구현 | Informatica에서 SCD (천천히 변경되는 차원)를 구현하는 것은 매우 간단합니다. | 그러나 데이터 스테이지에서 SCD를 구현하는 것은 복잡합니다. Datastage는 사용자 지정 스크립트를 통해서만 SCD를 지원합니다. |
버전 관리 | Informatica는 개체 체크인 및 체크 아웃을 통한 버전 제어를 지원합니다. | 그러나 데이터 스테이지에서는이 기능을 사용할 수 없습니다. |
사용 가능한 변환 | 더 적은 변환을 사용할 수 있습니다. | Datastage는 Informatica보다 더 다양한 변환을 제공합니다. |
조회의 힘 | Informatica는 매우 강력한 동적 캐시 조회를 제공합니다. | 데이터 스테이지에는 비슷한 것이 없습니다. |
제 개인적인 의견으로는 Datastage보다 Informatica를 사용하겠습니다. 그 이유는 Informatica가 DataStage보다 더 체계적이고 사용자 친화적임을 알게 되었기 때문입니다.
또 다른 강력한 이유는 디버깅 및 오류 처리가 Datastage에 비해 Informatica에서 훨씬 더 우수하다는 것입니다. 따라서 Informatica에서는 문제 해결이 더 쉬워집니다. Datastage는 완전한 오류 처리 지원을 제공하지 않습니다.
=> Informatica에 대해 자세히 알고 싶으십니까? 우리는 여기에 자세한 설명이 있습니다.
Q # 25) 시스템 변수에 대한 아이디어를 제공하십시오.
대답: 시스템 변수는 다음으로 시작하는 읽기 전용 변수입니다. ‘@’ 트랜스포머 스테이지 또는 루틴에서 읽을 수 있습니다. 시스템 정보를 얻는 데 사용됩니다.
Q # 26) 패시브 스테이지와 액티브 스테이지의 차이점은 무엇입니까?
대답: 수동 단계는 추출 및 로딩에 사용되는 반면 활성 단계는 변환에 사용됩니다.
Q # 27) Datastage에서 사용할 수있는 다양한 종류의 컨테이너는 무엇입니까?
대답: Datastage에는 2 개의 컨테이너가 있습니다.
- 로컬 컨테이너
- 공유 컨테이너
Q # 28) 스테이징 변수의 값은 임시 또는 영구적으로 저장됩니까?
대답: 일시적으로. 임시 변수입니다.
Q # 29) Datastage에는 어떤 유형의 작업이 있습니까?
새로운 월드 오브 워크래프트 개인 서버
대답: Datastage에는 두 가지 유형의 작업이 있습니다.
- 서버 작업 (순차적으로 실행 됨)
- 병렬 작업 (병렬 방식으로 실행 됨)
Q # 30) 데이터 스테이지 디렉터의 용도는 무엇입니까?
대답: Datastage director를 통해 작업을 예약하고, 작업을 검증하고, 작업을 실행하고, 작업을 모니터링 할 수 있습니다.
Q # 31) 해시 파일에는 어떤 종류가 있나요?
대답: 두 가지 유형의 해시 파일이 있습니다.
- 정적 해시 파일
- 동적 해시 파일
Q # 32) 품질 무대 란?
대답: 품질 단계 (무결성 단계라고도 함)는 서로 다른 소스에서 가져온 데이터를 결합하는 데 도움이되는 단계입니다.
결론
Datastage 아키텍처, 주요 기능에 대한 편리한 지식을 가지고 있어야하며 다른 인기있는 ETL 도구와 어떻게 다른지 설명 할 수 있어야합니다.
추가로 , 다양한 단계 및 사용 방법에 대한 공정한 아이디어가 있어야하며, Datastage 작업을 만들고 실행하는 방법을 끝에서 끝까지 파악해야합니다.
추천 자료 => ETL 테스트 란 무엇입니까?
모두 제일 좋다!
추천 도서
- ETL 테스트 인터뷰 질문 및 답변
- ETL 프로세스에 유용한 10 가지 최고의 데이터 매핑 도구 (2021 목록)
- 2021 년 최고의 ETL 도구 15 개 (전체 업데이트 목록)
- 예제가 포함 된 데이터웨어 하우스 테스트 자습서 | ETL 테스트 가이드
- ETL 테스트 데이터웨어 하우스 테스트 자습서 (전체 가이드)
- ETL vs. DB 테스트-ETL 테스트 요구, 계획 및 ETL 도구 자세히 살펴보기
- Informatica PowerCenter 도구를 사용하여 ETL 테스트를 수행하는 방법
- 예제와 함께 설명 된 데이터웨어 하우스 (ETL)의 메타 데이터
- 보도 자료-ETL 테스트 및 데이터 마이그레이션 테스트 플랫폼의 iCEDQ Soft 새 버전 출시
- 2021 년 상위 10 개 ETL 테스트 도구
- 데이터웨어 하우스에서 ETL (추출, 변환,로드) 프로세스 란 무엇입니까?