상위 32 개 최고의 Datastage 인터뷰 질문 및 답변

top 32 best datastage interview questions

문제를 제거하기 위해 도구를 사용해보십시오

운영 체제를 선택하십시오 투영 프로그램을 선택하십시오 (선택적으로)

당신의 문제를 설명하십시오

다가오는 인터뷰를 준비하는 데 도움이되는 가장 자주 묻는 Datastage 인터뷰 질문 및 답변 목록 :

DataStage는 현재 시장에서 사용 가능한 매우 인기있는 ETL 도구입니다.

이 기사에서는 IBM Datastage 인터뷰를위한 매우 유용한 질문과 대답을 공유합니다. 아래 Datastage 인터뷰 질문을 통해 인터뷰를 쉽게 진행할 수 있습니다.

신입생과 경험 많은 전문가에게 도움이 될 Datastage 인터뷰 질문에 대한 자세한 답변을 다루었습니다.

추천 읽기 => ETL 테스트 인터뷰 질문

Datastage 인터뷰 질문 및 답변

가장 일반적인 Datastage 인터뷰 질문 및 답변

시작하자!

Q # 1) Datastage 란 무엇입니까?

대답: Datastage는 ETL 도구 주어진 IBM GUI를 사용하여 데이터 통합 솔루션을 설계합니다. 이것은 병렬화 개념을 제공 한 최초의 ETL 도구였습니다.

IBM

다음 3 가지 버전으로 제공됩니다.

서버 에디션
기업용 에디션
MVS 에디션

Q # 2) Datastage의 주요 기능을 강조 하시겠습니까?

대답: Datastage의 주요 기능은 다음과 같습니다.

IBM Infosphere 정보 서버의 데이터 통합 구성 요소입니다.
GUI 기반 도구입니다. Datastage 개체를 끌어서 놓기 만하면 Datastage 코드로 변환 할 수 있습니다.
ETL 작업 (추출, 변환,로드)을 수행하는 데 사용됩니다.
동시에 여러 소스 및 여러 대상에 대한 연결을 제공합니다.
Datastage 작업이 방대한 양의 데이터를 훨씬 빠르게 처리 할 수 있도록 파티셔닝 및 병렬 처리 기술을 제공합니다.
엔터프라이즈 수준의 연결이 있습니다.

Q # 3) Datastage 도구의 주요 용도는 무엇입니까?

대답: Datastage는 주로 소스 시스템에서 데이터를 추출하고 해당 데이터를 변환하고 최종적으로 대상 시스템에로드하는 데 사용되는 ETL 도구입니다.

Q # 4) 7.x 버전과 8.x 버전의 DataStage간에 관찰 한 주요 차이점은 무엇입니까?

대답: 여기 두 버전의 주요 차이점은

7.x	8.x
7.x 버전은 플랫폼에 따라 다릅니다.	이 버전은 플랫폼에 독립적입니다.
Unix 서버 위에 데이터 스테이지가 구축되는 2 계층 아키텍처	하단에는 UNIX 서버 데이터베이스가 있고 저장소 역할을하는 XMETA 데이터베이스가 있고 상단에는 데이터 스테이지가있는 3 계층 아키텍처가 있습니다.
매개 변수 집합의 개념이 없습니다.	프로젝트 어디에서나 사용할 수있는 매개 변수 세트가 있습니다.
우리는 디자이너와 매니저를 두 명의 고객으로 두었습니다.	이 버전에서는 관리자 클라이언트가 디자이너 클라이언트로 병합되었습니다.
이 버전에서 작업을 수동으로 검색해야했습니다.	여기에 작업을 쉽게 검색 할 수있는 저장소의 빠른 찾기 옵션이 있습니다.

Q # 5) IBM Infosphere 정보 서버의 주요 기능을 강조 할 수 있습니까?

대답: IBM Infosphere 정보 서버 제품군의 주요 기능은 다음과 같습니다.

C ++ 내장 함수

데이터 통합을위한 단일 플랫폼을 제공합니다. 여러 소스 시스템에 연결하고 여러 대상 시스템에 쓸 수있는 기능이 있습니다.
중앙 집중식 레이어를 기반으로합니다. 제품군의 모든 구성 요소는 제품군의 기본 아키텍처를 공유 할 수 있습니다.
통합 된 메타 데이터 서비스 및 공통 병렬 엔진을위한 통합 저장소를위한 계층이 있습니다.
데이터 분석, 정리, 모니터링, 변환 및 전달을위한 도구를 제공합니다.
대규모 병렬 처리 기능이 있습니다. 처리 속도가 매우 빠릅니다.

Q # 6) 정보 서버 아키텍처의 다른 계층은 무엇입니까?

대답: 다음은 정보 서버 아키텍처의 여러 계층입니다.

통합 사용자 인터페이스
공통 서비스
통합 병렬 처리
통합 메타 데이터
일반적인 연결

Q # 7) 데이터 소스 시스템이란 무엇입니까?

대답: 데이터베이스 테이블, 플랫 파일 또는 People Soft와 같은 외부 애플리케이션이 될 수 있습니다.

Q # 8) 개발자로서 작업 할 인터페이스는 무엇입니까?

대답: Datastage 개발자로서 우리는 로컬 시스템에 설치해야하는 Datastage 디자이너로 알려진 Datastage 클라이언트 인터페이스에서 작업합니다. 백엔드에서는 Datastage 서버에 연결됩니다.

Q # 9) Datastage의 다른 공통 서비스는 무엇입니까?

대답: 다음은 Datastage의 일반적인 서비스 목록입니다.

메타 데이터 서비스
통합 서비스 배포
보안 서비스
루핑 및보고 서비스.

Q # 10) Datastage 프로젝트 개발을 어떻게 시작합니까?

대답: 첫 번째 단계는 Datastage 서버에서 Datastage 작업을 만드는 것입니다. 우리가 만드는 모든 Datastage 개체는 Datastage 프로젝트에 저장됩니다. Datastage 프로젝트는 작업, 테이블, 정의 및 루틴을위한 별도의 서버 환경입니다.

Datastage 프로젝트는 작업, 테이블, 정의 및 루틴을위한 별도의 서버 환경입니다.

Q # 11) DataStage 작업이란 무엇입니까?

대답: Datastage 작업은 단순히 개발자로서 생성하는 DataStage 코드입니다. 여기에는 데이터와 프로세스 흐름을 정의하기 위해 서로 연결된 여러 단계가 포함되어 있습니다.

단계는 구현되는 기능 일뿐입니다.

예를 들면 : 판매 금액의 합계를 원한다고 가정 해 보겠습니다. 이는 한 단계에서 수행되는 '그룹 별'작업 일 수 있습니다.

이제 결과를 대상 파일에 쓰고 싶습니다. 따라서이 작업은 다른 단계에서 수행됩니다. 두 단계를 모두 정의했으면 '그룹 별'단계에서 대상 파일 단계로의 데이터 흐름을 정의해야합니다. 이 데이터 흐름은 DataStage 링크로 정의됩니다.

두 단계를 모두 정의했으면 '그룹 별'단계에서 대상 파일 단계로의 데이터 흐름을 정의해야합니다. 이 데이터 흐름은 DataStage 링크로 정의됩니다.

데이터 스테이지 링크

Q # 12) DataStage 시퀀스 란 무엇입니까?

대답: Datastage 시퀀스는 논리적 흐름에서 DataStage 작업을 연결합니다.

Q # 13) 다른 작업에 동일한 코드를 사용하고 싶다면 어떻게해야할까요?

리눅스에서 파일을 비교하는 방법

대답: 이는 공유 컨테이너를 사용하여 수행 할 수 있습니다. 재사용을 위해 컨테이너를 공유했습니다. 공유 컨테이너는 단계와 링크로 구성된 재사용 가능한 작업 요소입니다. 다른 Datastage 작업에서 공유 컨테이너를 호출 할 수 있습니다.

Q # 14) Datastage 작업은 어디에 저장됩니까?

대답: Datastage 작업은 저장소에 저장됩니다. Datastage 작업을 저장할 수있는 다양한 폴더가 있습니다.

Q # 15) 디자이너의 다른 단계는 어디에서 보나요?

대답: 모든 단계는 ' 팔레트 ' . 스테이지가 제공하는 기능의 종류에 따라 다양한 카테고리가 있습니다.

팔레트의 다양한 단계 범주는 일반, 데이터 품질, 데이터베이스, 개발, 파일, 처리 등입니다.

Q # 16) 처리 단계는 무엇입니까?

대답: 처리 단계를 통해 실제 데이터 변환을 적용 할 수 있습니다.

예를 들면 , ' Processing 카테고리 아래의 aggregator '단계를 통해 모든'group by '작업을 적용 할 수 있습니다. 마찬가지로, 두 개의 서로 다른 입력 스트림에서 오는 데이터를 결합 할 수있는 '조인'단계와 같은 처리 단계가 있습니다.

Q # 17) 간단한 기본 Datastage 작업을 생성하는 데 필요한 단계는 무엇입니까?

대답: 파일-> 새로 만들기-> 병렬 작업 선택을 클릭하고 확인을 누르십시오. 병렬 작업 창이 열립니다. 이 병렬 작업에서 서로 다른 단계를 구성하고 이들 사이의 데이터 흐름을 정의 할 수 있습니다. 가장 간단한 DataStage 작업은 ETL 작업입니다.

여기서는 먼저 파일 스테이지 또는 데이터베이스 스테이지를 사용할 수있는 소스 시스템에서 데이터를 추출해야합니다. 내 소스 시스템은 데이터베이스 테이블 또는 파일 일 수 있기 때문입니다.

텍스트 파일에서 데이터를 읽는다고 가정합니다. 이 경우 'Sequential File'스테이지를 병렬 작업 창으로 끌어다 놓습니다. 이제이 데이터 위에 몇 가지 변환을 수행해야합니다. Processing 카테고리에서 사용할 수있는 'Transformer'단계를 사용합니다. Transformer 단계에서 모든 로직을 작성할 수 있습니다.

마지막으로 처리 된 데이터를 일부 대상 테이블에로드해야합니다. 내 대상 데이터베이스가 DB2라고 가정 해 보겠습니다. 따라서이를 위해 DB2 커넥터 단계를 선택합니다. 그런 다음 순차 링크를 통해 이러한 데이터 상태를 연결합니다.

금후 , 올바른 파일 시스템이나 데이터베이스를 가리 키도록 스테이지를 구성해야합니다.

예를 들면 Sequential 파일 단계의 경우 파일 이름, 파일 위치, 열 메타 데이터와 같은 필수 매개 변수를 정의해야합니다.

그런 다음 Datastage 작업을 컴파일해야합니다. 작업을 컴파일하면 작업 구문을 확인하고 런타임에 실행할 수있는 Datastage 작업에 대한 실행 파일이 생성됩니다.

Q # 18) Datastage에서 다른 정렬 방법의 이름을 지정하십시오.

대답: 사용 가능한 두 가지 방법이 있습니다.

링크 정렬
내장 Datastage 정렬

정렬 방법

Q # 19) 배치에서 작업이 중간에 실패하고 처음부터가 아닌 특정 작업에서 배치를 다시 시작하려는 경우 어떻게 하시겠습니까?

대답: Datastage에는 작업 순서에 옵션이 있습니다. '실패시 시퀀스를 다시 시작할 수 있도록 체크 포인트 추가' . 이 옵션을 선택하면 실패한 지점부터 작업 순서를 다시 실행할 수 있습니다.

Q # 20) Datastage 작업을 어떻게 가져오고 내보내나요?

답변 : F 또는 이것에 대한 명령 줄 기능 아래

수입: dsimport.exe
수출: dsexport.exe

Q # 21) Datastage의 루틴은 무엇입니까? 다양한 유형의 루틴을 등록하십시오.

답변 : 일상 DS 관리자가 정의한 기능 세트입니다. 변압기 단계를 통해 실행됩니다.

루틴에는 3 가지 종류가 있습니다.

병렬 루틴
메인 프레임 루틴
서버 루틴

데이터 단계의 루틴

Q # 22) DataStage에서 중복 값을 제거하려면 어떻게해야합니까?

대답: 중복 값을 처리하는 두 가지 방법이 있습니다.

중복 제거 단계를 사용하여 중복을 제거 할 수 있습니다.
Sort 단계를 사용하여 중복을 제거 할 수 있습니다. 정렬 단계에는 '중복 허용'이라는 속성이 있습니다. 이 속성을 false로 설정하면 정렬 결과에서 중복 된 값이 나타나지 않습니다.

Q # 23) Datastage 디렉터에서 사용할 수있는 다양한보기 유형은 무엇입니까?

대답: Datastage 디렉터에서는 3 가지 종류의보기를 사용할 수 있습니다. 그들은:

로그보기
상태보기
직업보기

Q # 24) Informatica와 Datastage를 구별하십시오. 어떤 것을 선택하고 그 이유는 무엇입니까?

대답: Informatica와 DataStage는 모두 강력한 ETL 도구입니다.

등록 포인트는 두 도구를 구분합니다.

	컴퓨팅	데이터 스테이지
병렬 처리	Informatica는 병렬 처리를 지원하지 않습니다.	이와 대조적으로 datastage는 병렬 처리를위한 메커니즘을 제공합니다.
SCD 구현	Informatica에서 SCD (천천히 변경되는 차원)를 구현하는 것은 매우 간단합니다.	그러나 데이터 스테이지에서 SCD를 구현하는 것은 복잡합니다. Datastage는 사용자 지정 스크립트를 통해서만 SCD를 지원합니다.
버전 관리	Informatica는 개체 체크인 및 체크 아웃을 통한 버전 제어를 지원합니다.	그러나 데이터 스테이지에서는이 기능을 사용할 수 없습니다.
사용 가능한 변환	더 적은 변환을 사용할 수 있습니다.	Datastage는 Informatica보다 더 다양한 변환을 제공합니다.
조회의 힘	Informatica는 매우 강력한 동적 캐시 조회를 제공합니다.	데이터 스테이지에는 비슷한 것이 없습니다.

제 개인적인 의견으로는 Datastage보다 Informatica를 사용하겠습니다. 그 이유는 Informatica가 DataStage보다 더 체계적이고 사용자 친화적임을 알게 되었기 때문입니다.

또 다른 강력한 이유는 디버깅 및 오류 처리가 Datastage에 비해 Informatica에서 훨씬 더 우수하다는 것입니다. 따라서 Informatica에서는 문제 해결이 더 쉬워집니다. Datastage는 완전한 오류 처리 지원을 제공하지 않습니다.

=> Informatica에 대해 자세히 알고 싶으십니까? 우리는 여기에 자세한 설명이 있습니다.

Q # 25) 시스템 변수에 대한 아이디어를 제공하십시오.

대답: 시스템 변수는 다음으로 시작하는 읽기 전용 변수입니다. ‘@’ 트랜스포머 스테이지 또는 루틴에서 읽을 수 있습니다. 시스템 정보를 얻는 데 사용됩니다.

Q # 26) 패시브 스테이지와 액티브 스테이지의 차이점은 무엇입니까?

대답: 수동 단계는 추출 및 로딩에 사용되는 반면 활성 단계는 변환에 사용됩니다.

Q # 27) Datastage에서 사용할 수있는 다양한 종류의 컨테이너는 무엇입니까?

대답: Datastage에는 2 개의 컨테이너가 있습니다.

로컬 컨테이너
공유 컨테이너

Q # 28) 스테이징 변수의 값은 임시 또는 영구적으로 저장됩니까?

대답: 일시적으로. 임시 변수입니다.

Q # 29) Datastage에는 어떤 유형의 작업이 있습니까?

새로운 월드 오브 워크래프트 개인 서버

대답: Datastage에는 두 가지 유형의 작업이 있습니다.

서버 작업 (순차적으로 실행 됨)
병렬 작업 (병렬 방식으로 실행 됨)

Q # 30) 데이터 스테이지 디렉터의 용도는 무엇입니까?

대답: Datastage director를 통해 작업을 예약하고, 작업을 검증하고, 작업을 실행하고, 작업을 모니터링 할 수 있습니다.

Q # 31) 해시 파일에는 어떤 종류가 있나요?

대답: 두 가지 유형의 해시 파일이 있습니다.

정적 해시 파일
동적 해시 파일

Q # 32) 품질 무대 란?

대답: 품질 단계 (무결성 단계라고도 함)는 서로 다른 소스에서 가져온 데이터를 결합하는 데 도움이되는 단계입니다.

결론

Datastage 아키텍처, 주요 기능에 대한 편리한 지식을 가지고 있어야하며 다른 인기있는 ETL 도구와 어떻게 다른지 설명 할 수 있어야합니다.

추가로 , 다양한 단계 및 사용 방법에 대한 공정한 아이디어가 있어야하며, Datastage 작업을 만들고 실행하는 방법을 끝에서 끝까지 파악해야합니다.

추천 자료 => ETL 테스트 란 무엇입니까?

모두 제일 좋다!

상위 32 개 최고의 Datastage 인터뷰 질문 및 답변

가장 일반적인 Datastage 인터뷰 질문 및 답변

결론

추천 도서

재미있는 기사

에디터의 선택

Thunderful Games, Somerville 스튜디오 Jumpship 인수

검토 : 다크 소울 : 디자인 작품

Rockstar는 소송을 통해 Pinkertons에게 서비스를 제공하는 것을 결코 귀찮게하지 않았습니다.

SoapUI Pro에서 데이터 기반 테스트를 수행하는 방법 – SoapUI 자습서 # 14

불법 복제 장치를 사용하면 Nintendo 3DS가 손상 될 수 있습니다

노동절 : 파이널 판타지 V

팬이 만든 Bloodborne PSX 프로젝트가 나왔습니다.

Katalon Studio 튜토리얼 : 기다려온 무료 테스트 자동화 도구

Gigantic: Rampage Edition 비공개 베타 플레이 방법

PC 및 PlayStation용 FFXIV 스크린샷 폴더는 어디에 있나요?

PUBG Mobile은 새로운 플레이어를 위해 설계된 봇으로 가득 찬 것으로 보입니다.

컨텍스트 기반 테스트 : 7 가지 기본 원칙 (예제 포함)