top 64 informatica interview questions with answers
가장 자주 묻는 Informatica 인터뷰 질문 및 답변 :
이 문서에서는 Informatica MDM, PowerCenter, 데이터 품질, 클라우드, ETL, 관리, 테스트 및 개발자 관련 주요 질문을 다룹니다.
오늘의 시나리오에서 INFORMATICA는 전 세계에서 가장 까다로운 제품이라는 태그를 획득했습니다. 제품이 새로 소개되었지만 단기간에 인기를 얻었습니다.
수년 동안 INFORMATICA는 데이터 통합 기술 분야의 리더로 활동 해 왔습니다. ETL (추출, 전송,로드) 아키텍처를 기반으로하는이 데이터 통합 도구에는 정부 기관, 금융 및 보험 회사, 의료 및 기타 여러 비즈니스를위한 서비스 제공에 초점을 맞춘 여러 제품이 있습니다.
글쎄, 이것은 단지 INFORMATICA의 배경이었습니다. 그러나 오늘날 데이터웨어 하우징 분야는 엄청나게 성장하여 업계에서 많은 일자리를 얻을 수 있습니다.
최고의 Informatica 인터뷰 질문 및 답변
다음은 가장 자주 묻는 인터뷰 질문과 답변 목록입니다. 여기에는 약 64 개의 질문이 포함되어 있으며이를 통해 Informatica 개념에 대한 지식을보다 쉽게 이해할 수 있습니다.
Q # 1) INFORMATICA 란 무엇입니까? 왜 필요합니까?
대답: INFORMATICA는 ETL, 데이터 가상화, 마스터 데이터 관리, 데이터 품질, 데이터 복제, 울트라 메시징 등을위한 일부 데이터 통합 솔루션을 제공하는 소프트웨어 개발 회사입니다.
인기있는 INFORMATICA 제품 중 일부는 다음과 같습니다.
- IT PowerCenter
- INFORMATICA PowerConnect
- 컴퓨팅 파워 마트
- INFORMATICA 전력 교환
- INFORMATICA 전력 분석
- INFORMATICA 전력 품질
일련의 규칙과 함께 특정 작업을 수행하기 위해 데이터를 포함하는 데이터 시스템으로 작업하는 동안 INFORMATICA가 필요합니다. 운영 라인 정리 및 정형 및 비정형 데이터 시스템의 데이터 수정을 용이하게합니다.
Q # 2) 리포지토리에있는 INFORMATICA 개체의 형식은 무엇입니까? Windows에 연결할 수있는 데이터베이스는 무엇입니까?
대답: INFORMATICA 개체는 XML 형식으로 작성할 수 있습니다.
다음은 연결할 수있는 데이터베이스 목록입니다.
- SQL 서버
- 신탁
- MS 액세스
- MS 엑셀
- DB2
- Sybase
- Teradata
Q # 3) INFORMATICA PowerCenter 란 무엇입니까?
대답: 다른 소스 및 데이터 처리에서 데이터를 연결하고 검색하는 데 사용되는 ETL / 데이터 통합 도구입니다. PowerCenter는 많은 양의 데이터를 처리하고 SAP, PeopleSoft 등과 같은 ERP 소스에서 데이터 검색을 지원합니다.
PowerCenter를 SQL 및 Oracle과 같은 데이터베이스 관리 시스템에 연결하여 데이터를 세 번째 시스템에 통합 할 수 있습니다.
Q # 4) 사용 가능한 INFORMATICA PowerCenter의 다른 에디션은 무엇입니까?
답변 : INFORMATICA PowerCenter의 여러 에디션은 다음과 같습니다.
- 스탠다드 에디션
- 어드밴스드 에디션
- 프리미엄 에디션
현재 사용 가능한 PowerCenter 버전은 고성능이 향상된 v10입니다.
Q # 5) PowerCenter와 Power Map을 어떻게 구별 할 수 있습니까?
답변 : PowerCenter와 Power Map의 차이점은 다음과 같습니다.
IT PowerCenter | 컴퓨터 과학 PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 2016 년 1 월 23 일 |
1. | 많은 양의 데이터 처리 | 적은 양의 데이터 처리 | |
2. | 글로벌 및 로컬 리포지토리 지원 | 로컬 저장소 만 지원 | |
삼. | ERP에서 데이터 검색 지원 SAP, PeopleSoft 등과 같은 소스 | ERP 소스에서 데이터 검색을 지원하지 않습니다. | |
네. | 로컬 저장소를 글로벌로 변환 | 로컬 저장소를 글로벌로 변환하지 마십시오. |
Q # 6) PowerCenter의 다른 구성 요소는 무엇입니까?
답변 : 다음은 PowerCenter의 7 가지 중요한 구성 요소입니다.
- PowerCenter 서비스
- PowerCenter 클라이언트
- PowerCenter 리포지토리
- PowerCenter 도메인
- 리포지토리 서비스
- 통합 서비스
- PowerCenter 관리 콘솔
- 웹 서비스 허브
Q # 7) PowerCenter의 다른 클라이언트는 무엇입니까?
답변 : 다음은 PowerCenter 클라이언트 목록입니다.
- PowerCenter 디자이너
- PowerCenter 워크 플로우 모니터
- PowerCenter 워크 플로우 관리자
- PowerCenter 리포지토리 관리자
Q # 8) INFORMATICA PowerCenter Repository 란 무엇입니까?
대답: PowerCenter Repository는 다음과 같은 메타 데이터를 포함하는 관계형 데이터베이스 또는 시스템 데이터베이스입니다.
- 소스 정의
- 타겟 정의
- 세션 및 세션 로그
- 워크 플로우
- ODBC 연결
- 매핑
두 가지 유형의 저장소가 있습니다.
- 글로벌 리포지토리
- 로컬 저장소
PowerCenter Repository는 메타 데이터를 기반으로 ETL (추출, 변환 및로드)을 수행하는 데 필요합니다.
Q # 9) 추적 수준을 정교화하는 방법은 무엇입니까?
대답: 추적 수준은 서버가 로그 파일에 기록하는 정보의 양으로 정의 할 수 있습니다. 추적 수준은 변환 수준 또는 두 수준 모두에서 세션 수준에서 생성 및 구성됩니다.
다음은 4 가지 유형의 추적 수준입니다.
- 없음
- 간결한
- 자세한 초기화
- 자세한 데이터
Q # 10) PowerCenter 통합 서비스를 정교화하는 방법은 무엇입니까?
대답: 통합 서비스는 PowerCenter 프로세스의 워크 플로우 및 실행을 제어합니다.
아래 그림과 같이 INFORMATICA 통합 서비스의 세 가지 구성 요소가 있습니다.
통합 서비스 프로세스 : 이를 pmserver라고하며 통합 서비스는 워크 플로우를 모니터링하기 위해 둘 이상의 프로세스를 시작할 수 있습니다.
부하 분산 : 로드 밸런싱은 그리드의 여러 노드에 전체 워크로드를 분산하는 것을 의미합니다. 로드 밸런서는 명령, 세션 등을 포함하는 다양한 작업을 수행합니다.
데이터 변환 관리자 (DTM) : Data Transformation Manager를 사용하면 다음 데이터 변환을 수행 할 수 있습니다.
- 유효한: 출력의 행 수를 변경합니다.
- 수동태: 출력의 행 수를 변경할 수 없습니다.
- 연결됨 : 다른 변환에 연결하십시오.
- 연결되지 않음 : 다른 변환에 대한 링크가 없습니다.
문 # 11) PowerCenter on Grid 란 무엇입니까?
대답: INFORMATICA는 성능을 위해 가장 큰 데이터 확장 성을 활용할 수있는 그리드 컴퓨팅 기능을 가지고 있습니다. 그리드 기능은로드 밸런싱 및 병렬 처리에 사용됩니다.
PowerCenter 도메인에는 워크로드를 구성한 다음 그리드에서 실행하기위한 여러 노드 집합이 포함되어 있습니다.
에 도메인 PowerCenter에서 제공하는 효율적인 서비스 관리를위한 기반입니다.
마디 PowerCenter 환경을 실행하기 위해 논리적으로 표현되는 독립적 인 물리적 시스템입니다.
Q # 12) 엔터프라이즈 데이터웨어 하우징이란 무엇입니까?
대답: 많은 양의 데이터가 단일 액세스 포인트에 어셈블되는 경우이를 엔터프라이즈 데이터웨어 하우징이라고합니다. 이 데이터는 정기적으로 또는 시간 요구 사항에 따라 재사용 및 분석 할 수 있습니다.
중앙 데이터베이스 또는 단일 액세스 지점으로 간주되는 엔터프라이즈 데이터웨어 하우징은 완전한 글로벌 뷰를 제공하므로 의사 결정 지원에 도움이됩니다.
기능을 정의하는 다음 지점에서 더 잘 이해할 수 있습니다.
- 이 통합 데이터베이스에 저장된 모든 중요한 비즈니스 정보는 조직 내 어디서나 액세스 할 수 있습니다.
- 필요한 시간은 더 길지만이 단일 소스에 대한 주기적 분석은 항상 더 나은 결과를 생성합니다.
- 조직 전체에서 데이터에 액세스 할 수 있도록하면서 데이터의 보안 및 무결성이 손상되지 않습니다.
Q # 13) 세션 파티셔닝의 이점은 무엇입니까?
대답: 통합 서비스가 환경에서 실행되는 동안 더 나은 성능을 위해 워크 플로우가 분할됩니다. 그런 다음 이러한 파티션을 사용하여 추출, 변환 및로드를 수행합니다.
문 # 14) 로드 프로세스 완료 후 인덱스를 생성하려면 어떻게해야합니까?
대답: 명령 작업은 인덱스를 만드는 데 사용됩니다. 워크 플로 세션에서 명령 태스크 스크립트를 사용하여 인덱스를 만들 수 있습니다.
Q # 15) 세션이란 무엇입니까?
대답: 세션은 데이터를 소스에서 대상으로 이동하는 동안 사용되는 일련의 명령어입니다. 세션을 분할하여 여러 세션 시퀀스를 구현하여 서버 성능을 향상시킬 수 있습니다.
세션을 만든 후 서버 관리자 또는 명령 줄 프로그램을 사용할 수 있습니다. pmcmd 세션을 중지하거나 시작합니다.
Q # 16) 배치를 어떻게 사용할 수 있습니까?
대답: 배치는 데이터를 소스에서 서버의 대상으로 마이그레이션하는 데 사용되는 세션 모음입니다. 배치에는 가장 많은 수의 세션이있을 수 있지만 더 많은 네트워크 트래픽을 유발하는 반면 배치에서 더 적은 세션을 빠르게 이동할 수 있습니다.
Q # 17) 매핑이란 무엇입니까?
대답: 매핑은 Expression Transformation, Sorter Transformation, Aggregator Transformation, Router Transformation 등과 같은 특정 변환 집합을 통해 서로 연결된 소스 및 대상의 모음입니다.
Q # 18) 변환이란 무엇입니까?
대답: 변환은 대상에서 데이터 흐름 및 데이터로드를 정의하는 데 적용 할 규칙 및 지침 집합으로 정의 할 수 있습니다.
Q # 19) Expression Transformation이란?
대답: 한 번에 한 레코드의 데이터를 변환하는 데 사용되는 매핑 변환입니다. 식 변환은 수동적이거나 연결될 수 있습니다. 이 표현식은 조건문을 사용한 데이터 조작 및 출력 생성에 사용됩니다.
Q # 20) 업데이트 전략 변환이란 무엇입니까?
대답: Informatica의 업데이트 전략은이를 통해 전달되는 데이터를 제어하고 INSERT, UPDATE, DELETE 및 REJECT와 같은 태그를 지정하는 데 사용됩니다. 업데이트 전략 변환 내에서 조건부 논리를 설정하여 태그를 지정할 수 있습니다.
Q # 21) 분류기 변환이란 무엇입니까?
우선 순위 대기열 자바를 사용하는 dijkstra의 알고리즘
대답: 분류기 변환은 여러 포트를 통해 대량의 데이터를 정렬하는 데 사용됩니다. SQL에서 ORDER BY 절로 작동 할 가능성이 높습니다. 분류기 변환은 활성, 수동 또는 연결 일 수 있습니다.
능동 변환은 매핑을 통과하고 행 수를 변경하는 반면 수동 변환은 매핑을 통과하지만 행 수는 변경하지 않습니다.
대부분의 INFORMATICA 변환은 데이터 경로에 연결됩니다.
Q # 22) 라우터 변환이란 무엇입니까?
대답: 라우터 변환은 소스 데이터를 필터링하는 데 사용됩니다. 라우터 변환을 사용하여 단일 데이터 소스를 분할 할 수 있습니다.
필터 변환과 매우 유사하지만 유일한 차이점은 필터 변환은 하나의 변환 조건 만 사용하고 조건을 충족하지 않는 행을 반환하는 반면 라우터 변환은 여러 변환 조건을 사용하여 단일 조건과 일치하는 행을 반환한다는 것입니다.
Q # 23) 랭크 변환이란?
대답: 순위 변환은 활성 및 연결됨입니다. 레코드 집합을 위쪽 또는 아래쪽으로 정렬하고 순위를 지정하는 데 사용됩니다. 또한 특정 포트를 기준으로 가장 큰 또는 가장 작은 숫자 값을 가진 데이터를 선택하는 데 사용됩니다.
Q # 24) 순위 변환의 순위 지수 란?
대답: 순위 인덱스는 작업 디자이너가 각 레코드에 할당합니다. 순위 인덱스 포트는 각 행의 순위 위치를 저장하는 데 사용됩니다. 순위 변환은 위에서 아래로 각 행을 식별 한 다음 순위 인덱스를 할당합니다.
Q # 25) INFORMATICA의 상태 코드는 무엇입니까?
대답: 코드는 각 세션 동안 오류 처리 메커니즘을 제공합니다. 상태 코드는 성공적으로 커밋되었는지 여부를 인식하기 위해 저장 프로 시저에서 발급하고 세션을 중지해야하는지 또는 계속해야하는지 여부를 결정하기 위해 INFORMATICA 서버에 정보를 제공합니다.
Q # 26) 정크 차원은 무엇입니까?
대답: 정크 차원은 임의 코드 또는 플래그와 같은 일부 정크 속성 그룹으로 구성된 구조입니다. 동일한 테이블을 여러 개 생성하는 대신 특정 차원과 관련된 관련 코드를 단일 위치에 저장하는 프레임 워크를 형성합니다.
Q # 27) Informatica의 Mapplet이란 무엇입니까?
대답: Mapplet은 여러 매핑에서 사용할 수있는 변환 및 변환 논리에 대한 특정 규칙 집합을 포함하는 재사용 가능한 개체입니다. Mapplet은 디자이너 도구의 Mapplet Designer에서 생성됩니다.
문 # 28) Informatica에서 디코딩이란 무엇입니까?
대답: Decode를 이해하기 위해 SQL의 CASE 문과 유사하다고 생각해 봅시다. 기본적으로 레코드에서 특정 값을 검색하기 위해 표현식 변환에서 사용하는 기능입니다.
결과 값을 반환하기 위해 포트가 지정된 Decode 기능 내에서 무제한 검색이있을 수 있습니다. 이 함수는 일반적으로 중첩 된 IF 문을 바꾸거나 상수 값으로 작은 테이블을 검색하여 조회 값을 바꾸어야하는 경우에 사용됩니다.
Decode는 식 변환 내에서 사용되는 함수입니다. 특정 레코드를 검색하기 위해 SQL의 CASE 문처럼 사용됩니다.
다음은 SQL에서 CASE의 간단한 예입니다.
통사론:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
Q # 29) INFORMATICA의 Joiner Transformation이란 무엇입니까?
대답: Joiner 변환의 도움으로 INFORMATICA에서 조인을 사용할 수 있습니다.
이는 두 가지 소스를 기반으로합니다.
- 마스터 소스
- 상세 출처
SQL에서와 같이 Joiner 변환을 사용하여 다음 조인을 만들 수 있습니다.
- 일반 조인
- 전체 외부 결합
- 마스터 외부 결합 (오른쪽 외부 결합)
- 상세 외부 결합 (왼쪽 외부 결합)
Q # 30) INFORMATICA의 Aggregator Transformation이란 무엇입니까?
대답: 집계 변환은 활성화되거나 연결될 수 있습니다. SQL에서 GROUP BY 절로 작동합니다. INFORMATICA PowerCenter의 그룹에 대해 집계 계산을 수행하는 것이 유용합니다. 집계 유형 함수 즉, 데이터에 대한 집계 계산을 수행합니다. SUM, AVG, MAX 및 MIN.
Q # 31) INFORMATICA의 시퀀스 생성기 변환이란 무엇입니까?
대답: 시퀀스 생성기 변환은 수동적이거나 연결될 수 있습니다. 기본 용도는 NEXTVAL 및 CURRVAL로 정수 값을 생성하는 것입니다.
Q # 32) INFORMATICA의 Union Transformation이란 무엇입니까?
대답: 통합 변환은 다른 소스의 데이터를 결합하고 동일한 포트 및 데이터 유형으로 프레임하는 데 사용됩니다. SQL의 절과 매우 유사합니다.
Q # 33) INFORMATICA의 Source Qualifier Transformation이란 무엇입니까?
대답: 소스 한정자 변환은 매핑에서 유용하며 관계형 플랫 파일을 추가 할 때마다 자동으로 생성됩니다. 통합 서비스에서 읽는 행을 나타내는 활성 및 연결된 변환입니다.
Q # 34) INFORMATICA Worklet이란 무엇입니까?
대답: Worklet은 재사용 기능이있는 Mapplet으로 작동합니다. 유일한 차이점은 Mapplet과 달리 INFORMATICA의 워크 플로에 Worklet을 적용 할 수 있다는 것입니다. Worklet은 재사용 할 수 있도록 로직과 작업을 한곳에 저장합니다.
Worklet은 Mapplet과 매우 유사하며 워크 플로 수준에서 재사용 가능하거나 재사용 불가능할 수있는 작업 그룹으로 정의됩니다. 필요한만큼 많은 워크 플로에 추가 할 수 있습니다. 재사용 성 기능으로 재사용 가능한 로직을 한 번 개발할 수 있고 재사용 할 수있는 곳에 배치 할 수 있으므로 많은 시간이 절약됩니다.
INFORMATICA PowerCenter 환경에서 Mapplet은 가장 유리한 기능으로 간주됩니다. Mapplet 디자이너에서 생성되며 Designer 도구의 일부입니다.
기본적으로 여러 매핑에서 재사용되도록 설계된 변환 집합이 포함되어 있습니다.
Mapplet은 다음을 통해 매핑을 단순화하는 재사용 가능한 개체라고합니다.
- 여러 변환 및 소스 정의 포함.
- 모든 입력 및 출력 포트에 연결할 필요는 없습니다.
- 소스에서 데이터를 수락하고 여러 변환에 전달
글쎄, 전반적으로 매핑 로직을 재사용해야 할 때 로직은 Mapplet에 배치되어야합니다.
Q # 35) INFORMATICA의 SUBSTR은 무엇입니까?
대답: SUBSTR은 더 큰 문자 집합에서 문자 집합을 추출하거나 제거하는 함수입니다.
통사론: SUBSTR (문자열, 시작 (, 길이))
어디,
끈 검색 할 문자를 정의합니다.
스타트 계산을 시작해야하는 위치를 설정하는 데 사용되는 정수입니다.
길이 시작 위치에서 리턴 할 문자열의 길이를 계산하는 데 사용되는 선택적 매개 변수입니다.
예를 들어 SUBSTR (Contact, 5, 8), 여기서 연락처의 5 번째 문자에서 시작하여 다음 8 자로 돌아갑니다.
Q # 36) 코드 페이지 호환성이란 무엇입니까?
대답: 데이터가 소스 코드 페이지에서 대상 코드 페이지로 전송되면 데이터 손실을 방지하기 위해 소스 페이지의 모든 특성이 대상 페이지에 있어야합니다.이 기능을 코드 페이지 호환성이라고합니다.
코드 페이지 호환성은 INFORMATICA 서버가 유니 코드 데이터 이동 모드에서 실행될 때 나타납니다. 이 경우 두 코드 페이지는 인코딩 된 문자가 사실상 동일 할 때 동일하므로 데이터 손실이 발생하지 않습니다.
완전한 정확성을 위해 소스 코드 페이지는 대상 코드 페이지의 하위 집합이라고합니다.
Q # 37) Connected LookUp과 Unconnected LookUp을 어떻게 구별 할 수 있습니까?
대답: 연결된 조회는 다른 변환에 연결된 데이터 흐름의 일부이며 조회를 수행하는 다른 변환에서 직접 데이터 입력을받습니다. 정적 및 동적 캐시를 모두 사용합니다.
연결되지 않은 조회는 다른 변환에서 데이터 입력을 가져 오지 않지만 LKP (LookUp) 표현식을 사용하는 모든 변환에서 함수로 사용할 수 있습니다. 유일한 정적 캐시를 사용합니다.
Q # 38) Incremental Aggregation이란 무엇입니까?
대답: 증분 집계는 세션이 생성되는 즉시 생성됩니다. 크게 변경된 대상 데이터를 변경하지 않는 소스 데이터의 변경 사항을 계산하는 데 사용됩니다.
CUSTOMER_NO | BILL_NO | 양 | 데이트 |
---|---|---|---|
1001 | 4001 | 1000 | 2016 년 1 월 11 일 |
2001 년 | 4002 | 2550 | 2016 년 1 월 11 일 |
3001 | 5012 | 4520 | 2016 년 1 월 11 일 |
1001 | 6024 | 2000 년 | 2016 년 1 월 23 일 |
1001 | 6538 | 5240 | 2016 년 1 월 23 일 |
2001 년 | 7485 | 5847 | 2016 년 1 월 23 일 |
1515 년 | 4572 | 6000 | 2016 년 1 월 23 일 |
첫 번째로드에서 출력은 다음과 같습니다.
CUSTOMER_NO | BILL_NO | LOAD_KEY | 양 |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 년 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
이제 두 번째로드에서 다음 세션 날짜와 함께 데이터를 집계합니다.
CUSTOMER_NO | BILL_NO | LOAD_KEY | 양 | 비고 / 동작 |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | 집계 후 캐시 파일이 업데이트 됨 |
2001 년 | 7485 | 20011 | 8397 | 집계 후 캐시 파일이 업데이트 됨 |
3001 | 5012 | 20011 | 4520 | 변경 없음 |
5858 | 4566 | 20011 | 3550 | 변경 없음 |
1515 년 | 4572 | 20011 | 6000 | 변경 없음 |
Q # 39) 대리 키란 무엇입니까?
대답: 서로 게이트 키는 테이블에서 각 행의 고유 한 식별에 필요한 기본 키의 다른 대체 또는 대체로 사용되는 순차적으로 생성 된 정수 값입니다.
기본 키는 필요에 따라 자주 변경 될 수 있으므로 향후 요구 사항에 대한 업데이트 프로세스가 더 어려워집니다. 대리 키가이 문제에 대한 유일한 해결책입니다.
Q # 40) 세션 작업과 명령 작업은 무엇입니까?
대답: 세션 작업은 세션 명령을 사용하여 소스에서 대상으로 데이터를 전송하는 동안 적용되는 일련의 지침입니다. 세션 명령은 사전 세션 명령 또는 사후 세션 명령 일 수 있습니다.
명령 작업은 워크 플로 중에 UNIX의 하나 또는 여러 셸 명령을 Windows에서 실행할 수 있도록하는 특정 작업입니다.
Q # 41) 독립형 명령 태스크는 무엇입니까?
대답: 독립 실행 형 명령 태스크를 사용하여 워크 플로에서 언제 어디서나 Shell 명령을 실행할 수 있습니다.
문 # 42) 워크 플로우 란? Workflow Manager의 구성 요소는 무엇입니까?
대답: 워크 플로는 작업을 구현하는 방식입니다. 작업을 구현하는 방법에 대해 서버에 알리는 지침 모음입니다.
다음은 Workflow Manager의 세 가지 주요 구성 요소입니다.
- 작업 디자이너
- 작업 개발자
- 워크 플로 디자이너
Q # 43) 이벤트 란 무엇이며 관련 업무는 무엇인가요?
대답: 이벤트는 워크 플로에서 발생하는 모든 작업 또는 기능 일 수 있습니다.
다음과 같은 두 가지 작업이 있습니다.
- 이벤트 대기 작업 : 이 작업은 이벤트가 발생할 때까지 대기하고 이벤트가 트리거되면이 작업이 완료되고 다음 작업을 할당합니다.
- 이벤트 발생 태스크 : 이벤트 발생 태스크는 워크 플로의 특정 이벤트를 트리거합니다.
문 # 44) 사전 정의 이벤트 및 사용자 정의 이벤트 란 무엇입니까?
대답: 미리 정의 된 이벤트는 특정 위치에 특정 파일이 도착할 때까지 대기하는 시스템 정의 이벤트입니다. File-Watcher 이벤트라고도합니다.
사용자 정의 이벤트는 사용자가 생성 한 후 워크 플로에서 언제든지 발생하도록 생성됩니다.
Q # 45) 타겟 디자이너와 타겟로드 순서는 무엇입니까?
대답: Target Designer는 데이터 대상을 정의하는 데 사용됩니다.
INFORMATICA 서버를 통해 서로 다른 대상에 연결된 여러 파티션이있는 여러 소스 또는 단일 소스가있는 경우 서버는 대상로드 순서를 사용하여 대상에서 데이터가로드되는 순서를 정의합니다.
Q # 46) 스테이징 영역은 무엇입니까?
대답: 스테이징 영역은 작업 영역에 연결된 임시 테이블이 저장되는 데이터베이스이거나 데이터 처리를위한 입력을 제공하기 위해 사실 테이블입니다.
Q # 47) STOP과 ABORT의 차이점은 무엇입니까?
답변 : 차이점은 다음과 같습니다.
- 중지 명령이 세션 태스크에서 실행되고, 일단 발생하면 통합 서비스는 데이터 소스의 데이터 읽기만 중지하지만 처리를 계속하고 대상에 기록합니다.
- 낙태 명령은 통합 서비스가 대상에 대한 데이터 읽기, 처리 및 쓰기를 완전히 중지하는 데 사용됩니다. 통합 서비스를 통해 데이터 처리 및 쓰기를 완료하는 데 60 초의 자체 타임 아웃 기간이 있으며 그렇지 않은 경우 단순히 세션을 종료합니다.
Q # 48) 다른 LookUp 캐시는 무엇입니까?
대답: 조회는 캐시되거나 캐시되지 않을 수 있습니다. 기본적으로 다섯 부분으로 나뉩니다.
그들은:
- 정적 캐시
- 동적 캐시
- 재 캐시
- 영구 캐시
- 공유 캐시
정적 캐시는 세션이 실행되는 동안 변경되지 않고 그대로 유지됩니다.
동적 캐시는 세션이 실행되는 동안 자주 업데이트됩니다.
Q # 49) 소스 정의를 업데이트하려면 어떻게해야합니까?
대답: 소스 정의를 업데이트하는 방법에는 두 가지가 있습니다.
그들은:
- 기존 소스 정의를 편집 할 수 있습니다.
- 데이터베이스에서 새 소스를 가져올 수 있습니다.
Q # 50) 리포지토리 관리자를 사용하여 보안 조치를 구현하려면 어떻게해야합니까?
대답: 보안 조치를 구현하는 방법에는 3 가지가 있습니다.
그들은:
- 소유자, 그룹 및 사용자 내의 폴더 권한.
- 잠금 (읽기, 쓰기, 검색, 저장 및 실행).
- 리포지토리 권한 즉.
- 저장소 찾아보기.
- 워크 플로 관리자를 사용합니다 (세션 및 배치 생성 및 속성 설정).
- Workflow Operator (세션 및 배치 실행).
- Designer, Admin Repository 사용 (모든 사용자가 저장소를 만들고 관리 할 수 있음)
- Admin User (사용자가 저장소 서버를 만들고 속성을 설정할 수 있음).
- SuperUser (모든 권한이 사용자에게 부여됨).
Q # 51) INFORMATICA의 장점을 적어보세요.
대답: 가장 선호되는 데이터 통합 도구로 간주되므로 참여해야하는 여러 가지 이점이 있습니다.
그들은:
- Mainframe, RDBMS 등과 같은 서로 다른 데이터 소스간에 데이터를 효과적이고 매우 효율적으로 통신하고 변환 할 수 있습니다.
- 일반적으로 사용 가능한 다른 플랫폼보다 매우 빠르고 강력하며 쉬운 학습입니다.
- INFORMATICA Workflow Monitor의 도움으로 작업을 쉽게 모니터링하고 실패한 작업을 복구 할 수있을뿐만 아니라 느리게 실행되는 작업을 지적 할 수 있습니다.
- 데이터베이스 정보의 간편한 처리, 데이터 유효성 검사, 한 데이터베이스에서 다른 데이터베이스로의 프로젝트 마이그레이션, 프로젝트 개발, 반복 등과 같은 기능이 있습니다.
Q # 52) INFORMATICA가 필요한 몇 가지 영역 또는 실시간 상황을 입력하십시오.
대답: 데이터웨어 하우징, 데이터 통합, 데이터 마이그레이션 및 한 플랫폼에서 다른 플랫폼으로의 애플리케이션 마이그레이션은 실시간 사용 영역의 몇 가지 예입니다.
Q # 53) 몇 가지 예를 들어 ETL 프로그램을 설명하십시오.
대답: 고유성으로 알려진 ETL 도구는 Extract, Transform 및 Load 도구의 약자로 기본적으로 데이터를 추출하고이를 변경하여 정의 된 어딘가로 보내는 목적을 해결합니다.
매우 정확하게 말하면 :
- 추출 작업은 데이터베이스, 파일 등과 같은 소스에서 데이터를 수집하는 것입니다.
- 변환은 소스에서받은 데이터를 변경하는 것으로 간주됩니다.
- 로드는 변경된 데이터를 정의 된 대상에 공급하는 프로세스를 정의합니다.
기술적 인 방식으로 이해하기 위해 ETL 도구는 이기종 소스에서 데이터를 수집하고 정의 된 작업의 분석에 추가로 사용할 수 있도록 동질화되도록 변경합니다.
몇 가지 기본 프로그램 예는 다음과 같습니다.
- 매핑은 디자이너에서 매핑 프로세스가 수행되는 원래 소스에서 데이터를 읽는 ETL 프로세스를 파생합니다.
- 워크 플로는 Workflow Manager 창에서 결정되고 설계된 여러 작업으로 구성됩니다.
- 이 작업은 런타임 중에 수행 할 작업 순서를 결정하는 여러 단계로 구성됩니다.
Q # 54) 데이터베이스와 데이터웨어 하우스의 차이점을 입력하십시오.
대답: 두 가지의 차이점을 이해하려면 아래 표를 참조하십시오.
Mac 용 최고의 무료 비디오 변환기
데이터 베이스 | 데이터웨어 하우스 |
---|---|
일상적인 작업에 사용되는 현재 및 최신 정보를 저장 / 기록합니다. | 장기적으로 정보 지원에 사용되는 과거 데이터를 저장 / 분석합니다. |
그것의 방향은 간단하고 짧은 트랜잭션을 포함하는 온라인 트랜잭션 처리에 있습니다. | 그것의 방향은 복잡한 쿼리를 포함하는 온라인 분석 처리에 있습니다. |
보기가 평평한 관계형 인 상세하고 원시적 인 데이터로 구성됩니다. | 보기가 다차원 인 통합 데이터로 구성됩니다. |
분석 쿼리의 경우 성능이 저하됩니다. | 여기서 분석 쿼리는 고성능으로 판단됩니다. |
효율성은 트랜잭션 처리량을 측정하여 결정됩니다. | 효율성은 쿼리 처리량 및 응답 시간을 측정하여 결정됩니다. |
Q # 55) Connected 및 Unconnected 조회의 기능을 설명하십시오.
답변 : Connected Lookup의 기능은 다음과 같이 설명 할 수 있습니다.
- 연결된 조회를 위해 파이프 라인에서 직접 입력 소스가 있습니다.
- 데이터 흐름에 적극적으로 참여하며 경우에 따라 동적 캐시와 정적 캐시가 모두 사용됩니다.
- 모든 조회 열을 캐시하고 조회 조건이 일치하지 않을 때 출력으로 기본값을 반환합니다.
- 둘 이상의 열 값이 출력 포트로 반환 될 수 있습니다.
- 여러 출력 값이 전달되고 출력 포트가 다른 변환에 연결됩니다.
- 연결된 조회는 사용자 정의 기본값을 지원합니다.
연결되지 않은 조회의 기능은 다음과 같이 설명 할 수 있습니다.
- 연결되지 않은 조회는 정적 캐시를 사용하며 입력 소스는 LKP 표현식의 출력에서받은 결과입니다.
- 조회 출력 포트만 캐시하고 조회 조건이 일치하지 않으면 값을 NULL로 리턴합니다.
- 각 포트에서 하나의 열만 반환됩니다.
- 하나의 출력 값만 다른 변환에 전달됩니다.
- 사용자 정의 기본값은 연결되지 않은 조회에서 지원되지 않습니다.
Q # 56) 실행중인 세션 동안 Informatica 서버에서 출력 파일이 생성됩니다. 그들 중 몇 명을 모집하십시오.
대답: 다음은 몇 가지 출력 파일입니다.
- 캐시 파일 : 이러한 파일은 메모리 캐시 생성시 생성됩니다. 조회 변환, 집계 변환 등과 같은 상황에서는 인덱스 및 데이터 캐시 파일이 Informatica 서버에서 생성됩니다.
- 세션 세부 정보 파일 : 이름이 정의한대로이 파일에는 테이블 이름, 매핑에서 각 대상에 대해 거부되거나 기록 된 행과 같은로드 통계가 포함되며 모니터 창에서 볼 수 있습니다.
- 성능 세부 정보 파일 : 이 파일은 세션 등록 정보 시트의 일부이며 개선 영역을 결정하기위한 세션 성능 정보를 포함합니다.
- INFORMATICA 서버 로그 : 서버는 모든 상태 및 오류 메시지에 대한 로그를 작성하며 홈 디렉토리에서 볼 수 있습니다.
- 세션 로그 파일 : 각 세션에 대해 서버는 설정된 추적 수준에 따라 세션 로그 파일을 만듭니다. 세션에 대한 로그 파일에서 볼 수있는 정보는 다음과 같습니다.
- 세션 초기화 프로세스,
- 리더 및 라이터 스레드를위한 SQL 명령 생성,
- 발생한 오류 목록 및
- 로드 요약
- 세션 후 이메일 : 이는 세션에 대한 정보 (세션 완료 / 세션 실패)를 원하는 수신자에게 자동으로 전달하는 데 도움이됩니다.
- 파일 거부 : 이 파일에는 대상에 사용 / 기록되지 않은 데이터에 대한 정보가 포함되어 있습니다.
- 제어 파일 : 세션이 외부 로더를 사용하는 경우 제어 파일은 대상 파일에 대한 로딩 명령과 데이터 형식으로 구성됩니다.
- 표시기 파일 : 이 파일에는 기본적으로 INSERT / UPDATE / DELETE 또는 REJECT로 표시된 행을 강조 표시하는 숫자가 포함되어 있습니다.
- 결과물 파일: 출력 파일은 파일 속성을 기반으로 생성됩니다.
Q # 57) 능동형 변환과 수동형 변환을 구별하는 방법은 무엇입니까?
대답: 능동 및 수동 변환의 차이점을 이해하기 위해 차이점을 더 잘 설명하는 기능을 살펴 보겠습니다.
활성 변환이 수행하는 작업에는 다음이 포함됩니다.
- 변환을 통과하는 요구 사항에 따라 행 수를 변경합니다. 예를 들어, 조건을 충족하지 않는 행을 삭제하는 필터 변환.
- 롤백 및 커밋 지점을 설정하여 트랜잭션 경계를 변경합니다. 예를 들어, 트랜잭션 제어 변환.
- INSERT / UPDATE / DELETE 또는 REJECT의 행 유형 변경.
수동 변환에서 수행하는 작업에는 다음이 포함됩니다.
- 변환을 통과하는 행 수는 변경되지 않습니다.
- 트랜잭션 경계가 설정됩니다.
- 행 유형이 설정됩니다.
Q # 58) 다양한 유형의 변신을 모집하십시오.
답변 : 다양한 유형의 변환은 다음과 같습니다.
- 집계 변환
- 표현 변환
- 노멀 라이저 변환
- 순위 변환
- 필터 변환
- 결합 자 변환
- 조회 변환
- 저장 프로 시저 변환
- 정렬 변환
- 전략 변환 업데이트
- XML 소스 한정자 변환
- 라우터 변환
- 시퀀스 생성기 변환
Q # 59) 동적 캐시 란 무엇입니까?
대답: INFORMATICA 조회는 캐시 됨 또는 캐시되지 않음으로 분류 할 수 있습니다. 동적 캐시의 경우 행을 전달할 때 행을 삽입하거나 삭제할 수 있으며 대상과 동기화됩니다. 캐시 메모리는 세션 내에서 삭제 / 업데이트 작업 후 매번 새로 고쳐집니다.
Q # 60) 정적 캐시에서 디코딩이란 무엇입니까?
대답: 정적 캐시는 세션 실행에서 업데이트되거나 새로 고쳐지지 않는 캐시입니다. 기본 캐시이며 반환 조건이 true 인 경우에만 값을 반환합니다. 다른 경우에는 Null 값을 반환합니다. 이 경우 캐시 삽입 또는 업데이트를 수행 할 수 없습니다.
Q # 61) 필터 변환에 비해 라우터 변환의 몇 가지 장점을 언급하십시오.
대답: 라우터 변환과 필터 변환은 모두 조건을 사용하여 데이터를 테스트하고 필터링하므로 동일합니다.
그러나 필터 변환에 대한 라우터의 장점은 아래에 언급 된 사항으로 이해할 수 있습니다.
라우터 변환 :
- 하나 이상의 테스트 조건을 허용합니다.
- 여러 조건에서 동일한 입력 데이터를 테스트하는 기능을 제공합니다.
- 매핑의 경우 입력 데이터는 서버에서 한 번만 처리되므로 성능이 향상됩니다.
- 덜 복잡하고 효율적입니다.
- 테스트 조건에 실패한 레코드는 차단되지 않고 대신 기본 그룹으로 전달됩니다.
Q # 62) 세션의 일부 속성을 등록합니다.
대답: 세션은 워크 플로 관리자에서 사용할 수 있으며 세션 작업을 생성하여 구성됩니다. 매핑 프로그램 내에서 여러 세션이있을 수 있으며 재사용 가능하거나 재사용 불가능할 수 있습니다.
세션의 일부 속성은 다음과 같습니다.
- 요구 사항에 따라 세션 작업은 동시에 또는 순차적으로 실행할 수 있습니다.
- 성능을 분석하도록 세션을 구성 할 수 있습니다.
- 세션 작업을 생성하거나 실행하려면 세션 이름, 일정 및 통합 서비스에 대한 일반 정보가 있어야합니다.
- 세션의 다른 중요한 속성으로는 세션 로그 파일, 테스트로드, 오류 처리, 커밋 간격, 대상 속성 등이 있습니다.
Q # 63) 소스 한정자 변환이 사용되는 작업을 등록하십시오.
대답: 소스 규정자는 실행중인 세션 내에서 통합 서비스에 관련된 행을 읽는 활성 변환으로 간주됩니다. 소스에서 데이터를 가져오고 매핑에 소스를 추가하는 동안 자동으로 추가되는 방식을 결정합니다.
소스 한정자가 사용되는 여러 작업 목록은 다음과 같습니다.
- 행 필터링
- 데이터 정렬
- 맞춤 쿼리 생성
- 동일한 소스의 테이블 결합
- 고유 한 값 선택
Q # 64) 기본 목적으로 몇 가지 Power Center 클라이언트 응용 프로그램을 언급하십니까?
대답: 세션 및 워크 플로 생성, 워크 플로 진행률 모니터링, Mapplet 디자인 등과 같은 작업은 PowerCenter 클라이언트 응용 프로그램에서 수행됩니다.
다음은 용도와 함께 PowerCenter 클라이언트 응용 프로그램 목록입니다.
- 리포지토리 관리자 : 관리 도구이며 기본 목적은 저장소 폴더, 개체, 그룹 등을 관리하는 것입니다.
- 관리 콘솔 : 여기에서는 시작 / 중지, 백업 / 복원, 업그레이드 / 삭제 등과 같은 서비스 작업이 수행됩니다.
- 전력 센터 설계자 : 디자이너는 다양한 용도로 사용되는 다양한 디자인 도구로 구성됩니다. 이러한 설계 도구는 다음과 같습니다.
- 소스 분석기
- 타겟 디자이너
- 변환 개발자
- Mapplet 디자이너
- 매핑 관리자
- 워크 플로 관리자 : 기본 목적은 디자이너에서 설계된 매핑을 실행하는 데 필요한 일련의 지침 / 워크 플로를 정의하는 것입니다. 워크 플로 개발을 돕기 위해 작업 개발자, 워크 플로 디자이너, Worklet 디자이너의 세 가지 도구를 사용할 수 있습니다.
- 워크 플로우 모니터 : 이름에서 알 수 있듯이 워크 플로 모니터는 워크 플로 또는 작업을 모니터링합니다. 사용 가능한 창 목록은 다음과 같습니다.
- 네비게이터 창
- 출력 창
- 시간 창
- 속성 창
- 작업보기
- 간트 차트보기
결론
지금 쯤이면 인터뷰에서 질문 할 도구와 질문 유형에 대한 명확한 아이디어를 얻었을 것입니다.
INFORMATICA는 데이터 통합을 수행하는 최고의 솔루션입니다. Windows, Linux, Unix 등과 같은 다중 플랫폼 환경에서 다중 데이터 관리와 함께 작동하며 여러 플랫폼 중에서 더 나은 결과와 최상의 성능을 위해 50,000 개 이상의 플랫폼에서 테스트되었습니다.
요컨대, INFORMATICA는 다양한 소스에서 정보 나 데이터를 수집하고 실제로 저장하지 않고 정의 된 특정 대상에 해당 정보를로드하는 ETL 도구입니다. 그것의 임무는 다양한 서비스와 자원을 다른 기계에 전달하는 것이므로 전달 된 데이터는 놀라운 결과로 정확해야합니다.
이 문서를 통해 Informatica 개념에 대한 지식을 쌓고 즉시 인터뷰를 준비하십시오.
모두 제일 좋다!!!
추천 도서
- 인터뷰 질문 및 답변
- ETL 테스트 인터뷰 질문 및 답변
- 까다로운 수동 테스트 질문 및 답변
- 상위 32 개 최고의 Datastage 인터뷰 질문 및 답변
- Teradata 인터뷰 질문 및 답변
- SAS 인터뷰 질문 및 답변 상위 30 개
- 자세한 답변이 포함 된 상위 24 개 데이터 모델링 인터뷰 질문
- 완벽한 데이터 관리를위한 10 가지 최고의 데이터 분석 도구 (2021 목록)
- 테스트 데이터 관리를위한 IBM Rational Quality Manager의 데이터 풀 기능
- 테스트 데이터 관리 개념, 프로세스 및 전략
- 2021 년 최고의 14 가지 최고의 테스트 데이터 관리 도구