atesting.ru Собеседование 20 самых популярных вопросов и ответов на собеседовании по тестированию ETL

20 самых популярных вопросов и ответов на собеседовании по тестированию ETL

Ниже приведены часто задаваемые вопросы на собеседовании по тестированию ETL & amp; Ответы (вопросы и ответы на собеседование по хранилищам данных) для новичков, а также для опытных тестировщиков и разработчиков ETL.

Вопросы на собеседовании по тестированию хранилищ данных

Давайте приступим с этими вопросами на собеседовании по тестированию ETL.

Что такое ETL?

ETL означает E xtract T ransform и L давай. Извлечь, преобразовать и & amp; Загрузка — это три функции базы данных, которые объединены в один инструмент.

Извлечь: Это процесс чтения данных из базы данных

Преобразование : Это процесс преобразования извлеченных данных из исходной формы в форму, которую необходимо сохранить в другой базе данных.

Загрузить: Это процесс загрузки данных в целевую базу

Другими словами, процесс ETL производит данные из нескольких источников, чтобы создать витрину данных, оперативное хранилище данных, хранилище данных, концентратор данных или озеро данных.

Что такое тестирование ETL?

Тестирование ETL проверяет перемещение данных от источника к месту назначения и проверяет количество данных как в источнике, так и в месте назначения, а также проверяет извлечение данных, преобразование, а также проверяет связи таблиц.

< strong> Что такое хранилище данных?

Сбор, хранение и управление различными видами данных из «n» no. хранилищ данных.

Что такое тестирование базы данных?

Это также называется внутренним тестированием. или тестирование данных.
Тестирование базы данных включает в себя проверку целостности данных во внешнем интерфейсе с данными, присутствующими во внутреннем интерфейсе. Он проверяет схему, таблицы базы данных, столбцы, индексы, хранимые процедуры, триггеры, дублирование данных, потерянные записи, нежелательные записи. Он включает в себя обновление записей в базе данных и их проверку во внешнем интерфейсе.

Тестирование базы данных включает следующее:

  • Проверка достоверности данных
  • Тестирование целостности данных
  • Тестирование производительности базы данных
  • Тестирование процедур, триггеров и функций

Назовите несколько различий между ETL & amp; Тестирование базы данных?

Вот некоторые различия между тестированием ETL & amp; Тестирование базы данных.

Тестирование ETL Тестирование БД
Тестирование ETL больше ориентировано на перемещение данных из нескольких источников в хранилище данных. Тестирование БД сосредоточено на проверке правил и ограничений базы данных приложений.
Проверьте количество данных в исходной и целевой базах данных. Убедитесь, что каждый столбец в таблице имеет допустимые значения данных.
Тестирование проводится для проверки того, что извлечение, преобразование и загрузка данных были выполнены должным образом. Это делается для проверки того, приложение выполняет операции CRUD правильно, и бизнес-потребности удовлетворяются.
Работа с огромными данными, историческими данными и множественными источниками. Это делается с данными бизнес-транзакций.
В ETL используется интерактивная аналитическая обработка (OLAP), которая выполняет сложные запросы для анализа статистических агрегированных данных из Системы OLTP. БД использует онлайн-обработку транзакций (OLTP), которая работает с операциями базы данных в реальном времени, такими как создание, обработка и хранение данных на транзакционной основе.
Тип данных не нормализован, с большим количеством индексов и агрегатов, с меньшим количеством объединений. В тестировании БД данные нормализованы с большим количеством объединений.
Тестирование ETL участвует в извлечении данных, преобразовании, загрузке данных и, наконец, проверке отчетов на приборной панели. Тестирование базы данных предназначено для проверки правильности работы логики приложения и правильности операций с данными.
Тестирование ETL — это многомерное тестирование. Тестирование БД ограничено бизнес-логикой и логикой приложения .

Назовите некоторые ошибки ETL?

  • Ошибки, связанные с пользовательским интерфейсом/интерфейсом, например — Удобство использования , орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиль шрифта, размер шрифта, цвета, выравнивание и т. д.
  • Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значений.
  • Проблемы с действительными и недопустимыми типами данных.
  • Ошибки вычислений.
  • Проблемы, связанные с производительностью или скоростью.
  • Проблемы, связанные с нарушением бизнес-правил.
  • Дублирование записей ошибки.
  • Потеря данных при некоторой операции

Упомянули некоторые тестовые примеры ETL?

  • Структура исходной и целевой таблиц должна совпадать с листом сопоставления ETL.
  • Тип данных и длина данных в источнике и цели должны быть одинаковыми.
  • Формат типа поля данных должен совпадать как в исходной, так и в целевой таблицах.
  • Имена столбцов должны сопоставляться с листами ETL как для источника, так и для цели
  • Ограничения определены, как и ожидалось, для целевого объекта, как определено для источника.
  • После загрузки данных количество записей в источнике и целевом объекте одинаковое.
  • Формат даты одинаков для исходной и целевой таблиц.
  • Убедитесь, что в целевых таблицах не обнаружены повторяющиеся записи.

Что такое документ сопоставления ETL?

Документ сопоставления ETL является наиболее важным документом для проектирования и разработки заданий ETL. Он содержит информацию об источнике, цели и бизнес-правилах. Это помогает в написании SQL-запросов для тестирования инструментов ETL.

Что такое промежуточная область данных (DSA)?

Промежуточная область данных (DSA) или зона пересылки — это временная промежуточная область хранения между источниками данных и хранилищем данных. Он используется для обработки данных в процессе извлечения, преобразования и загрузки (ETL).

Каковы обязанности тестировщика ETL?

Тестеры ETL несут ответственность для следующего

  • Проверка источников данных, извлечение данных, применение логики преобразования и загрузка данных в место назначения.
  • Глубокие знания инструментов ETL и ETL процессов.
  • Глубокие знания в написании SQL-запросов.

Какие различные инструменты используются в ETL?

  • AWS Glue
  • Alooma
  • Stitch
  • Fivetran
  • Xplenty
  • Matillion
  • Streamsets
  • Talend
  • Informatica
  • Oracle Data Integrator
  • Etleap

Ознакомьтесь с подробным сообщением на список программных средств ETL

Что такое BI?

BI (Business Intelligence) — это процесс сбора необработанных данных и их преобразования в значимую информацию, которая будет быть полезным для бизнеса.

В чем разница между интеллектуальным анализом данных и хранилищем данных?

Интеллектуальный анализ данных можно определить как процесс извлечения скрытой информации из больших баз данных и ее интерпретации для прогнозирование будущего.

В то время как хранилище данных может превратить нас в хранилище данных для аналитической обработки данных с целью более быстрого создания подробных отчетов.

< strong> В чем разница между инструментами ETL и инструментами бизнес-аналитики?

Разница между инструментами ETL и BI заключается в том, что

Инструменты ETL: используются для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторыми процесс очистки данных.

Примеры: Informatica, Data Stage и т. д.

Инструменты бизнес-аналитики: используются для сбора необработанных данных и преобразовать его в интерактивные отчеты для конечных пользователей, чтобы помочь предприятиям.

Примеры: Informatica, Microsoft SSIS, служба данных SAP BO, Oracle Data Integrator (ODI) Clover ETL с открытым исходным кодом и т. Д.

Какие бывают типы систем хранилищ данных?

  • Аналитическая обработка в Интернете (OLAP)
  • Прогнозный анализ
  • Обработка транзакций в Интернете
  • Витрина данных

В чем разница между OLTP и OLAP?

OLTP (онлайн-обработка транзакций) — это реляционная база данных, которая используется для повседневного управления транзакции.

OLAP (онлайн-аналитическая обработка) — это многомерная аналитическая (MDA) система, которая предоставляет возможность для сложных вычислений и обнаружения данных.

В чем разница между инструментами ETL и OLAP инструменты?

Разница между инструментами ETL и OLAP заключается в том, что

Инструменты ETL: Инструменты ETL предназначены для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных.

Примеры: Informatica , Data Stage и т. Д.

Инструменты OLAP: инструменты OLAP (обработка онлайн-аналитики) используются для создания отчетов в данных OLAP, доступных в многонаправленной модели.

Примеры: Cognos, Business Objects и т. д.

Что такое ошибки ETL?

  • UI/Interface связанные ошибки, такие как — удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиль шрифта, размер шрифта, цвета, выравнивание и т. д.
  • Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значений.
  • Проблемы с действительными и недопустимыми типами данных.
  • Ошибки вычислений.
  • Проблемы, связанные с производительностью или скоростью.
  • Проблемы, связанные с нарушением бизнес-правил.
  • Запись ошибок дублирования.
  • Потеря данных при выполнении некоторых операций.

Надеюсь, мы перечислили вопросы и ответы на собеседование по тестированию ETL, которые чаще всего задают на собеседованиях по тестированию ETL.

< p>