ТОП-20 ИНТЕРВЬЮ ПО ТЕСТИРОВАНИЮ ETL ВОПРОСЫ И ОТВЕТЫ

Ниже приведены часто задаваемые вопросы и ответы на собеседовании по тестированию ETL (вопросы и ответы на собеседовании по хранилищу данных) для новичков, а также опытных тестировщиков и разработчиков ETL.

Содержание

Вопросы для собеседования по тестированию хранилища данных

strong>

Давайте начнем с вопросов для интервью по тестированию ETL.

Что такое ETL?

ETL расшифровывается как Извлечьизвлечение Тпреобразовать и Загрузить. Извлечение, преобразование и загрузка — это три функции базы данных, которые объединены в один инструмент.

Извлечение: это процесс чтения данных из базы данных

Преобразование:Это процесс преобразования извлеченных данных из исходной формы в форму, необходимую для хранения в другой базе данных.

Загрузка: это процесс загрузки данных в целевую базу данных< /p>

Другими словами, процесс ETL создает данные из нескольких источников для создания киоска данных, хранилища операционных данных, хранилища данных, концентратора данных или озера данных.

Что такое тестирование ETL?< /сильный>

Тестирование ETL проверяет перемещение данных из источника в место назначения и проверку количества данных как в источнике, так и в месте назначения, а также проверку извлечения и преобразования данных, а также проверку связей между таблицами.

Что такое хранилище данных?< /h3>

Сбор, хранение и управление различными видами данных из 'n' no. из различных источников и предоставление значимых восприятий и прогнозов для бизнеса называется хранилищем данных.

Что такое тестирование базы данных?

Это также известное как внутреннее тестирование или тестирование данных.
Тестирование базы данных включает проверку целостности данных во внешнем интерфейсе с данными, присутствующими в серверной части. Он проверяет схему, таблицы базы данных, столбцы, индексы, хранимые процедуры, триггеры, дублирование данных, потерянные записи, ненужные записи. Он включает в себя обновление записей в базе данных и их проверку во внешнем интерфейсе.

Тестирование базы данных включает следующее:

  • проверку достоверности данных
  • проверку целостности данных
  • производительность базы данных. testing
  • Тестирование процедур, триггеров и функций

Назовите несколько различий между ETL и тестированием баз данных?

Вот некоторые различия между тестированием ETL и тестированием базы данных.

Тестирование ETL

Тестирование БД

Тестирование ETL больше сосредоточено на перемещении данных из нескольких источников в хранилище данных.

Тестирование БД сосредоточено на правилах базы данных и тестировании ограничений базы данных приложений.

Проверьте количество данных в исходной и целевой базах данных.

Убедитесь, что каждый столбец в таблице имеет допустимые значения данных.

Тестирование выполняется для проверки того, что извлечение, преобразование и загрузка данных выполняются должным образом.

Это делается для проверки того, правильно ли приложение выполняет операции CRUD и удовлетворяются ли потребности бизнеса.< tr class="row-5 нечетный">

Работает с огромными данными, историческими данными и несколькими источниками.

Это делается с данными бизнес-транзакций.

В ETL , используется онлайн-аналитическая обработка (OLAP), которая выполняет сложные запросы для анализа исторических агрегированных данных из систем OLTP.

БД использует онлайн-обработку транзакций (OLTP), которая работает с операциями базы данных в реальном времени, такими как создание, обработка и хранение данных на основе транзакций.

Тип данных не нормализован, с большим количеством индексов и агрегаций, с меньшим количеством объединений.

При тестировании БД данные нормализуются с большим количеством объединений.

Тестирование ETL связано с извлечением данных, преобразованием, загрузкой данных и, наконец, проверкой отчетов на панели инструментов.

Тестирование базы данных предназначено для проверки правильности работы логики приложения, правильности операций с данными.< tr class="row-9 нечетный">

Тестирование ETL — это многомерное тестирование.

Тестирование БД ограничено бизнес-логикой и логикой приложения.

Упомянули некоторые ошибки ETL?

  • Ошибки, связанные с пользовательским интерфейсом/интерфейсом, такие как удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиль шрифта, размер шрифта, цвета, выравнивание и т. д.
  • Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значения.
  • Проблемы с допустимыми и недопустимыми типами данных
  • Ошибки вычислений
  • Проблемы, связанные с производительностью или скоростью.
  • Проблемы, связанные с нарушением бизнес-правил.
  • Запишите ошибки дублирования.
  • Потеря данных в какой-то операции

Упомянуть некоторые тестовые примеры ETL?

  • Структура исходной и целевой таблиц должна соответствовать листу сопоставления ETL.
  • Тип данных и длина данных в источнике и цели должны быть одинаковыми.
  • Формат типа поля данных должен совпадать на как в исходной, так и в целевой таблицах.
  • Имена столбцов должны сопоставляться с таблицами ETL как в исходной, так и в целевой
  • Ограничения определяются как ожидаемые для цели, как они определены для источника.
  • Количество записей в источнике и цели одинаково после загрузки данных.
  • Формат даты одинаков в исходной и целевой таблицах.
  • Проверьте, не найдены ли повторяющиеся записи в целевых таблицах.

Что такое документ сопоставления ETL?

Документ сопоставления ETL является наиболее важным документом для проектирования и разработки заданий ETL. Он содержит информацию об источнике, цели и бизнес-правилах. Это помогает в написании SQL-запросов для тестирования инструментов ETL.

Что такое область подготовки данных (DSA)?

Область подготовки данных (DSA) ) или зона отгрузки — это зона временного промежуточного хранения между источниками данных и хранилищем данных. Он используется для обработки данных в процессе извлечения, преобразования и загрузки (ETL).

Каковы обязанности тестировщика ETL?

Тестер ETL отвечает за следующее< ул>

  • Проверка источников данных, извлечение данных, применение логики преобразования и загрузка данных в место назначения.
  • Глубокие знания инструментов ETL и процессов ETL.
  • Глубокие знания в написании запросов SQL.

    Какие различные инструменты используются в ETL?

    • AWS Glue
    • Alooma
    • Stitch
    • Fivetran
    • Xplenty< li>Matillion
    • Streamsets
    • Talend
    • Informatica
    • Oracle Data Integrator
    • Etleap

    Просмотрите подробный пост со списком программных инструментов ETL

    Что такое БИ?

    BI (Business Intelligence) — это процесс сбора необработанных данных и преобразования их в значимую информацию, которая будет полезна для бизнеса.

    В чем разница между интеллектуальным анализом данных и хранением данных?

    Интеллектуальный анализ данных можно определить как процесс извлечения скрытой информации из больших баз данных и ее интерпретации для будущего прогнозирования.

    Принимая во внимание, что хранение данныхможет сделать нас из интеллектуального анализа данных для аналитической обработки данных для более быстрого создания подробных отчетов.

    В чем разница между инструментами ETL и инструментами BI?

    Разница между инструментами ETL и BI заключается в том, что

    Инструменты ETL: используются для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных. .

    Примеры: Informatica, Data Stage и т. д.

    Инструменты бизнес-аналитики: Используется для сбора необработанных данных и преобразования их в интерактивные отчеты для конечных пользователей в помощь предприятиям.

    Примеры: Informatica, Microsoft SSIS, служба данных SAP BO, Oracle Data Integrator (ODI) Clover ETL Open Источник и т. д. 

    Какие существуют типы систем хранилища данных?

    • Онлайн-аналитическая обработка (OLAP)
    • Прогнозный анализ
    • Онлайн-обработка транзакций
    • Магазин данных

    В чем разница между OLTP и OLAP?

    OLTP(онлайн-обработка транзакций) – это реляционная база данных, которая используется для управления повседневными транзакциями.

    OLAP (онлайн-аналитическая обработка) – это многомерная аналитическая (MDA) система, обеспечивает возможность сложных вычислений, обнаружения данных.

    В чем разница между инструментами ETL и инструментами OLAP?

    Разница между инструментами ETL и OLAP заключается в том, что

    Инструменты ETL:Инструменты ETL предназначены для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных.

    Примеры: Informatica, Data Stage, и т. д.

    Инструменты OLAP. Инструменты OLAP (обработка онлайн-аналитики) используются для составления отчетов в данных OLAP, доступных в многонаправленной модели.

    Примеры:

    strong> Cognos, Business Objects и т. д.

    Что такое ошибки ETL?

    • Ошибки, связанные с пользовательским интерфейсом/интерфейсом, такие как удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиля шрифта, размера шрифта, цветов, выравнивания и т. д.
    • Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значения.
    • Проблемы с допустимыми и недопустимыми типами данных
    • Ошибки расчета
    • Производительность или проблемы, связанные со скоростью.
    • Проблемы, связанные с нарушением бизнес-правил.
    • Запись ошибок дублирования.
    • Потеря данных в некоторых операциях.

    Надеемся, что мы перечислили вопросы интервью ETL Testing a и ответы, которые чаще всего задают на собеседованиях по тестированию ETL.
    TAG: qa

  • От QA genius

    Adblock
    detector