Ниже приведены часто задаваемые вопросы и ответы на собеседовании по тестированию ETL (вопросы и ответы на собеседовании по хранилищу данных) для новичков, а также опытных тестировщиков и разработчиков ETL.
Вопросы для собеседования по тестированию хранилища данных
strong>
Давайте начнем с вопросов для интервью по тестированию ETL.
Что такое ETL?
ETL расшифровывается как Извлечьизвлечение Тпреобразовать и Загрузить. Извлечение, преобразование и загрузка — это три функции базы данных, которые объединены в один инструмент.
Извлечение: это процесс чтения данных из базы данных
Преобразование:Это процесс преобразования извлеченных данных из исходной формы в форму, необходимую для хранения в другой базе данных.
Загрузка: это процесс загрузки данных в целевую базу данных< /p>
Другими словами, процесс ETL создает данные из нескольких источников для создания киоска данных, хранилища операционных данных, хранилища данных, концентратора данных или озера данных.
Что такое тестирование ETL?< /сильный>
Тестирование ETL проверяет перемещение данных из источника в место назначения и проверку количества данных как в источнике, так и в месте назначения, а также проверку извлечения и преобразования данных, а также проверку связей между таблицами.
Что такое хранилище данных?< /h3>
Сбор, хранение и управление различными видами данных из 'n' no. из различных источников и предоставление значимых восприятий и прогнозов для бизнеса называется хранилищем данных.
Что такое тестирование базы данных?
Это также известное как внутреннее тестирование или тестирование данных.
Тестирование базы данных включает проверку целостности данных во внешнем интерфейсе с данными, присутствующими в серверной части. Он проверяет схему, таблицы базы данных, столбцы, индексы, хранимые процедуры, триггеры, дублирование данных, потерянные записи, ненужные записи. Он включает в себя обновление записей в базе данных и их проверку во внешнем интерфейсе.
Тестирование базы данных включает следующее:
- проверку достоверности данных
- проверку целостности данных
- производительность базы данных. testing
- Тестирование процедур, триггеров и функций
Назовите несколько различий между ETL и тестированием баз данных?
Вот некоторые различия между тестированием ETL и тестированием базы данных.
Тестирование ETL
Тестирование БД
Тестирование ETL больше сосредоточено на перемещении данных из нескольких источников в хранилище данных.
Тестирование БД сосредоточено на правилах базы данных и тестировании ограничений базы данных приложений.
Проверьте количество данных в исходной и целевой базах данных.
Убедитесь, что каждый столбец в таблице имеет допустимые значения данных.
Тестирование выполняется для проверки того, что извлечение, преобразование и загрузка данных выполняются должным образом.
Это делается для проверки того, правильно ли приложение выполняет операции CRUD и удовлетворяются ли потребности бизнеса.< tr class="row-5 нечетный">
Работает с огромными данными, историческими данными и несколькими источниками.
Это делается с данными бизнес-транзакций.
В ETL , используется онлайн-аналитическая обработка (OLAP), которая выполняет сложные запросы для анализа исторических агрегированных данных из систем OLTP.
БД использует онлайн-обработку транзакций (OLTP), которая работает с операциями базы данных в реальном времени, такими как создание, обработка и хранение данных на основе транзакций.
Тип данных не нормализован, с большим количеством индексов и агрегаций, с меньшим количеством объединений.
При тестировании БД данные нормализуются с большим количеством объединений.
Тестирование ETL связано с извлечением данных, преобразованием, загрузкой данных и, наконец, проверкой отчетов на панели инструментов.
Тестирование базы данных предназначено для проверки правильности работы логики приложения, правильности операций с данными.< tr class="row-9 нечетный">
Тестирование ETL — это многомерное тестирование.
Тестирование БД ограничено бизнес-логикой и логикой приложения.
Упомянули некоторые ошибки ETL?
- Ошибки, связанные с пользовательским интерфейсом/интерфейсом, такие как удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиль шрифта, размер шрифта, цвета, выравнивание и т. д.
- Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значения.
- Проблемы с допустимыми и недопустимыми типами данных
- Ошибки вычислений
- Проблемы, связанные с производительностью или скоростью.
- Проблемы, связанные с нарушением бизнес-правил.
- Запишите ошибки дублирования.
- Потеря данных в какой-то операции
Упомянуть некоторые тестовые примеры ETL?
- Структура исходной и целевой таблиц должна соответствовать листу сопоставления ETL.
- Тип данных и длина данных в источнике и цели должны быть одинаковыми.
- Формат типа поля данных должен совпадать на как в исходной, так и в целевой таблицах.
- Имена столбцов должны сопоставляться с таблицами ETL как в исходной, так и в целевой
- Ограничения определяются как ожидаемые для цели, как они определены для источника.
- Количество записей в источнике и цели одинаково после загрузки данных.
- Формат даты одинаков в исходной и целевой таблицах.
- Проверьте, не найдены ли повторяющиеся записи в целевых таблицах.
Что такое документ сопоставления ETL?
Документ сопоставления ETL является наиболее важным документом для проектирования и разработки заданий ETL. Он содержит информацию об источнике, цели и бизнес-правилах. Это помогает в написании SQL-запросов для тестирования инструментов ETL.
Что такое область подготовки данных (DSA)?
Область подготовки данных (DSA) ) или зона отгрузки — это зона временного промежуточного хранения между источниками данных и хранилищем данных. Он используется для обработки данных в процессе извлечения, преобразования и загрузки (ETL).
Каковы обязанности тестировщика ETL?
Тестер ETL отвечает за следующее< ул>
Проверка источников данных, извлечение данных, применение логики преобразования и загрузка данных в место назначения.
Глубокие знания инструментов ETL и процессов ETL.
Глубокие знания в написании запросов SQL.
Какие различные инструменты используются в ETL?
- AWS Glue
- Alooma
- Stitch
- Fivetran
- Xplenty< li>Matillion
- Streamsets
- Talend
- Informatica
- Oracle Data Integrator
- Etleap
Просмотрите подробный пост со списком программных инструментов ETL
Что такое БИ?
BI (Business Intelligence) — это процесс сбора необработанных данных и преобразования их в значимую информацию, которая будет полезна для бизнеса.
В чем разница между интеллектуальным анализом данных и хранением данных?
Интеллектуальный анализ данных можно определить как процесс извлечения скрытой информации из больших баз данных и ее интерпретации для будущего прогнозирования.
Принимая во внимание, что хранение данныхможет сделать нас из интеллектуального анализа данных для аналитической обработки данных для более быстрого создания подробных отчетов.
В чем разница между инструментами ETL и инструментами BI?
Разница между инструментами ETL и BI заключается в том, что
Инструменты ETL: используются для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных. .
Примеры: Informatica, Data Stage и т. д.
Инструменты бизнес-аналитики: Используется для сбора необработанных данных и преобразования их в интерактивные отчеты для конечных пользователей в помощь предприятиям.
Примеры: Informatica, Microsoft SSIS, служба данных SAP BO, Oracle Data Integrator (ODI) Clover ETL Open Источник и т. д.
Какие существуют типы систем хранилища данных?
- Онлайн-аналитическая обработка (OLAP)
- Прогнозный анализ
- Онлайн-обработка транзакций
- Магазин данных
В чем разница между OLTP и OLAP?
OLTP(онлайн-обработка транзакций) – это реляционная база данных, которая используется для управления повседневными транзакциями.
OLAP (онлайн-аналитическая обработка) – это многомерная аналитическая (MDA) система, обеспечивает возможность сложных вычислений, обнаружения данных.
В чем разница между инструментами ETL и инструментами OLAP?
Разница между инструментами ETL и OLAP заключается в том, что
Инструменты ETL:Инструменты ETL предназначены для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных.
Примеры: Informatica, Data Stage, и т. д.
Инструменты OLAP. Инструменты OLAP (обработка онлайн-аналитики) используются для составления отчетов в данных OLAP, доступных в многонаправленной модели.
Примеры:
strong> Cognos, Business Objects и т. д.
Что такое ошибки ETL?
- Ошибки, связанные с пользовательским интерфейсом/интерфейсом, такие как удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиля шрифта, размера шрифта, цветов, выравнивания и т. д.
- Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значения.
- Проблемы с допустимыми и недопустимыми типами данных
- Ошибки расчета
- Производительность или проблемы, связанные со скоростью.
- Проблемы, связанные с нарушением бизнес-правил.
- Запись ошибок дублирования.
- Потеря данных в некоторых операциях.
Надеемся, что мы перечислили вопросы интервью ETL Testing a и ответы, которые чаще всего задают на собеседованиях по тестированию ETL.
TAG: qa
Тестирование базы данных включает проверку целостности данных во внешнем интерфейсе с данными, присутствующими в серверной части. Он проверяет схему, таблицы базы данных, столбцы, индексы, хранимые процедуры, триггеры, дублирование данных, потерянные записи, ненужные записи. Он включает в себя обновление записей в базе данных и их проверку во внешнем интерфейсе.
Какие различные инструменты используются в ETL?
- AWS Glue
- Alooma
- Stitch
- Fivetran
- Xplenty< li>Matillion
- Streamsets
- Talend
- Informatica
- Oracle Data Integrator
- Etleap
Просмотрите подробный пост со списком программных инструментов ETL
Что такое БИ?
BI (Business Intelligence) — это процесс сбора необработанных данных и преобразования их в значимую информацию, которая будет полезна для бизнеса.
В чем разница между интеллектуальным анализом данных и хранением данных?
Интеллектуальный анализ данных можно определить как процесс извлечения скрытой информации из больших баз данных и ее интерпретации для будущего прогнозирования.
Принимая во внимание, что хранение данныхможет сделать нас из интеллектуального анализа данных для аналитической обработки данных для более быстрого создания подробных отчетов.
В чем разница между инструментами ETL и инструментами BI?
Разница между инструментами ETL и BI заключается в том, что
Инструменты ETL: используются для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных. .
Примеры: Informatica, Data Stage и т. д.
Инструменты бизнес-аналитики: Используется для сбора необработанных данных и преобразования их в интерактивные отчеты для конечных пользователей в помощь предприятиям.
Примеры: Informatica, Microsoft SSIS, служба данных SAP BO, Oracle Data Integrator (ODI) Clover ETL Open Источник и т. д.
Какие существуют типы систем хранилища данных?
- Онлайн-аналитическая обработка (OLAP)
- Прогнозный анализ
- Онлайн-обработка транзакций
- Магазин данных
В чем разница между OLTP и OLAP?
OLTP(онлайн-обработка транзакций) – это реляционная база данных, которая используется для управления повседневными транзакциями.
OLAP (онлайн-аналитическая обработка) – это многомерная аналитическая (MDA) система, обеспечивает возможность сложных вычислений, обнаружения данных.
В чем разница между инструментами ETL и инструментами OLAP?
Разница между инструментами ETL и OLAP заключается в том, что
Инструменты ETL:Инструменты ETL предназначены для извлечения данных из устаревших систем, преобразования данных и загрузки их в указанную базу данных с некоторым процессом очистки данных.
Примеры: Informatica, Data Stage, и т. д.
Инструменты OLAP. Инструменты OLAP (обработка онлайн-аналитики) используются для составления отчетов в данных OLAP, доступных в многонаправленной модели.
Примеры:
strong> Cognos, Business Objects и т. д.
Что такое ошибки ETL?
- Ошибки, связанные с пользовательским интерфейсом/интерфейсом, такие как удобство использования, орфографические ошибки, навигация, размещение объектов пользовательского интерфейса, стиля шрифта, размера шрифта, цветов, выравнивания и т. д.
- Проблемы, связанные с анализом граничных значений — проверка минимального и максимального значения.
- Проблемы с допустимыми и недопустимыми типами данных
- Ошибки расчета
- Производительность или проблемы, связанные со скоростью.
- Проблемы, связанные с нарушением бизнес-правил.
- Запись ошибок дублирования.
- Потеря данных в некоторых операциях.
Надеемся, что мы перечислили вопросы интервью ETL Testing a и ответы, которые чаще всего задают на собеседованиях по тестированию ETL.
TAG: qa