Введение в Business Intelligence

Целью этого раздела является ознакомление вас с важной областью технологии баз данных - интеллектуальными ресурсами (business intelligence, бизнес-аналитика). Сначала объясняются различия между оперативной обработкой транзакций (online transaction processing, OLTP), с одной стороны, и бизнес-аналитикой, с другой стороны. Складом данных для процесса бизнес-аналитики может быть хранилище данных (data warehouse) или киоск данных (data mart). Обсуждаются оба типа, а затем описываются их отличия.

Оценить
(0 голоса)
С самого начала системы реляционных баз данных использовались в основном для хранения первичных деловых данных, таких как заказы и счета с использованием обработки, основанной на транзакциях. Такое фокусирование внимания на деловых данных имеет свои преимущества и недостатки. Одним из преимуществ является то, что низкая производительность ранних систем баз данных была резко улучшена, так что сегодня многие системы баз данных могут выполнять тысячи транзакций в секунду (при использовании подходящего оборудования). С другой стороны, фокусирование внимания на обработке транзакций мешает людям, использующим деловые базы данных, видеть другие естественные приложения систем баз данных: использование их для фильтрации и анализа необходимой информации за пределами…
Оценить
(0 голоса)
Как уже было сказано, производительность является одним из основных вопросов для систем, которые базируются на обработке транзакций. Такие системы называются системами оперативной обработки транзакций (online transaction processing, OLTP). Типичным примером операции, выполняемой системой OLTP, является получение денег с банковского счета при помощи банкомата. Системы OLTP имеют несколько важных свойств, таких как: ♦ короткие транзакции, т. е. высокая производительность; ♦ большое количество (возможно, сотни или даже тысячи) пользователей; ♦ постоянные операции чтения и записи, основанные на небольшом количестве строк; ♦ в базе данных хранятся данные небольшого размера. Производительность системы базы данных будет повышаться, если транзакции в прикладных программах базы данных будут…
Оценить
(0 голоса)
Business Intelligence (бизнес-аналитика) является процессом интеграции данных в масштабе всего предприятия на едином складе данных, к которому конечные пользователи могут выполнять специальные запросы и формировать отчеты для анализа существующих данных. Другими словами, целью бизнес-аналитики является хранение данных, к которым могут обращаться пользователи, принимающие бизнес-решения на основе анализа данных. Такие системы обычно называются аналитическими или информативными системами, потому что при обращении к этим данным пользователи получают необходимую информацию для принятия наилучших решений в области бизнеса. Цели систем бизнес-аналитики отличаются от целей систем OLTP. Следующий запрос является типичным для системы бизнес-аналитики: «Какая категория продуктов является наилучшей в плане продаж для каждого из…
Оценить
(0 голоса)
Хранилище данных может быть определено как база данных, которая включает корпоративные данные и может быть постоянно доступной пользователям. Это краткое определение; объяснение понятия хранилища данных гораздо более сложное. Предприятие обычно имеет большой объем данных, хранящихся в разное время в различных базах данных (или в файлах данных), которые управляются различными СУБД. Эти системы управления базами данных не обязательно являются реляционными: на некоторых предприятиях все еще существуют базы данных, управляемые иерархическими или сетевыми системами баз данных. Особая группа специалистов по программному обеспечению проверяет исходные базы данных (и файлы данных) и конвертирует их в целевое место сохранения: в хранилище данных. В дополнение к…
Оценить
(2 голоса)
Только хорошо спланированная и хорошо спроектированная база данных даст вам возможность достигнуть хорошей производительности. Реляционные базы данных и хранилища данных имеют множество отличий, которые требуют разных методов проектирования. Реляционные базы данных проектируются с помощью хорошо известной модели «сущность - отношение» (entity-relationship, ER), в то время как пространственная модель используется для проектирования хранилища данных и киоска данных. При использовании реляционных баз данных избыточность данных устраняется при использовании нормальных форм. Процесс нормализации разделяет каждую таблицу базы данных, которая включает избыточные данные, на две отдельные таблицы. Процесс нормализации должен быть завершен, когда все таблицы базы данных содержат только не избыточные данные. Хорошо нормализованные…
Оценить
(0 голоса)
Системы бизнес-аналитики поддерживают различные типы хранилищ данных. Некоторые из этих типов хранилищ данных основаны на многомерных базах данных, которые также называются кубами. Куб является подмножеством данных из хранилища данных, который может быть организован в многомерные структуры. Для определения куба вы, во-первых, выбираете таблицу фактов из пространственной схемы и идентифицируете числовые столбцы (измерения), которые вам интересны. Затем вы выбираете таблицы измерений, которые предоставляют описания анализируемых наборов данных. Для демонстрации этого процесса рассмотрим, как может быть определен куб для анализа продаж автомобилей. Например, таблица фактов может включать измерения Cars_sold, Total_sales и Costs, в ТО время как таблицы Models, Quarters и Regions задают…
Оценить
(0 голоса)
Данные сохраняются в таблице фактов в наиболее детализированной форме, чтобы их могли использовать соответствующие отчеты. С другой стороны (как было сказано ранее), типичный запрос к таблице фактов считывает тысячи или даже миллионы строк за один раз, и единственной полезной операцией для такого огромного количества строк является агрегатная функция (сумма, максимум, минимум или среднее значение). Такое различное использование данных может снизить производительность для запросов, если они выполняются над данными низкого уровня (атомарными данными), потому что вычисления, затрагивающие время и ресурсы, будут необходимы для выполнения каждой агрегатной функции. По этой причине данные низкого уровня в таблице фактов должны заранее суммироваться и сохраняться…
Оценить
(0 голоса)
Относительно агрегации существуют два экстремальных решения: вообще не выполнять агрегацию и выполнять агрегацию для каждой возможной комбинации запросов, необходимых пользователю. Из предыдущих обсуждений должно быть ясно, что полное отсутствие агрегации не является вопросом по причине возможных проблем с производительностью. (Хранилище данных без каких-либо агрегирующих таблиц вообще не может быть использовано в качестве производственного склада данных.) Противоположное решение также не является приемлемым по нескольким причинам: ♦ огромный объем дискового пространства, необходимый для хранения дополнительных данных; ♦ непомерно сложная поддержка агрегатных таблиц; ♦ начальная загрузка данных будет слишком долгой. Сохранение дополнительных данных, которые содержат агрегированные данные на каждом возможном уровне, занимает дополнительный…
Оценить
(0 голоса)
Системы оперативного анализа данных (online analytical processing, OLAP) обычно используют одну из следующих трех различных архитектур для хранения многомерных данных: ♦ реляционные OLAP (ROLAP); ♦ многомерные OLAP (MOLAP); ♦ гибридные OLAP (HOLAP). Обычно эти три архитектуры отличаются по тому способу, в котором они хранятся в данных на уровне листьев, и наличием предварительно рассчитанных агрегатов. (Данные на уровне листьев являются наилучшей частицей данных, которая определена в группе измерения куба. Поэтому данные на уровне листьев соответствуют данным таблицы фактов куба.) В ROLAP предварительно вычисленные данные не сохраняются. Вместо этого запросы обращаются к данным в реляционной базе данных и ее таблицам, чтобы получить…
Оценить
(0 голоса)
К данным, находящимся в хранилище данных, может осуществляться доступ с использованием трех основных техник: ♦ составление отчета; ♦ OLAP; ♦ извлечение данных. Составление отчета является наиболее простой формой доступа к данным. Отчет является лишь представлением результата запроса в табличной форме. (Составление отчетов подробно обсуждается.) В OLAP вы анализируете данные интерактивно; т. е. это позволяет вам выполнять сравнения и вычисления среди любых измерений в хранилище данных. Извлечение данных служит для исследования и анализа больших количеств данных для отыскания значимых шаблонов. Этот поиск не является единственной задачей извлечения данных: используя эту технику, вы должны быть в состоянии преобразовать существующие данные в необходимую…
«ПерваяПредыдущая12СледующаяПоследняя»
Навигация
© 2018 www.serversql.ru. Все права защищены.