SQL Server и Business Intelligence

Подкатегории

Введение в Business Intelligence

Целью этого раздела является ознакомление вас с важной областью технологии баз данных - интеллектуальными ресурсами (business intelligence, бизнес-аналитика). Сначала объясняются различия между оперативной обработкой транзакций (online transaction processing, OLTP), с одной стороны, и бизнес-аналитикой, с другой стороны. Складом данных для процесса бизнес-аналитики может быть хранилище данных (data warehouse) или киоск данных (data mart). Обсуждаются оба типа, а затем описываются их отличия.

Просмотреть материалы...

Microsoft Analysis Services

Microsoft Analysis Services является группой сервисов, которые используются для управления данными, находящимися в хранилище данных или в киоске данных. Analysis Services преобразует данные из хранилища данных в многомерные кубы с агрегатами, для того чтобы дать возможность создавать замысловатые отчеты и сложные запросы. Ключевыми особенностями Analysis Services являются: простота использования; гибкость модели данных; поддержка некоторых API. Analysis Services предоставляет мастеров для большинства задач, которые выполняются в процессе проектирования и реализации хранилища данных. Например, Data Source Wizard позволяет задавать один или более источников данных, в то время как Cube Wizard используется для создания многомерных кубов, где хранятся агрегатные данные.

Просмотреть материалы...

Business Intelligence и Transact-SQL

До версии SQL Server 2000 язык Transact-SQL не выполнял достаточно хорошо сложный анализ данных. С самого начала Transact-SQL предоставлял некоторые агрегатные функции, которые могли быть использованы для вычисления простых обобщений данных, а также предложение group by, которое позволяло выполнять элементарную группировку данных. SQL Server 2000 был первой версией SQL Server, которая предоставляла сложные возможности анализа данных, такие как оператор cube и предложение top. SQL Server 2005 значительно расширил эти возможности, введя функции упорядочения и некоторые реляционные операторы. SQL Server 2008 вводит стандартизованный синтаксис для операторов rollup и cube, а также для группировки наборов, что позволяет выполнять вычисления для групп некоторых различных наборов по столбцам группирования.

Просмотреть материалы...

Microsoft Reporting Services

В этом разделе описывается инструмент создания промышленных отчетов в SQL Server, называемый Reporting Services. В начале главы обсуждается общая структура отчета и объясняются основные компоненты Reporting Services. После этого вы увидите, как можно создавать отчеты с помощью мастера Report Server Project Wizard. Затем будет рассмотрена обработка отчета. Под конец будут показаны различные способы поставки спроектированного и развернутого отчета.

Просмотреть материалы...

Техники оптимизации для бизнес-аналитики

В этом разделе описываются две техники оптимизации, связанные с ROLAP. Иными словами, эти техники могут быть применены только по отношению к хранению многомерных данных. В начале этой главы обсуждается, когда имеет смысл хранить все экземпляры сущности в одной таблице, а когда лучшим решением с точки зрения производительности - в разделенных таблицах данных. После общего введения даются способы, которые можно использовать для разделения данных. Помимо общих правил разделения данных В этом разделе описываются улучшения в SQL Server 2008, связанные с этими техниками. Затем подробно объясняется техника оптимизации запросов, называемая схемой «звезда». Будут представлены преимущества этой техники, а также использование фильтров битовых образов.

Просмотреть материалы...
Оценить
(0 голоса)
С самого начала системы реляционных баз данных использовались в основном для хранения первичных деловых данных, таких как заказы и счета с использованием обработки, основанной на транзакциях. Такое фокусирование внимания на деловых данных имеет свои преимущества и недостатки. Одним из преимуществ является то, что низкая производительность ранних систем баз данных была резко улучшена, так что сегодня многие системы баз данных могут выполнять тысячи транзакций в секунду (при использовании подходящего оборудования). С другой стороны, фокусирование внимания на обработке транзакций мешает людям, использующим деловые базы данных, видеть другие естественные приложения систем баз данных: использование их для фильтрации и анализа необходимой информации за пределами…
Оценить
(0 голоса)
Как уже было сказано, производительность является одним из основных вопросов для систем, которые базируются на обработке транзакций. Такие системы называются системами оперативной обработки транзакций (online transaction processing, OLTP). Типичным примером операции, выполняемой системой OLTP, является получение денег с банковского счета при помощи банкомата. Системы OLTP имеют несколько важных свойств, таких как: ♦ короткие транзакции, т. е. высокая производительность; ♦ большое количество (возможно, сотни или даже тысячи) пользователей; ♦ постоянные операции чтения и записи, основанные на небольшом количестве строк; ♦ в базе данных хранятся данные небольшого размера. Производительность системы базы данных будет повышаться, если транзакции в прикладных программах базы данных будут…
Оценить
(0 голоса)
Business Intelligence (бизнес-аналитика) является процессом интеграции данных в масштабе всего предприятия на едином складе данных, к которому конечные пользователи могут выполнять специальные запросы и формировать отчеты для анализа существующих данных. Другими словами, целью бизнес-аналитики является хранение данных, к которым могут обращаться пользователи, принимающие бизнес-решения на основе анализа данных. Такие системы обычно называются аналитическими или информативными системами, потому что при обращении к этим данным пользователи получают необходимую информацию для принятия наилучших решений в области бизнеса. Цели систем бизнес-аналитики отличаются от целей систем OLTP. Следующий запрос является типичным для системы бизнес-аналитики: «Какая категория продуктов является наилучшей в плане продаж для каждого из…
Оценить
(0 голоса)
Хранилище данных может быть определено как база данных, которая включает корпоративные данные и может быть постоянно доступной пользователям. Это краткое определение; объяснение понятия хранилища данных гораздо более сложное. Предприятие обычно имеет большой объем данных, хранящихся в разное время в различных базах данных (или в файлах данных), которые управляются различными СУБД. Эти системы управления базами данных не обязательно являются реляционными: на некоторых предприятиях все еще существуют базы данных, управляемые иерархическими или сетевыми системами баз данных. Особая группа специалистов по программному обеспечению проверяет исходные базы данных (и файлы данных) и конвертирует их в целевое место сохранения: в хранилище данных. В дополнение к…
Оценить
(2 голоса)
Только хорошо спланированная и хорошо спроектированная база данных даст вам возможность достигнуть хорошей производительности. Реляционные базы данных и хранилища данных имеют множество отличий, которые требуют разных методов проектирования. Реляционные базы данных проектируются с помощью хорошо известной модели «сущность - отношение» (entity-relationship, ER), в то время как пространственная модель используется для проектирования хранилища данных и киоска данных. При использовании реляционных баз данных избыточность данных устраняется при использовании нормальных форм. Процесс нормализации разделяет каждую таблицу базы данных, которая включает избыточные данные, на две отдельные таблицы. Процесс нормализации должен быть завершен, когда все таблицы базы данных содержат только не избыточные данные. Хорошо нормализованные…
Оценить
(0 голоса)
Системы бизнес-аналитики поддерживают различные типы хранилищ данных. Некоторые из этих типов хранилищ данных основаны на многомерных базах данных, которые также называются кубами. Куб является подмножеством данных из хранилища данных, который может быть организован в многомерные структуры. Для определения куба вы, во-первых, выбираете таблицу фактов из пространственной схемы и идентифицируете числовые столбцы (измерения), которые вам интересны. Затем вы выбираете таблицы измерений, которые предоставляют описания анализируемых наборов данных. Для демонстрации этого процесса рассмотрим, как может быть определен куб для анализа продаж автомобилей. Например, таблица фактов может включать измерения Cars_sold, Total_sales и Costs, в ТО время как таблицы Models, Quarters и Regions задают…
Оценить
(0 голоса)
Данные сохраняются в таблице фактов в наиболее детализированной форме, чтобы их могли использовать соответствующие отчеты. С другой стороны (как было сказано ранее), типичный запрос к таблице фактов считывает тысячи или даже миллионы строк за один раз, и единственной полезной операцией для такого огромного количества строк является агрегатная функция (сумма, максимум, минимум или среднее значение). Такое различное использование данных может снизить производительность для запросов, если они выполняются над данными низкого уровня (атомарными данными), потому что вычисления, затрагивающие время и ресурсы, будут необходимы для выполнения каждой агрегатной функции. По этой причине данные низкого уровня в таблице фактов должны заранее суммироваться и сохраняться…
Оценить
(0 голоса)
Относительно агрегации существуют два экстремальных решения: вообще не выполнять агрегацию и выполнять агрегацию для каждой возможной комбинации запросов, необходимых пользователю. Из предыдущих обсуждений должно быть ясно, что полное отсутствие агрегации не является вопросом по причине возможных проблем с производительностью. (Хранилище данных без каких-либо агрегирующих таблиц вообще не может быть использовано в качестве производственного склада данных.) Противоположное решение также не является приемлемым по нескольким причинам: ♦ огромный объем дискового пространства, необходимый для хранения дополнительных данных; ♦ непомерно сложная поддержка агрегатных таблиц; ♦ начальная загрузка данных будет слишком долгой. Сохранение дополнительных данных, которые содержат агрегированные данные на каждом возможном уровне, занимает дополнительный…
Оценить
(0 голоса)
Системы оперативного анализа данных (online analytical processing, OLAP) обычно используют одну из следующих трех различных архитектур для хранения многомерных данных: ♦ реляционные OLAP (ROLAP); ♦ многомерные OLAP (MOLAP); ♦ гибридные OLAP (HOLAP). Обычно эти три архитектуры отличаются по тому способу, в котором они хранятся в данных на уровне листьев, и наличием предварительно рассчитанных агрегатов. (Данные на уровне листьев являются наилучшей частицей данных, которая определена в группе измерения куба. Поэтому данные на уровне листьев соответствуют данным таблицы фактов куба.) В ROLAP предварительно вычисленные данные не сохраняются. Вместо этого запросы обращаются к данным в реляционной базе данных и ее таблицам, чтобы получить…
Оценить
(0 голоса)
К данным, находящимся в хранилище данных, может осуществляться доступ с использованием трех основных техник: ♦ составление отчета; ♦ OLAP; ♦ извлечение данных. Составление отчета является наиболее простой формой доступа к данным. Отчет является лишь представлением результата запроса в табличной форме. (Составление отчетов подробно обсуждается.) В OLAP вы анализируете данные интерактивно; т. е. это позволяет вам выполнять сравнения и вычисления среди любых измерений в хранилище данных. Извлечение данных служит для исследования и анализа больших количеств данных для отыскания значимых шаблонов. Этот поиск не является единственной задачей извлечения данных: используя эту технику, вы должны быть в состоянии преобразовать существующие данные в необходимую…
«ПерваяПредыдущая12345678СледующаяПоследняя»
Навигация
© 2018 www.serversql.ru. Все права защищены.