Danuta Mendrala, Marcin Szeliga serwer sql 2008. usługi biznesowe. analiza i eksploracja danych full version.pdf

(22990 KB) Pobierz
887606388.004.png
4
Serwer SQL 2008. Usługi biznesowe
Rozdział 3. Tworzenie baz analitycznych ........................................................... 61
Założenia analitycznych baz danych .............................................................................. 61
Projekt najprostszej analitycznej bazy danych ......................................................... 62
Źródła danych i ich widoki ............................................................................................. 65
Źródła danych ........................................................................................................... 66
Widoki źródeł danych .............................................................................................. 68
Wymiary ......................................................................................................................... 72
Kreator wymiarów .................................................................................................... 72
Edytor wymiarów ..................................................................................................... 74
Atrybuty ................................................................................................................... 81
Hierarchie ................................................................................................................. 85
Zapis zwrotny ........................................................................................................... 96
Fizyczna struktura wymiarów .................................................................................. 97
Kostki analityczne .......................................................................................................... 99
Kreator kostek analitycznych ................................................................................... 99
Edytor kostek analitycznych ................................................................................... 100
Fizyczna struktura kostki ........................................................................................ 109
Zapis zwrotny ......................................................................................................... 114
Projektowanie agregacji ............................................................................................... 116
Kreator agregacji .................................................................................................... 116
Przypisywanie zaprojektowanych agregacji ........................................................... 118
Samodzielne projektowanie agregacji .................................................................... 118
Kompilacja projektów .................................................................................................. 119
Techniki dystrybucji ..................................................................................................... 120
Business Intelligence Development Studio ............................................................ 121
Analysis Services Deployment Wizard .................................................................. 122
Skrypty XMLA ...................................................................................................... 124
Rozdział 4. Wprowadzenie do języka MDX ...................................................... 125
Konwencje .................................................................................................................... 125
Krotki ..................................................................................................................... 126
Wyrażenia MDX .......................................................................................................... 127
Operatory ............................................................................................................... 127
Funkcje ................................................................................................................... 128
Zapytania MDX ............................................................................................................ 133
Kreator zapytań ...................................................................................................... 133
Składnia instrukcji SELECT .................................................................................. 135
Zbiory ..................................................................................................................... 137
Wykonywanie instrukcji MDX przez serwer SSAS ..................................................... 142
Rozdział 5. Dodatkowe funkcje kostek analitycznych ...................................... 145
Wartości wyliczeniowe ................................................................................................. 145
Tworzenie wartości wyliczeniowych ..................................................................... 146
Zalecenia ................................................................................................................ 152
Zbiory nazwane ............................................................................................................ 152
Nazywanie zbiorów krotek ..................................................................................... 152
Statyczne i dynamiczne zbiory nazwane ................................................................ 153
Zalecenia ................................................................................................................ 155
Skrypty MDX ............................................................................................................... 155
Modyfikowanie fragmentów kostki analitycznej .................................................... 155
Zalecenia ................................................................................................................ 159
Kluczowe wskaźniki efektywności ............................................................................... 159
Elementy kluczowych wskaźników efektywności .................................................. 159
Przeglądanie kluczowych wskaźników efektywności ............................................ 163
Zalecenia ................................................................................................................ 164
Spis treści
5
Akcje ............................................................................................................................ 164
Typy akcji .............................................................................................................. 165
Zalecenia ................................................................................................................ 168
Procedury składowane .................................................................................................. 168
Rejestrowanie zewnętrznych bibliotek ................................................................... 169
Wywoływanie procedur składowanych .................................................................. 170
Zalecenia ................................................................................................................ 171
Rozdział 6. Administracja serwerem SSAS 2008 ............................................. 173
Oszacowanie wymagań serwera SSAS 2008 ................................................................ 173
Pamięć i procesor ................................................................................................... 174
Dysk twardy ........................................................................................................... 175
Aktualizowanie projektów baz analitycznych .............................................................. 177
Synchronizacja analitycznych baz danych .................................................................... 177
Przetwarzanie kostek i wymiarów ................................................................................ 179
Tworzenie i odtwarzanie kopii zapasowych ................................................................. 185
Bezpieczeństwo ............................................................................................................ 189
Role ........................................................................................................................ 189
Uprawnienia ........................................................................................................... 190
Zalecenia ................................................................................................................ 195
Monitorowanie pracy serwera ...................................................................................... 196
Dzienniki ................................................................................................................ 197
Monitor wydajności ................................................................................................ 197
SQL Server Profiler ................................................................................................ 201
Widoki dynamiczne ................................................................................................ 203
Optymalizacja wydajności ............................................................................................ 204
Optymalizacja agregacji ......................................................................................... 204
Aktywny mechanizm buforowania ......................................................................... 207
Skalowalność i dostępność ........................................................................................... 209
Równoważenie obciążania ..................................................................................... 209
Współdzielone bazy analityczne ............................................................................ 211
Automatyzacja zadań administracyjnych ..................................................................... 212
Skrypty XMLA ...................................................................................................... 212
Zadania usługi SQL Server Agent .......................................................................... 213
Pakiety SSIS ........................................................................................................... 215
Rozdział 7. Excel 2007 jako klient baz analitycznych ...................................... 217
Biznesowa analiza danych ............................................................................................ 217
Analiza danych przy użyciu programu Excel 2007 ...................................................... 218
Zewnętrzne źródła danych ...................................................................................... 219
Tabele przestawne .................................................................................................. 221
Wykresy przestawne .............................................................................................. 229
Formuły kostek analitycznych ................................................................................ 232
Usługi programu Excel ........................................................................................... 237
Część II Eksploracja danych ....................................................... 239
Rozdział 8. Techniki eksploracji danych .......................................................... 241
Scenariusze biznesowe ................................................................................................. 241
Eksploracja danych jako część analizy biznesowej ................................................ 242
Proces eksploracji danych ............................................................................................ 243
Zastosowania eksploracji danych ................................................................................. 246
Klasyfikacja ............................................................................................................ 246
Regresja .................................................................................................................. 250
Segmentacja ........................................................................................................... 252
Asocjacja ................................................................................................................ 255
6
Serwer SQL 2008. Usługi biznesowe
Analiza sekwencyjna .............................................................................................. 258
Prognozowanie ....................................................................................................... 260
Serwer SQL 2008 ......................................................................................................... 262
Integracja z usługami Business Intelligence ........................................................... 262
Rozdział 9. Tworzenie projektów eksploracji danych ........................................ 265
Struktury eksploracji danych ........................................................................................ 265
Dane źródłowe ....................................................................................................... 266
Dane treningowe (przypadki) ................................................................................. 268
Przetwarzanie struktur eksploracji danych ............................................................. 274
Tworzenie struktur eksploracji danych w języku DMX ......................................... 275
Modele eksploracji danych ........................................................................................... 279
Algorytmy .............................................................................................................. 279
Dane treningowe .................................................................................................... 288
Tworzenie modeli eksploracji danych w języku DMX .......................................... 291
Trening modeli ....................................................................................................... 293
Ocena ............................................................................................................................ 296
Wykresy podniesienia i zysku ................................................................................ 296
Macierz klasyfikacji ............................................................................................... 298
Walidacja krzyżowa ............................................................................................... 299
Odczytywanie wyników ............................................................................................... 302
Wizualizatory i odczytywanie dodatkowych danych ............................................. 302
Zapytania predykcyjne ........................................................................................... 305
Rozdział 10. Dodatek Data Mining dla pakietu Office 2007 ...................................... 309
Przygotowanie danych ................................................................................................... 310
Analiza danych ....................................................................................................... 311
Oczyszczanie danych ............................................................................................. 312
Podział danych ....................................................................................................... 314
Eksploracja danych tabelarycznych .............................................................................. 315
Analiza kluczowych czynników ............................................................................. 315
Kategoryzacja ......................................................................................................... 318
Uzupełnianie na podstawie przykładu .................................................................... 321
Przewidywanie ....................................................................................................... 322
Wykrywanie anomalii ............................................................................................ 324
Osiąganie celu ........................................................................................................ 326
Analiza typu „Co będzie, jeśli?” ............................................................................ 327
Ocena nowych przypadków ................................................................................... 329
Analiza koszyka zakupów ...................................................................................... 331
Eksploracja zewnętrznych danych ................................................................................ 333
Tworzenie, przeglądanie i zarządzanie modelami .................................................. 334
Przewidywanie ....................................................................................................... 335
Okresowość ............................................................................................................ 338
Predykcje krzyżowe ............................................................................................... 339
Ocena ............................................................................................................................ 341
Skorowidz ............................................................................................. 343
Rozdział 8. Techniki eksploracji danych
241
Rozdział 8.
Techniki
eksploracji danych
Eksplorację danych definiuje się jako szeroką kategorię aplikacji i technologii do zbiera-
nia, przechowywania, analizowania i współużytkowania danych oraz zapewniania do-
stępu do nich w celu umożliwienia użytkownikom podejmowania lepszych decyzji bizneso-
wych . Wspomniane w tej definicji technologie korzystają z klasycznych metod statystyki
i probabilistyki w celu zautomatyzowania analizy przechowywanych w bazach (za-
równo relacyjnych, jak i analitycznych) dużych ilości informacji. Większość używanych
w procesie eksploracji danych algorytmów jest dość nowa, ale ich skuteczność została
już potwierdzona, zarówno teoretycznie (poprzez badania nad teorią baz danych), jak
i praktycznie (instytucje finansowe oraz duże korporacje od wielu lat wykorzystują
mniej lub bardziej zautomatyzowane techniki eksploracji danych).
Wyniki eksploracji danych, przede wszystkim predykcji (przewidywania zaistnienia
pewnych zdarzeń lub zmian określonych wartości), zależą od jakości danych źródło-
wych. Jeżeli sytuacja ekonomiczna ulegnie radykalnej zmianie (jak to miało miejsce
podczas rozpoczynającego się w czasie powstawania książki kryzysu gospodarczego),
otrzymane na podstawie nieaktualnych danych wyniki będą niewiarygodne. Dlatego
przeprowadzane w takich okresach prognozy (np. przyszłych cen ropy czy wzrostu pro-
duktu krajowego brutto) są dość przypadkowe. Po ustabilizowaniu się sytuacji i zebra-
niu wystarczającej ilości nowych, właściwie opisujących ją danych techniki eksploracji
danych będą mogły ponownie dostarczać wartościowych i precyzyjnych wyników.
Scenariusze biznesowe
Współcześnie firmy dysponują dużymi zbiorami danych, ale mają coraz większy problem
z ich praktycznym wykorzystaniem. Zbyt dużo danych utrudnia ich analizę i skutkuje
zmniejszeniem się ilości przydatnych informacji . Techniki eksploracji danych rozwią-
zują ten problem, umożliwiając między innymi:
887606388.005.png 887606388.006.png 887606388.007.png 887606388.001.png 887606388.002.png 887606388.003.png
 
Zgłoś jeśli naruszono regulamin