1250462841

1250462841



z ich starzeniem się może znacząco zmniejszyć objętość wolumenu danych przechowywanych w relacji faktów, a co za tym idzie, przyspieszyć wykonywanie zapytań.

Najczęściej szczegółowe dane nie muszą być przechowywane przez okres dłuższy niż kilka lat. Dla raportów rocznych wystarczające powinny być agregaty sumujące fakty z dokładnością do tygodnia. Dla zapytań odczytujących fakty’ starsze niż 5 lat najprawdopodobniej w zupełności wystarczają podsumowania miesięczne zamiast dziennych, itd. Pomocne dla projektanta może okazać się stworzenie wykresu, na którym dla każdej funkcji (typu zapytania) znajdą się przedziały czasowe, w jakich poszczególne fakty' muszą być szczegółowe.

3.2.2.    Czy dane szczegółowe można zastąpić próbkowaniem?

Inną metodą znacznego zmniejszenia objętości relacji faktów jest zastąpienie danych szczegółowych przez reprezentatywną próbkę. Reszta danych jest przechowywana wówczas jako dzienne lub tygodniowe agregaty'. Ta technika znajduje zastosowanie przede wszystkim w przy padku magazynów danych, dla których znajomość wszystkich szczegółowych faktów jest niepotrzebna. Jeśli firma pragnie przeanalizować schematy zachowań abonentów w okresie letnim, to taka analiza może być z powodzeniem dokonana na próbce zawierającej 15% faktów opisujących rozmowy między' abonentami. Z drugiej strony, jeśli firma pragnie przeprowadzić zogniskowaną kampanię reklamową dotyczącą szczególnego segmentu rynku, próbkowanie może okazać się niewystarczające, ponieważ w próbce znajdzie się zbyt mało faktów opisujących zachowania docelowych abonentów.

3.2.3.    Wybór właściwych atrybutów

Kolejnym krokiem jest usunięcie z relacji faktów wszystkich zbędnych atrybutów. Dla każdego atrybutu należy zadać pytania: „Czy' ten atrybut wnosi jakąś nową wiedzę o fakcie?", „Czy istnieje jakieś inne miejsce, skąd można wywieść tę daną?", „Czy atrybut ma istotne znaczenie, czy' może służy do celów związanych z implementacją systemu?". Dane wywiedzione lub agregaty nie powinny być przechowywane w relacji faktów', ponieważ bardziej efektywne jest generowanie tych informacji „w locie". Wszystkie atrybuty’, które są obecne w relacji faktów tylko ze względu na specyficzne potrzeby systemu obsługi bieżącej, z którego pobrano fakty, powinny być bezwzględnie usunięte z magazynu danych.

W przypadku firmy telekomunikacyjnej atrybuty, które powinny się znaleźć w relacji faktów, to: numer inicjujący połączenie, numer docelowy, data połączenia, oraz czas trwania połączenia.

3.2.4.    Minimalizacja rozmiarów atrybutów w relacji faktów

Projektanci baz danych mają tendencję do przeszacowywania rozmiarów' atrybutów w poszczególnych relacjach. W przypadku magazynu danych zmniejszenie rozmiaru jednego atrybutu o jeden bajt może zaowocować znaczącym zmniejszeniem rozmiaru relacji, a co za tym idzie, poprawą efektywności wykonywania zapytań. Jeśli relacja faktów zawiera informacje o dwóch milionach abonentów, z których każdy dzwoni średnio dwa i pól raza dziennie (zakładamy dwuletni hory zont czasowy dla szczegółowych faktów), to w' relacji faktów zawartych jest 3.65 miliarda krotek. Zmniejszenie rozmiaru któregokolw iek z atrybutów o dziesięć bajtów’ spowoduje zmniejszenie relacji o 34 gigabajty.

3.2.5.    Wybór pomiędzy kluczami naturalnymi i sztucznymi

Klucze obce występujące w relacji faktów mogą być naturalne (każdy klucz reprezentuje jednoznaczny identyfikator obiektu w świecie rzeczyw istym), lub sztuczne (każdy klucz jest generowany' automatycznie). Kluczami naturalnymi są np. numer PESEL, data lub numer przedstawicielstwa/sklepu. Kluczami sztucznymi sąnp. identyfikator klienta (wiążący dany fakt z identyfikatorem w relacji wymiaru

7



Wyszukiwarka

Podobne podstrony:
socjologia 182 Rozdział 6. Socjologia ciała - zdrowie, choroba i starzenie się może zostać „uwolnio
pielęg chirurgiczne(3) / - d) utrzymujący się katabolizm powoduje zmniejszenie objętości wody endog
gleby202 wspomniano, odgrywa ich starzenie się oraz, według Buckmana i Bra-dy*ego, ich powierzchnia
AL270962 Księga V - Rozdział II 183 j choroba Ich jednocześnie się wzmagała, jednocześnie zmniejszał
P1120667 Zmniejszenie objętości płynów ustrojowych, które może być wywołane różnymi przyczynami, okr
P1120667 Zmniejszenie objętości płynów ustrojowych, które może być wywołane różnymi przyczynami, okr
W podeszłym wieku obserwuje się zmniejszenie objętości tkanki tłuszczowej (w szczególności podskórne
może stać się bardziej znacząca w wypadku uznania go za standard w elektronicznej wymianie dokumentó
page0073 69 energia wszechświata ani się zwiększyć, ani zmniejszyć nie może^ lecz musi być ilością s
skanuj0003 (436) , sanna się ze znaczącymi, Innymi emocjonalnie na -wie-j’ le różnych sposobów. ^ B
muzykoterapia i biblioter kukiełkami oraz wypowiadające się w ich imieniu. Dziecko może samo rozdzi
Scan0041 (3) Ponadto kwasica mleczanowa objawia się zaburzeniami funkcji ul krążenia (zmniejszenie o

więcej podobnych podstron