Dnes: 20. ledna 2018    | Registrace | Hledáme | Redakce | Info | Testy | Školení | Ocenění | Nápověda | Čtenář: nepřihlášen

Rychlé odkazy
  • Hlavní stránka
  • Seznam rubrik
  • Ankety
  • Editoriály
  • TOP 15
  • KONFERENCE 2008
  • KONFERENCE 2007
  • KONFERENCE 2006
  • KONFERENCE 2005
  • KONFERENCE 2004
  • Sborník
  • Testy
  • Virtuální školení
  • Personalizace


  • Hledáte práci?
    Hledáme redaktora - pojďte s námi tvořit Databázový svět!

    Vyhledávání

    Hledej
    na Databázovém světě!



    Rozšířené vyhledávání

    Rubriky
    Aktuality
    Bezpečnost
    Business
    Česká scéna
    Datové sklady
    Dokumentace
    Dotazovací jazyky
    Hardware
    Historie
    Komentáře
    Literatura
    Metodologie
    Nondb
    Open Source
    Poradna
    Produkty
    Případové studie
    Redakce
    Rozhovory
    Standardy
    Technologie
    Tipy - triky
    Tiskové zprávy
    Vývoj
    Vývojové nástroje
    Zajímavosti

    Co je to?
    Databázový stroj
    (Database Engine)

    Pod pojmem Database Engine (tedy pod databázovým strojem) se obvykle rozumí jádro databázového serveru a základní obslužné programy tohoto jádra (například zajišťující vzdálené připojení uživatelů). Lze tedy říci, že databázový stroj je podmnožinou databázového serveru, přičemž pod pojmem databázový server je nutné vidět vybavení (typicky softwarové) pracující nad danou databází a zajišťující veškeré činnosti (včetně všech potřebných komunikací), které nad danou databází mají být zajišťovány.

    Akce
    Dynamická Datová Centra
    - na semináři se seznámíte s komplexním řešením a koncepcí Dynamických Datových Center od Fujitsu Siemens Computers se speciálním důrazem na řešení FlexFrame.

    Textová inzerce
    IBPhoenix - Vše o InterBase a Firebirdu.

    Smějete se rádi? - Pak je pro vás Vtipník to pravé!

    Prodejce reklamy - Hledáme schopného prodejce reklamního prostoru, možnost i externí spolupráce.

    Přihlášený čtenář
    Nepřihlášený čtenář

    O portálu
    Databázový svět
    ISSN: 1213-5933

    Web je optimalizován pro rozlišení 1024x768, nicméně kromě větších rozlišení podporujeme i 800x600. Podrobnosti najdete zde.

    Chcete-li mít kdykoliv možnost zkontrolovat obsah našeho portálu, můžete využít podporu rss. Podrobnosti najdete zde.
    Dolujeme a dolujeme


    [Datové sklady] - Data. Informace. Neustále tyto pojmy kolem sebe všichni slyšíme. Možná také všichni podvědomě tušíme, že v datech je ukryto mnohem více informací, než se na první pohled zdá. Jak ale tyto informace získat, aniž by se muselo jednat o hledání jehly v kupce sena? Jednou z možností je stále oblíbenější dolování dat.



    Označení dolování dat je mnohými považováno za příliš násilný překlad anglického datamining, ve skutečnosti se ale již toto české označení vžilo do všeobecného povědomí. Obvykle je dolování dat definováno jako proces vyhledávání skrytých závislostí a upozorňování na odlišnosti. Zjednodušeným pohledem je taková definice sice pravdivá, ve skutečnosti se ale jedná o mnohem komplexnější proces.

    Pravděpodobně nejvýstižnější definici přinesl světu se svými spolupracovníky roku 1996 Usama Fayyad. Podle něj představuje dolování dat netriviální proces zjišťování platných, neznámých, potenciálně užitečných a snadno pochopitelných závislostí v datech. Při použití běžných mechanismů by hledané i vědomě nehledané informace mohly zůstat ukryty nevždy, v lepším případě by jejich získání představovalo neodpovídající časové a tedy i finanční náklady. Proto se hledají cesty, jak tento proces nejen zefektivnit, ale ve skutečnosti jej vůbec umožnit.

    A co sklady?
    Technologie dolování dat bývá poměrně často zaměňována s datovými sklady či znalostními databázemi. Datové sklady lze v procesu dolování dat považovat za jeden z mnoha ideálních zdrojů vstupních dat. Procesy transformace a čištění, kterými prošla data při plnění do datového skladu, je pro dolování dat současně výhodou i nevýhodou. Předpřipravená data již nemusí vyžadovat další čištění v rámci dolování, na druhou stranu mohou být ztraceny některé informace umožňující odhalení skutečného původu dolováním získaných informací.

    Z pohledu hierarchie využití je datový sklad podřízen produktům z oblasti dolování dat, které jej využívají. Oproti tomu jsou znalostní databáze produktům pro dolování dat nadřízeny – dolování je jen jednou z možností, které tyto databáze pro svoji činnost využívají.

    Co je základem?
    Dolování dat je někdy chybně zaměňováno za statistické metody. Skutečnost je mnohem složitější a dolování dat je mnohem komplexnější proces, než "prosté" statistické metody. Není-li tedy dolování dat možné považovat za statistiku, tak z jakého matematického základu vlastně tato technologie vychází? Dolování dat je založeno na celé řadě relativně různorodých metod a principů a právě statistika je jen jedním z těchto základů. Zjednodušeně řečeno dolování dat používá – může používat – všech metod vedoucích k vyřešení daného problému, tedy nalezení závislosti apod.

    Vzhledem k tomu, že jednotlivé metody nejsou nijak vymezeny, je možné za produkty pro dolování dat považovat i řešení využívající pro splnění požadavků z této oblasti také technologie neuronových sítí, genetických algoritmů, logiky apod. Ne všechny produkty z oblasti dolování dat využívají všech existujících metod, ničím nezvyklým ovšem není v případě požadavků ani kombinování těchto jednotlivých základních kamenů.

    Předpovídáme a hledáme…
    Dolování dat umožňuje provádět celou řadu složitých analýz. V praxi je možné se nejčastěji setkat s požadavky na klasifikaci – vyhodnocení stavu nějakého objektu našeho zájmu podle existujících informací, na předpověď – odhadnutí dalšího vývoje na základě existujících informací v kombinaci s volitelnými okolními vlivy a na odhalení závislostí a rozdílů – tedy vzájemných vazeb a výjimek neodpovídajících ostatním zpracovávaným datům. Do poslední kategorie patří také tzv. shlukové analýzy, které jsou určeny především pro nalezení podobností a jejich využití pro následné dělení zpracovávaných dat do skupin podle vybraných vlastností.

    Přehlednost nadevše
    Aby byly získané informace přehledné, je nutné používat odpovídající formy výstupu. V praxi se používají jak textové výstupy (přehledy, sestavy, tabulky …), tak i vizualizované výstupy (plošné grafy, prostorové grafy …) Použití v reálné praxi usnadňují zejména možnosti vizualizace v kombinaci s podporou snadného přechodu k podrobnějším či méně podrobným analýzám. Za ideální je možné považovat situaci, kdy lze pomocí grafického uživatelského rozhraní získat okamžitý přístup ke všem souvisejícím informací. Bez ohledu na to, ve kterém systému tvořícím podnikovou architekturu se právě nacházejí. Velmi výhodná je také možnost exportu výsledků v požadovaném tvaru k dalšímu zpracování jinými produkty.

    Praktické použití? A proč by ne!
    Dolování dat není jen teoretickou hračkou, ale přináší výsledky. Již jsme si řekli, že jednou z nejčastějších problémů řešených pomocí této technologie je hledání skrytých závislostí a výjimek. V praxi tak lze odhalit například podvody s platebními kartami (náhlý nárůst výběrů v jednom bankomatu) nebo důvody ztráty zájmu zákazníků o určitý typ zboží či služeb. Kvalita celého procesu přitom závisí na kvalitě a šířce záběru vstupních dat. Nízká kvalita dat může být způsobena mnoha okolnostmi, od chyby operátora pořizujícího data do provozního systému přes špatně definovaná pravidla jejich převodu do základny pro dolování (obvykle datového skladu) až třeba po slučování spojitých a nespojitých hodnot.

    Skryté informace představují nemalou konkurenční výhodu – pokud tedy odpovědný management přijme včasné a odpovídající rozhodnutí. Samozřejmě je možné dolování dat použít na celou řadu dalších oblastí – od včasné diagnostiky nádorových onemocnění až třeba po ověřování identity.

    Co nám to přinese? Já nevím …
    Jedním z největších problémů spojených s dolováním dat je poměrně obtížné vyčíslení přínosů. Obdobně jako v dalších analytických oblastech také v dolování dat neexistuje jednoduchá poučka o tom, že nasazení odpovídajících produktů přinese společnosti úspory v takové a takové výši.

    Na dolování dat, datové sklady, znalostní databáze a na podobné technologie je nutné se dívat jako na něco, co může vést k úsporám a novým příjmům. Existující návody na předběžné vyčíslení navíc nelze zobecnit, vždy se vztahují minimálně ke konkrétnímu segmentu trhu, na kterém zájemce o dolování působí. Je to obdobné, jako u řízení auta s čistým a špinavým předním sklem. V prvním případě máme šanci, že včas uvidíme před námi brzdící automobil. Ve druhém případě – kdo ví? A zcela jistě nikdy většina řidičů vůli špinavému sklu nebourala. Ale jak by to asi dopadlo, kdyby jezdili všichni z přespříliš špinavým sklem? Jinými slovy – přinos je reálně předem nevyčíslitelný a je tedy možné jej ohodnotit pouze zpětně.

    Obrovská data
    Proces dolování dat obvykle zpracovává značné množství dat. Zde se skýtá další nebezpečí pro potenciální zájemce o dolování. Při realizaci prototypových projektů jsou obvykle zpracovávány data představující zlomek požadovaných dat. Při reálném nasazení pak může dojít k prudkému poklesu výkonu. Ihned po zavedení daného řešení, nikoli tedy postupně jako v případě klasických produkčních systémů, které zpracovávají stále větší a větší objem dat. S touto okolností je nutné počítat od samého počátku celého snažení o zvedení technologie dolování dat. V opačném případě se může stát, že zvolené řešení se v reálné praxi ukáže zcela nepoužitelné. Nikoli jen z hlediska funkčního, ale také po výkonové stránce.

    Omyly jsou věčné
    Stejně jako v případě libovolné technologie, také v souvislosti s dolováním dat existuje celá řada omylů a falešných představ. Mezi nejrozšířenější patří přesvědčení, že produkty z této oblasti jsou značně drahé a velmi složité.V konečném důsledku tedy použitelné jen pro finančně silné společnosti, případně pro vědecké účely na akademické půdě. Skutečnost je ale mnohem optimističtější.

    Dolování dat je dnes k dispozici prakticky pro každou společnost, která si uvědomuje, že v datech může být uschováno pro ni značné množství důležitých informací. Cenově se tyto produkty pohybují na přijatelné hladině odpovídající ostatním produktům určeným primárně pro podnikovou sféru. Díky konkurenci přitom existují různé varianty lišící se vedle množství funkcí také cenou – v případě zájmu tak je z čeho vybírat.

    Problematičtější je situace v případě často zmiňované složitosti. Současné produkty zjednodušují mnohé a nabízejí i předpřipravené scénáře. V případě hlubších analýz je ovšem nutná také určitá znalost toho, co nás vlastně zajímá. Jinak budou výsledky představovat opět jen pouhá data, nikoli informace.

    Důvěřuj, ale prověřuj!
    Vzhledem k tomu, že technologie dolování dat jsou závislé na kvalitě řešení použitého k samotnému procesu dolování, je nezbytně nutné nebrat závěry počítačového zpracování jako neměnné dogma. Například odhalené závislosti upozorňující na zvýšený prodej cigaret v malém okresním městě s nejvyšším republikovým nárůstem počtu těhotných žen ještě nemusí znamenat, že zrovna zde nastávající maminky začaly v hromadném měřítku kouřit. Skutečnost může být jiná – důvodem může být například zvýšení počtu dočasně ubytovaných studentů na brigádě. Jde o to, že bez podchycení všech možných souvisejících vlivů mohou být nabídnuté závěry chybné a proto musí zafungovat kontrolní lidský faktor. Pochopitelně v případě nutností podpořený dalšími analýzami či zkoumáním. S trochou nadsázky by tedy nemělo docházet k tomu, že výsledek 1+1 = 4 nepřekvapí.

    Dolování dat není vše řešící technologií. Ve skutečnosti představuje jen další krůček k dokonalejšímu a efektivnějšímu využití existujících dat, k možnosti získání nových informací a znalostí. Dolování dat již překonalo své dětské nemoci a v současné době představuje technologii, která dokáže mnohé – ještě jednou ale připomínáme, že zdaleka ne vše. Stejně jako za nás textový editor nenaprogramuje poštovního klienta, produkt z oblasti dolování dat není použitelný například na provoz operativní části ekonomického systému. Dolovat data, nebo přesněji informace z dat, ovšem umí naprosto dokonale. Ale my na druhou stranu musíme vědět, co chceme získat.

    ( Celý článek! | Autor: Marek Kocan | Počet komentářů: 1 | Přidat komentář | Informační e-mailVytisknout článek )

    Vyhledávání
     

    Anketa
    Kolik ročně utratíte za dovolené?

    Nic 
     (1552 hl.)
    Do 1 000,- Kč 
     (1071 hl.)
    Do 10 000,- Kč 
     (1001 hl.)
    Do 25 000,- Kč 
     (1381 hl.)
    Do 50 000,- Kč 
     (1018 hl.)
    Do 75 000,- Kč 
     (1182 hl.)
    Více než 75 000,- Kč 
     (1021 hl.)

    Celkem hlasovalo: 8226


    Poslední komentáře
    frontierd@126.com
    frontierd@126.com
    frontierd@126.com
    c
    http://www.coachoutl

    Newsletter
    Přihlaste si nezávazně - i bez registrace - odběr informačního newsletteru. Podrobné informace najdete zde.

    Emailová adresa:


    Kalendář
    <<  Leden  >>
    PoÚtStČtSoNe
    1234567
    891011121314
    15161718192021
    22232425262728
    293031    

    Redakci připojuje


    Nejčtenější

    Databáze je prázdná!


    Nejvíce komentářů

    Databáze je prázdná!


    Reklama






    Nenechte si ujít články na dalších webech




    Na této stránce použité názvy programových produktů, firem apod. mohou být ochrannými známkami
    nebo registrovanými ochrannými známkami příslušných vlastníků.

    Databázový svět | dfKlub - digitální fotografie | Vtipník - vtipy přímo k Vám | Reminder - přestaňte zapomínat | Databázový svět

    Copyright (c) 2004 AVRE Publishing, spol. s r.o. Všechna práva vyhrazena