Dnes: 18. února 2018    | Registrace | Hledáme | Redakce | Info | Testy | Školení | Ocenění | Nápověda | Čtenář: nepřihlášen

Rychlé odkazy
  • Hlavní stránka
  • Seznam rubrik
  • Ankety
  • Editoriály
  • TOP 15
  • KONFERENCE 2008
  • KONFERENCE 2007
  • KONFERENCE 2006
  • KONFERENCE 2005
  • KONFERENCE 2004
  • Sborník
  • Testy
  • Virtuální školení
  • Personalizace


  • Hledáte práci?
    Hledáme redaktora - pojďte s námi tvořit Databázový svět!

    Vyhledávání

    Hledej
    na Databázovém světě!



    Rozšířené vyhledávání

    Rubriky
    Aktuality
    Bezpečnost
    Business
    Česká scéna
    Datové sklady
    Dokumentace
    Dotazovací jazyky
    Hardware
    Historie
    Komentáře
    Literatura
    Metodologie
    Nondb
    Open Source
    Poradna
    Produkty
    Případové studie
    Redakce
    Rozhovory
    Standardy
    Technologie
    Tipy - triky
    Tiskové zprávy
    Vývoj
    Vývojové nástroje
    Zajímavosti

    Co je to?
    Datový sklad
    Tento pojem poprvé formuloval koncem 80. let William Inmon jako strategii přístupu k datům určeným pro rozsáhlé analýzy. V případě datového skladu hovoříme o historických, časově rozlišených, agregovaných, průběžně rozšiřovaných datech uspořádaných pro podporu potřeb managementu.

    Akce
    Dynamická Datová Centra
    - na semináři se seznámíte s komplexním řešením a koncepcí Dynamických Datových Center od Fujitsu Siemens Computers se speciálním důrazem na řešení FlexFrame.

    Textová inzerce
    IBPhoenix - Vše o InterBase a Firebirdu.

    Smějete se rádi? - Pak je pro vás Vtipník to pravé!

    Prodejce reklamy - Hledáme schopného prodejce reklamního prostoru, možnost i externí spolupráce.

    Přihlášený čtenář
    Nepřihlášený čtenář

    O portálu
    Databázový svět
    ISSN: 1213-5933

    Web je optimalizován pro rozlišení 1024x768, nicméně kromě větších rozlišení podporujeme i 800x600. Podrobnosti najdete zde.

    Chcete-li mít kdykoliv možnost zkontrolovat obsah našeho portálu, můžete využít podporu rss. Podrobnosti najdete zde.
    Databázový marketing V.


    [Business] - Štatistické nástroje data miningu: pri používaní štatistických nástrojov data miningu (ale aj pri budovaní dátových skladov), je vidieť prepojenie technológie s biznisom, čo sa stalo vlastne potvrdením mnohých prognóz marketingových analytikov.



    Pri spracovaní dát v databázach používame tieto štatistické prístupy na abstrahovanie relevantných znalostí.

    Zhluková analýza
    Zhluková analýza je technika redukcie údajov, ktorá zoskupuje buď premenné alebo prípady založené na podobných charakteristikách. Vďaka týmto vlastnostiam je užitočná pre nájdenie zákazníckych segmentov založených na spoločných charakteristikách ako sú demografické a finančné informácie alebo spôsoby nákupu.

    Analýza faktorov
    Táto technika je užitočná pri hľadaní dôležitých základných charakteristík, ktoré nemusia byť viditeľné, ale ktoré môžu byť nájdené ako skryté premenné. Oproti zhlukovej analýze, vytvára analýza faktorov modely z údajov.

    Rozhodovacie stromy
    Na základe rozhodovacích stromov (decision trees, answer trees) dokážeme zákazníkov zaradiť do skupín a odhadnúť pravdepodobnosť nákupu určitých produktov.

    Hlavné výhody rozhodovacích stromov sú: zrozumiteľnosť výstupov (oproti napríklad neurónovým sieťam), jednoduché použitie a nácvik, pomerne málo predpokladov (napríklad oproti regresii), praktickosť výstupov (je možné hneď vypočítať očakávanú úspešnosť, očakávaný zisk, návratnosť investícií…), rýchlosť nasadenia (niekedy môže poskytnúť dostatočne kvalitné informácie bez potreby budovať komplikované štatistické modely) a pružnosť (model je dosť zložitý a vhodným nastavením parametrov je možné ho prispôsobiť požiadavkám zákazníka).

    Neurónové siete
    Využitie neurónových sietí (neural networks) má najväčšie uplatnenie vo fyzike a v technických odvetviach, ale ich výhody prenikajú už aj do ekonomiky.

    Výhodou neurónových sietí je, že nie je potrebné mať na mysli nejaký špeciálny model, keď sa spúšťa analýza. Neurónové siete môžu tiež nájsť interakčné efekty (napríklad efekty z kombinácie veku a pohlavia), ktoré musia byť explicitne vyjadrené v regresii. Nevýhodou je ťažšia interpretácia výsledného modelu, preto ich použitie je užitočnejšie na predpovedanie cieľovej premennej, keď sú údaje nelineárne, ale nie sú veľmi užitočné, keď tieto vzťahy údajov je potrebné vysvetliť

    Systém STATISTIKA DataMiner predstavuje veľmi progresívnu aplikáciu neurónových sietí dostupných na trhu. Obsahuje General Neural Networks Explorer.

    Asociačná analýza
    Pomocou asociačných modelov hľadáme pravidlá o prvkoch, ktoré patria k sebe v nejakom prípade, ako sú napríklad nákupné transakcie. Pravidlá nachádzajú veci, ktoré „patria k sebe“, čo je iné ako keď sú predpovedané. Tieto modely sú často označované ako Market Basket analýza, ak sú aplikované v obchodnom priemysle na skúmanie nákupných schém zákazníkov.

    Vizualizácia údajov
    Využívajú počítačovú grafiku na zobrazovanie údajov v diagramoch, ktoré sú prevedené do ľahko prístupného jazyka ako sú obrázky a sú ľahšie vnímateľné.

    Pravidlová indukcia
    Je to technika pre objavovanie skupín "Ak/Potom" pravidiel z údajov pre klasifikovanie rôznych prípadov. Táto technika je výkonná, pretože hľadá dôležité schémy v skupinách údajov, na druhej strane však nemusí pokrývať všetky možné situácie, keďže pravidlá sú nezávislé a často si môžu navzájom odporovať.

    Kurt Thearling, jeden z významných odborníkov v oblasti softvérového data miningu, označuje zhlukovacie analýzy a im podobné nástroje za klasické techniky a rozhodovacie stromy a neurónové siete za novú technologickú generáciu.

    Okrem vyššie popísaných techník na ťažbu dát, rozoznávame ešte techniky modelovania vychádzajúce z teórie, ako sú korelácie, lineárna a logistická regresia, diskriminantná analýza, metódy predpovedania a pod.

    Najznámejší a najkvalitnejší produkt v oblasti ťažby dát je SAS Enterprise Miner ktorý vyvinula spoločnosť SAS Institute. Poskytuje účinnú metodickú pomôcku, tzv. SEMMA (Sample – vzorkovanie, Explore – skúmanie, Modify – modifikovanie, Model – modelovanie a Assess – vyhodnocovanie), teda umožňuje bez hlbokých teoretických znalostí vytvárať v grafickom prostredí predikatívne modely ako sú regresia, neurónové siete a rozhodovacie stromy a tiež zhlukové analýzy, asociácie a sekvencie. Je tiež bez ťažkostí integrovateľný s prostredím data warehouse a data martov.

    Z ostatných významných produktov je to napríklad SGI od Silicon Graphics, ktorý sa vyznačuje silnými vizualizačnými nástrojmi. Ponúka pokročilú 4D vizualizáciu – 3D grafy sa môžu meniť podľa dvoch ďalších premenných dimenzií.

    Intelligent Miner od IBM je zasa vyvážený produkt poskytujúci rôzne techniky, ktoré sú integrované do jedného modelu. Nastavenie parametrov je jednoduché, používateľ je navigovaný pomocou wizardov. Ponúka najlepší clustering, t.j. zhlukovanie.

    Komplexná metodológia dolovania údajov, ktorá vo svojom návode vedie začiatočníkov krok za krokom, CRISP-DM (CRoss-Industry Standard Process for Data Mining) je prístupná na adrese .

    Účelom data miningu nie je len systematicky nazhromaždiť obrovské množstvo neustále pribúdajúcich dát, ale mali by sme vedieť tieto informácie zhrnúť a prezentovať tak, aby boli využiteľné. Nachádzaním skrytých štruktúr a dôležitých informácií ktoré sú v nich obsiahnuté, vieme potom lepšie určovať marketingové stratégie. Môžeme zistiť, ktorí zákazníci:

    • sú pripravení akceptovať ponuku modifikovaného produktu
    • sú ochotní kúpiť ostatné produkty firmy
    • majú pre firmu najväčšiu hodnotu a je im potrebné venovať viac pozornosti a starostlivosti
    • majú tendenciu od firmy odísť a akými opatreniami tomu môžeme zabrániť

    Data mining je súčasťou technológií pre podporu rozhodovania. Samotné rozhodovanie však musí urobiť príslušný zodpovedný pracovník. K tomuto rozhodovaniu potrebuje vstupy, ktoré prichádzajú aj z aplikácie data miningu. Úloha manažmentu je teda nezastupiteľná, spočíva v definovaní vízie, podnikateľských hypotéz, v určovaní kvantifikovateľných cieľov a v rozhodovaní v procese realizácie.

    Proces ťažby dát tak zahŕňa postupy od formulovania aplikačnej otázky až po implementáciu a rozšírenie výsledkov do praxe organizácie. Proces však nemusí končiť, pretože meniace sa prostredie vyžaduje údržbu databáz, preverovanie modelov a pri postupnej ďalšej kumulácií dát prípadné upresňovanie modelov.

    Je dôležité presne porozumieť možnostiam obchodného uplatnenia výsledkov data miningu, aby nevznikli problémy s malou podporou obchodne zodpovedných manažérov ("Našich zákazníkov poznáme"), čo sa následne môže odraziť v nedôslednom doťahovaní zistených výsledkov do úrovne obchodných procesov.

    Pozitívnou prognózou je predpoklad širšieho používania nástrojov na ťažbu dát aj novými užívateľmi a rast povedomia o týchto nástrojoch vo všeobecne dostupných článkoch a v odborných publikáciách.

    Pre firmy, ktoré už investovali mnohomiliónové čiastky do vybudovania dátových skladov, je data mining nutnosťou, pretože je jedným zo spôsobov, ako zhodnotiť vložené prostriedky. Ťažba dát môže byť prínosom aj pre firmy, ktoré zatiaľ dátové sklady nemajú. Bude však ťažšia, keďže pre ne bude náročnejšia fáza získavania dát.

    Funkčné a stabilné prostredie dátového skladu nielen značne uľahčuje problémy so získavaním dát a kvalitou dátových zdrojov, ale čím sa stanú dátové sklady väčšie a tým vznikne naliehavejšia potreba využívania data miningu, pozornosť sa snáď zameria aj na zlepšenie v kvalite dát.

    Obdobou data miningu je text mining a web mining.

    Pomocou text miningu získavame dôležité informácie z textových dokumentov, konkrétne z neštruktúrovaného textu. Keďže získané informácie sa prejavujú tiež vo forme znalostí, môžeme ho označiť ako text data mining.

    Web mining znamená získavanie a analýzu použiteľných informácií z web stránok. Stáva sa cenným nástrojom pri sledovaní zákazníkov pohybujúcich sa na našich web stránkach, všímame si ich meniace sa záujmy a očakávania, aj prostredníctvom analýzy preklikávacích sekvencií (clickstream údaje) a na základe týchto informácií zlepšujeme obsah a celkovú úpravu webovej stránky.

    Web data mining rozdeľujeme na obsahový, ktorý v sebe zahŕňa automatické prehľadávanie a získavanie informácií z internetových serverov a online databáz a na prístupový, kedy získavame a analyzujeme prístupy k týmto informáciám pomocou záznamov o prístupe k serveru, referenčných záujmoch, registrácii užívateľov alebo profilových informácií.

    Související články:
    Databázový marketing VI. (18.06.2004)
    Databázový marketing IV. (07.06.2004)
    Databázový marketing III. (01.06.2004)
    Databázový marketing II. (31.05.2004)
    Databázový marketing I. (28.05.2004)

    ( Celý článek! | Autor: Veronika Ďuranová | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek )

    Vyhledávání
     

    Anketa
    Kolik ročně utratíte za dovolené?

    Nic 
     (1582 hl.)
    Do 1 000,- Kč 
     (1090 hl.)
    Do 10 000,- Kč 
     (1015 hl.)
    Do 25 000,- Kč 
     (1400 hl.)
    Do 50 000,- Kč 
     (1035 hl.)
    Do 75 000,- Kč 
     (1197 hl.)
    Více než 75 000,- Kč 
     (1035 hl.)

    Celkem hlasovalo: 8354


    Poslední komentáře
    frontierd@126.com
    frontierd@126.com
    frontierd@126.com
    c
    http://www.coachoutl

    Newsletter
    Přihlaste si nezávazně - i bez registrace - odběr informačního newsletteru. Podrobné informace najdete zde.

    Emailová adresa:


    Kalendář
    <<  Únor  >>
    PoÚtStČtSoNe
       1234
    567891011
    12131415161718
    19202122232425
    262728    

    Redakci připojuje


    Nejčtenější

    Databáze je prázdná!


    Nejvíce komentářů

    Databáze je prázdná!


    Reklama






    Nenechte si ujít články na dalších webech




    Na této stránce použité názvy programových produktů, firem apod. mohou být ochrannými známkami
    nebo registrovanými ochrannými známkami příslušných vlastníků.

    Databázový svět | dfKlub - digitální fotografie | Vtipník - vtipy přímo k Vám | Reminder - přestaňte zapomínat | Databázový svět

    Copyright (c) 2004 AVRE Publishing, spol. s r.o. Všechna práva vyhrazena