Dnes: 18. února 2018    | Registrace | Hledáme | Redakce | Info | Testy | Školení | Ocenění | Nápověda | Čtenář: nepřihlášen

Rychlé odkazy
 • Hlavní stránka
 • Seznam rubrik
 • Ankety
 • Editoriály
 • TOP 15
 • KONFERENCE 2008
 • KONFERENCE 2007
 • KONFERENCE 2006
 • KONFERENCE 2005
 • KONFERENCE 2004
 • Sborník
 • Testy
 • Virtuální školení
 • Personalizace


 • Hledáte práci?
  Hledáme redaktora - pojďte s námi tvořit Databázový svět!

  Vyhledávání

  Hledej
  na Databázovém světě!  Rozšířené vyhledávání

  Rubriky
  Aktuality
  Bezpečnost
  Business
  Česká scéna
  Datové sklady
  Dokumentace
  Dotazovací jazyky
  Hardware
  Historie
  Komentáře
  Literatura
  Metodologie
  Nondb
  Open Source
  Poradna
  Produkty
  Případové studie
  Redakce
  Rozhovory
  Standardy
  Technologie
  Tipy - triky
  Tiskové zprávy
  Vývoj
  Vývojové nástroje
  Zajímavosti

  Co je to?
  Datový sklad
  Tento pojem poprvé formuloval koncem 80. let William Inmon jako strategii přístupu k datům určeným pro rozsáhlé analýzy. V případě datového skladu hovoříme o historických, časově rozlišených, agregovaných, průběžně rozšiřovaných datech uspořádaných pro podporu potřeb managementu.

  Akce
  Dynamická Datová Centra
  - na semináři se seznámíte s komplexním řešením a koncepcí Dynamických Datových Center od Fujitsu Siemens Computers se speciálním důrazem na řešení FlexFrame.

  Textová inzerce
  IBPhoenix - Vše o InterBase a Firebirdu.

  Smějete se rádi? - Pak je pro vás Vtipník to pravé!

  Prodejce reklamy - Hledáme schopného prodejce reklamního prostoru, možnost i externí spolupráce.

  Přihlášený čtenář
  Nepřihlášený čtenář

  O portálu
  Databázový svět
  ISSN: 1213-5933

  Web je optimalizován pro rozlišení 1024x768, nicméně kromě větších rozlišení podporujeme i 800x600. Podrobnosti najdete zde.

  Chcete-li mít kdykoliv možnost zkontrolovat obsah našeho portálu, můžete využít podporu rss. Podrobnosti najdete zde.
  Databázový marketing V.


  [Business] - Štatistické nástroje data miningu: pri používaní štatistických nástrojov data miningu (ale aj pri budovaní dátových skladov), je vidieť prepojenie technológie s biznisom, čo sa stalo vlastne potvrdením mnohých prognóz marketingových analytikov.  Pri spracovaní dát v databázach používame tieto štatistické prístupy na abstrahovanie relevantných znalostí.

  Zhluková analýza
  Zhluková analýza je technika redukcie údajov, ktorá zoskupuje buď premenné alebo prípady založené na podobných charakteristikách. Vďaka týmto vlastnostiam je užitočná pre nájdenie zákazníckych segmentov založených na spoločných charakteristikách ako sú demografické a finančné informácie alebo spôsoby nákupu.

  Analýza faktorov
  Táto technika je užitočná pri hľadaní dôležitých základných charakteristík, ktoré nemusia byť viditeľné, ale ktoré môžu byť nájdené ako skryté premenné. Oproti zhlukovej analýze, vytvára analýza faktorov modely z údajov.

  Rozhodovacie stromy
  Na základe rozhodovacích stromov (decision trees, answer trees) dokážeme zákazníkov zaradiť do skupín a odhadnúť pravdepodobnosť nákupu určitých produktov.

  Hlavné výhody rozhodovacích stromov sú: zrozumiteľnosť výstupov (oproti napríklad neurónovým sieťam), jednoduché použitie a nácvik, pomerne málo predpokladov (napríklad oproti regresii), praktickosť výstupov (je možné hneď vypočítať očakávanú úspešnosť, očakávaný zisk, návratnosť investícií…), rýchlosť nasadenia (niekedy môže poskytnúť dostatočne kvalitné informácie bez potreby budovať komplikované štatistické modely) a pružnosť (model je dosť zložitý a vhodným nastavením parametrov je možné ho prispôsobiť požiadavkám zákazníka).

  Neurónové siete
  Využitie neurónových sietí (neural networks) má najväčšie uplatnenie vo fyzike a v technických odvetviach, ale ich výhody prenikajú už aj do ekonomiky.

  Výhodou neurónových sietí je, že nie je potrebné mať na mysli nejaký špeciálny model, keď sa spúšťa analýza. Neurónové siete môžu tiež nájsť interakčné efekty (napríklad efekty z kombinácie veku a pohlavia), ktoré musia byť explicitne vyjadrené v regresii. Nevýhodou je ťažšia interpretácia výsledného modelu, preto ich použitie je užitočnejšie na predpovedanie cieľovej premennej, keď sú údaje nelineárne, ale nie sú veľmi užitočné, keď tieto vzťahy údajov je potrebné vysvetliť

  Systém STATISTIKA DataMiner predstavuje veľmi progresívnu aplikáciu neurónových sietí dostupných na trhu. Obsahuje General Neural Networks Explorer.

  Asociačná analýza
  Pomocou asociačných modelov hľadáme pravidlá o prvkoch, ktoré patria k sebe v nejakom prípade, ako sú napríklad nákupné transakcie. Pravidlá nachádzajú veci, ktoré „patria k sebe“, čo je iné ako keď sú predpovedané. Tieto modely sú často označované ako Market Basket analýza, ak sú aplikované v obchodnom priemysle na skúmanie nákupných schém zákazníkov.

  Vizualizácia údajov
  Využívajú počítačovú grafiku na zobrazovanie údajov v diagramoch, ktoré sú prevedené do ľahko prístupného jazyka ako sú obrázky a sú ľahšie vnímateľné.

  Pravidlová indukcia
  Je to technika pre objavovanie skupín "Ak/Potom" pravidiel z údajov pre klasifikovanie rôznych prípadov. Táto technika je výkonná, pretože hľadá dôležité schémy v skupinách údajov, na druhej strane však nemusí pokrývať všetky možné situácie, keďže pravidlá sú nezávislé a často si môžu navzájom odporovať.

  Kurt Thearling, jeden z významných odborníkov v oblasti softvérového data miningu, označuje zhlukovacie analýzy a im podobné nástroje za klasické techniky a rozhodovacie stromy a neurónové siete za novú technologickú generáciu.

  Okrem vyššie popísaných techník na ťažbu dát, rozoznávame ešte techniky modelovania vychádzajúce z teórie, ako sú korelácie, lineárna a logistická regresia, diskriminantná analýza, metódy predpovedania a pod.

  Najznámejší a najkvalitnejší produkt v oblasti ťažby dát je SAS Enterprise Miner ktorý vyvinula spoločnosť SAS Institute. Poskytuje účinnú metodickú pomôcku, tzv. SEMMA (Sample – vzorkovanie, Explore – skúmanie, Modify – modifikovanie, Model – modelovanie a Assess – vyhodnocovanie), teda umožňuje bez hlbokých teoretických znalostí vytvárať v grafickom prostredí predikatívne modely ako sú regresia, neurónové siete a rozhodovacie stromy a tiež zhlukové analýzy, asociácie a sekvencie. Je tiež bez ťažkostí integrovateľný s prostredím data warehouse a data martov.

  Z ostatných významných produktov je to napríklad SGI od Silicon Graphics, ktorý sa vyznačuje silnými vizualizačnými nástrojmi. Ponúka pokročilú 4D vizualizáciu – 3D grafy sa môžu meniť podľa dvoch ďalších premenných dimenzií.

  Intelligent Miner od IBM je zasa vyvážený produkt poskytujúci rôzne techniky, ktoré sú integrované do jedného modelu. Nastavenie parametrov je jednoduché, používateľ je navigovaný pomocou wizardov. Ponúka najlepší clustering, t.j. zhlukovanie.

  Komplexná metodológia dolovania údajov, ktorá vo svojom návode vedie začiatočníkov krok za krokom, CRISP-DM (CRoss-Industry Standard Process for Data Mining) je prístupná na adrese .

  Účelom data miningu nie je len systematicky nazhromaždiť obrovské množstvo neustále pribúdajúcich dát, ale mali by sme vedieť tieto informácie zhrnúť a prezentovať tak, aby boli využiteľné. Nachádzaním skrytých štruktúr a dôležitých informácií ktoré sú v nich obsiahnuté, vieme potom lepšie určovať marketingové stratégie. Môžeme zistiť, ktorí zákazníci:

  • sú pripravení akceptovať ponuku modifikovaného produktu
  • sú ochotní kúpiť ostatné produkty firmy
  • majú pre firmu najväčšiu hodnotu a je im potrebné venovať viac pozornosti a starostlivosti
  • majú tendenciu od firmy odísť a akými opatreniami tomu môžeme zabrániť

  Data mining je súčasťou technológií pre podporu rozhodovania. Samotné rozhodovanie však musí urobiť príslušný zodpovedný pracovník. K tomuto rozhodovaniu potrebuje vstupy, ktoré prichádzajú aj z aplikácie data miningu. Úloha manažmentu je teda nezastupiteľná, spočíva v definovaní vízie, podnikateľských hypotéz, v určovaní kvantifikovateľných cieľov a v rozhodovaní v procese realizácie.

  Proces ťažby dát tak zahŕňa postupy od formulovania aplikačnej otázky až po implementáciu a rozšírenie výsledkov do praxe organizácie. Proces však nemusí končiť, pretože meniace sa prostredie vyžaduje údržbu databáz, preverovanie modelov a pri postupnej ďalšej kumulácií dát prípadné upresňovanie modelov.

  Je dôležité presne porozumieť možnostiam obchodného uplatnenia výsledkov data miningu, aby nevznikli problémy s malou podporou obchodne zodpovedných manažérov ("Našich zákazníkov poznáme"), čo sa následne môže odraziť v nedôslednom doťahovaní zistených výsledkov do úrovne obchodných procesov.

  Pozitívnou prognózou je predpoklad širšieho používania nástrojov na ťažbu dát aj novými užívateľmi a rast povedomia o týchto nástrojoch vo všeobecne dostupných článkoch a v odborných publikáciách.

  Pre firmy, ktoré už investovali mnohomiliónové čiastky do vybudovania dátových skladov, je data mining nutnosťou, pretože je jedným zo spôsobov, ako zhodnotiť vložené prostriedky. Ťažba dát môže byť prínosom aj pre firmy, ktoré zatiaľ dátové sklady nemajú. Bude však ťažšia, keďže pre ne bude náročnejšia fáza získavania dát.

  Funkčné a stabilné prostredie dátového skladu nielen značne uľahčuje problémy so získavaním dát a kvalitou dátových zdrojov, ale čím sa stanú dátové sklady väčšie a tým vznikne naliehavejšia potreba využívania data miningu, pozornosť sa snáď zameria aj na zlepšenie v kvalite dát.

  Obdobou data miningu je text mining a web mining.

  Pomocou text miningu získavame dôležité informácie z textových dokumentov, konkrétne z neštruktúrovaného textu. Keďže získané informácie sa prejavujú tiež vo forme znalostí, môžeme ho označiť ako text data mining.

  Web mining znamená získavanie a analýzu použiteľných informácií z web stránok. Stáva sa cenným nástrojom pri sledovaní zákazníkov pohybujúcich sa na našich web stránkach, všímame si ich meniace sa záujmy a očakávania, aj prostredníctvom analýzy preklikávacích sekvencií (clickstream údaje) a na základe týchto informácií zlepšujeme obsah a celkovú úpravu webovej stránky.

  Web data mining rozdeľujeme na obsahový, ktorý v sebe zahŕňa automatické prehľadávanie a získavanie informácií z internetových serverov a online databáz a na prístupový, kedy získavame a analyzujeme prístupy k týmto informáciám pomocou záznamov o prístupe k serveru, referenčných záujmoch, registrácii užívateľov alebo profilových informácií.

  Související články:
  Databázový marketing VI. (18.06.2004)
  Databázový marketing IV. (07.06.2004)
  Databázový marketing III. (01.06.2004)
  Databázový marketing II. (31.05.2004)
  Databázový marketing I. (28.05.2004)

  ( Celý článek! | Autor: Veronika Ďuranová | Počet komentářů: 0 | Přidat komentář | Informační e-mailVytisknout článek )

  Vyhledávání
   

  Anketa
  Kolik ročně utratíte za dovolené?

  Nic 
   (1582 hl.)
  Do 1 000,- Kč 
   (1090 hl.)
  Do 10 000,- Kč 
   (1015 hl.)
  Do 25 000,- Kč 
   (1400 hl.)
  Do 50 000,- Kč 
   (1035 hl.)
  Do 75 000,- Kč 
   (1197 hl.)
  Více než 75 000,- Kč 
   (1035 hl.)

  Celkem hlasovalo: 8354


  Poslední komentáře
  frontierd@126.com
  frontierd@126.com
  frontierd@126.com
  c
  http://www.coachoutl

  Newsletter
  Přihlaste si nezávazně - i bez registrace - odběr informačního newsletteru. Podrobné informace najdete zde.

  Emailová adresa:


  Kalendář
  <<  Únor  >>
  PoÚtStČtSoNe
     1234
  567891011
  12131415161718
  19202122232425
  262728    

  Redakci připojuje


  Nejčtenější

  Databáze je prázdná!


  Nejvíce komentářů

  Databáze je prázdná!


  Reklama


  Nenechte si ujít články na dalších webech
  Na této stránce použité názvy programových produktů, firem apod. mohou být ochrannými známkami
  nebo registrovanými ochrannými známkami příslušných vlastníků.

  Databázový svět | dfKlub - digitální fotografie | Vtipník - vtipy přímo k Vám | Reminder - přestaňte zapomínat | Databázový svět

  Copyright (c) 2004 AVRE Publishing, spol. s r.o. Všechna práva vyhrazena