Filtrování zajímavých pravidel v systému EasyMiner

Název práce: Filtrování zajímavých pravidel v systému EasyMiner
Autor(ka) práce: Duben, Přemysl Václav
Typ práce: Diplomová práce
Vedoucí práce: Vojíř, Stanislav
Oponenti práce: Zeman, Václav
Jazyk práce: Česky
Abstrakt:
Obdobně jako příprava dat je i postprocessing jedním z nejnáročnějších úkolů, které uživatele při data miningu čekají, a proto je žádoucí ho zjednodušit, aby byla cesta k výsledkům co nejrychlejší a nejefektivnější. V tomto směru by mělo pomoci i rozšíření výzkumného projektu EasyMiner o filtrování asociačních pravidel získaných z data miningových úloh dle podobnosti s pravidly uloženými ve znalostní bázi, což je tématem této diplomové práce. Cíle bylo dosaženo podrobnou analýzou výchozího stavu systému EasyMiner ve spojení s důkladně promyšleným návrhem implementace bez zvýšení nároků na server či uživatele aplikace. K tomu posloužila analýza obecných postupů a autorova hluboká znalost problematiky internetových aplikací. Při budoucím nasazení v této práci popsaného rozšíření do infrastruktury projektu EasyMiner bude přínosem přehlednější a efektivnější práce s částí Knowledge base, kdy již nebude potřeba hodnotit zajímavost u stejných či obdobných pravidel a uživatel se tak bude moci zaměřit přímo na kvalitu výsledků. Práce je členěna do jednotlivých kapitol jako podrobný popis, jak lze k podobnému problému přistupovat u jakéhokoliv jiného projektu, který pracuje s jistou formou znalostní báze. Počáteční analýza zadání s rešerší přístupů k porovnávání různých prvků přechází skrze popis výchozího stavu aplikace ke konkrétnímu návrhu řešení. Ten je pak jasným vodítkem samotné implementace a také následného testování navrhovaných a implementovaných postupů.
Klíčová slova: background knowledge; EasyMiner; podobnost; data mining; asociační pravidla; Knowledge base; znalostní báze; SEWEBAR
Název práce: Filter interesting rules in EasyMiner system
Autor(ka) práce: Duben, Přemysl Václav
Typ práce: Diploma thesis
Vedoucí práce: Vojíř, Stanislav
Oponenti práce: Zeman, Václav
Jazyk práce: Česky
Abstrakt:
Postprocessing is like data preparation one of the most challenging tasks in data mining that users must deal with. It is desirable to simplify it so that the path to results is as fast and efficient as possible. The extension of the EasyMiner research project to filter the association rules by similarity to the knowledge-based rules, should be helped in this respect, which is the subject of this diploma thesis. The objectives were accomplished by a detailed analysis of the default state of EasyMiner in conjunction with a thoroughly thought-out implementation proposal without increasing the demands on the server or user of the application. An analysis of general practices and the author's deep knowledge of Internet application issues served to do this. The future deployment of this extension to the EasyMiner infrastructure will benefit from a clearer and more efficient work with the Knowledge base part, where it will no longer be necessary to evaluate the interest in the same or similar rules and the user will be able to focus directly on the quality of the results. This thesis is divided into chapters as a detailed description of how a similar problem can be approached in any other project that works with a certain form of knowledge base. Initial input analysis with access search for comparison of the various elements passes through a description of the default application state to a specific solution design. This should be a guideline for the implementation itself and for the testing of the proposed and implemented procedures.
Klíčová slova: SEWEBAR; EasyMiner; similarity; data mining; association rules; knowledge base; background knowledge

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 5. 5. 2015
Datum podání práce: 20. 4. 2017
Datum obhajoby: 5. 6. 2017
Identifikátor v systému InSIS: https://insis.vse.cz/zp/52879/podrobnosti

Soubory ke stažení

    Poslední aktualizace: