Filter interesting rules in EasyMiner system

Thesis title: Filtrování zajímavých pravidel v systému EasyMiner
Author: Duben, Přemysl Václav
Thesis type: Diplomová práce
Supervisor: Vojíř, Stanislav
Opponents: Zeman, Václav
Thesis language: Česky
Obdobně jako příprava dat je i postprocessing jedním z nejnáročnějších úkolů, které uživatele při data miningu čekají, a proto je žádoucí ho zjednodušit, aby byla cesta k výsledkům co nejrychlejší a nejefektivnější. V tomto směru by mělo pomoci i rozšíření výzkumného projektu EasyMiner o filtrování asociačních pravidel získaných z data miningových úloh dle podobnosti s pravidly uloženými ve znalostní bázi, což je tématem této diplomové práce. Cíle bylo dosaženo podrobnou analýzou výchozího stavu systému EasyMiner ve spojení s důkladně promyšleným návrhem implementace bez zvýšení nároků na server či uživatele aplikace. K tomu posloužila analýza obecných postupů a autorova hluboká znalost problematiky internetových aplikací. Při budoucím nasazení v této práci popsaného rozšíření do infrastruktury projektu EasyMiner bude přínosem přehlednější a efektivnější práce s částí Knowledge base, kdy již nebude potřeba hodnotit zajímavost u stejných či obdobných pravidel a uživatel se tak bude moci zaměřit přímo na kvalitu výsledků. Práce je členěna do jednotlivých kapitol jako podrobný popis, jak lze k podobnému problému přistupovat u jakéhokoliv jiného projektu, který pracuje s jistou formou znalostní báze. Počáteční analýza zadání s rešerší přístupů k porovnávání různých prvků přechází skrze popis výchozího stavu aplikace ke konkrétnímu návrhu řešení. Ten je pak jasným vodítkem samotné implementace a také následného testování navrhovaných a implementovaných postupů.
Keywords: background knowledge; EasyMiner; podobnost; data mining; asociační pravidla; Knowledge base; znalostní báze; SEWEBAR
Thesis title: Filter interesting rules in EasyMiner system
Author: Duben, Přemysl Václav
Thesis type: Diploma thesis
Supervisor: Vojíř, Stanislav
Opponents: Zeman, Václav
Thesis language: Česky
Postprocessing is like data preparation one of the most challenging tasks in data mining that users must deal with. It is desirable to simplify it so that the path to results is as fast and efficient as possible. The extension of the EasyMiner research project to filter the association rules by similarity to the knowledge-based rules, should be helped in this respect, which is the subject of this diploma thesis. The objectives were accomplished by a detailed analysis of the default state of EasyMiner in conjunction with a thoroughly thought-out implementation proposal without increasing the demands on the server or user of the application. An analysis of general practices and the author's deep knowledge of Internet application issues served to do this. The future deployment of this extension to the EasyMiner infrastructure will benefit from a clearer and more efficient work with the Knowledge base part, where it will no longer be necessary to evaluate the interest in the same or similar rules and the user will be able to focus directly on the quality of the results. This thesis is divided into chapters as a detailed description of how a similar problem can be approached in any other project that works with a certain form of knowledge base. Initial input analysis with access search for comparison of the various elements passes through a description of the default application state to a specific solution design. This should be a guideline for the implementation itself and for the testing of the proposed and implemented procedures.
Keywords: SEWEBAR; EasyMiner; similarity; data mining; association rules; knowledge base; background knowledge

Information about study

Study programme: Aplikovaná informatika/Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 5. 5. 2015
Date of submission: 20. 4. 2017
Date of defense: 5. 6. 2017
Identifier in the InSIS system:

Files for download

    Last update: