Systém pro vyhledávání konkurenčních webových stránek za využití AI
Název práce: | Systém pro vyhledávání konkurenčních webových stránek za využití AI |
---|---|
Autor(ka) práce: | Dao, Sinh Duc |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Vojíř, Stanislav |
Oponenti práce: | Nguyen, Viet Bach |
Jazyk práce: | Česky |
Abstrakt: | Cílem této bakalářské práce je navrhnout a vytvořit program, který pomůže uživatelům s vyhledáváním konkurenčních webových stránek pomocí umělé inteligence. Hlavní funkcionalitou pro splnění tohoto cíle je identifikace SEO klíčových slov z obsahu webové stránky využitím velkých jazykových modelů (LLM). Práce se nejprve zabývá definicí pojmů „analýza klíčových slov“ a „web scraping“. Dále byla vypracována rešerše na téma velkých jazykových modelů a prompt engineering. Pro zajištění správné funkčnosti programu byla provedena analýza a testování různých LLM prostřednictvím API, kde byl na závěr vybrán model Gemini 2.0 Flash. Na základě získaných informací z analýzy požadavků práce a srovnání existujících aplikací byly definovány hlavní funkcionality programu, podle nichž byl vytvořen návrh implementace programu a uživatelského rozhraní. Pro implementaci byl zvolen programovací jazyk Python spolu s nástrojem Selenium pro extrakci interních odkazů a HTML dokumentů a frameworkem Streamlit pro realizaci webového rozhraní a nasazení aplikace. Na závěr proběhlo uživatelské testování a test bezpečnosti aplikace. Výsledkem práce je aplikace, která umožňuje uživatelům extrahovat HTML dokumenty ze zadané URL pomocí web scrapingu a následně generovat SEO klíčová slova pomocí velkého jazykového modelu. Výstupy lze navíc ovlivnit nastavením počtu a jazyka klíčových slov. |
Klíčová slova: | velké jazykové modely; extrakce klíčových slov; vyhledávání; vyhledávače; webové stránky; web scraping; Python; Selenium; SEO; Streamlit; API |
Název práce: | AI-powered competitive website search system |
---|---|
Autor(ka) práce: | Dao, Sinh Duc |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Vojíř, Stanislav |
Oponenti práce: | Nguyen, Viet Bach |
Jazyk práce: | Česky |
Abstrakt: | This bachelor's thesis aims to design and develop a program that helps users search for competing websites using artificial intelligence. To reach the goal, the main function of the program involves SEO keywords identification from the content of a given webpage with the help of large language models (LLM). First, the thesis defines the terms „keyword analysis“ and „web scraping“. It then presents a research on large language models and prompt engineering. To ensure the correct functionality of the program, various LLMs were analyzed and tested via API calls, with the final chosen model being Gemini 2.0 Flash. Based on the findings from the requirements analysis and a comparison of existing applications, the main functionalities of the program were defined. These functionalities served as the basis for designing the program’s implementation and user interface. The final application was developed in Python, using Selenium as a web scraping tool. For the implementation of the web interface and deployment of the application, the Streamlit framework was chosen. Finally, usability testing and a security test were conducted on the resulting application. The result of this thesis is an application that uses web scraping to extract HTML documents from a given URL and subsequently generates SEO keywords using a large language model. Users can further customize the output by adjusting the number and the language of the keywords. |
Klíčová slova: | searching; Selenium; keyword extraction; Python; SEO; Streamlit; search engines; web pages; large language models; web scraping; API |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 12. 2. 2024 |
---|---|
Datum podání práce: | 12. 5. 2025 |
Datum obhajoby: | 18. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/87461/podrobnosti |