Computational aspects of optimization of special partwise-linear functions with motivation from robust statistics
Autor(ka) práce:
Formánek, Matěj
Typ práce:
Bachelor thesis
Vedoucí práce:
Rada, Miroslav
Oponenti práce:
-
Jazyk práce:
English
Abstrakt:
This thesis studies computational aspects of optimizing Jaeckel’s Dispersion Function, a convex piecewise-linear objective function arising in rank-based regression. The main focus is on the construction of difficult instances for selected heuristic optimization methods. Instead of choosing the data matrix and the response vector directly, the thesis develops a geometric construction procedure that transforms prescribed local geometry into matrix X and vector y. The geometry is prescribed active permutation on cells (this controls the adjacency of the cells), gradient of the objective function, which is linear on the cell, and by vertices on which respective permutations are active. Two main classes of instances are constructed. The Infinitely Narrow Cone is designed to be difficult for gradient descent with line search. The method repeatedly reaches nondifferentiability boundaries and makes only very slow progress toward the optimizer. The Infinitely Anisotropic Canyon is designed to be difficult for Nelder-Mead Simplex. Its geometry is steep across the canyon and almost flat along its floor, which can cause a quick contraction in the simplex and exceeding of the iteration limit before reaching optimizer. The numerical experiments show that different heuristics can fail for different geometric reasons. The constructed instances are not rare examples, but representatives of broader classes of geometrically similar instances.
Výpočetní aspekty optimalizace piece-wise lineární funkce s motivací pro robustní statistiku
Autor(ka) práce:
Formánek, Matěj
Typ práce:
Bakalářská práce
Vedoucí práce:
Rada, Miroslav
Oponenti práce:
-
Jazyk práce:
English
Abstrakt:
Tato práce se zabývá výpočetními aspekty optimalizace Jaeckelovy disperzní funkce, která je konvexní, po částech lineární účelovou funkcí užívanou v rank-based regresi. Hlavní pozornost je věnována konstrukci instancí, které jsou pro vybrané heuristické optimalizační metody složité na výpočet. Namísto přímé volby datové matice a vektoru pozorování je v práci popsán matematický aparát převádějící lokální geometrii na matici X a vektor y. Geometrie je zadána pomocí aktivní permutací na buňkách (ty potom určují jejich sousednost), předepsaného gradientu funkce, která je na buňce lineární, a body, v nichž má být permutace aktivní. V práci jsou zkonstruovány dvě hlavní třídy instancí. Infinitely Narrow Cone je navržena tak, aby byla obtížná pro gradient descent s line search. Metoda opakovaně naráží na hranice, místa, kde je funkce nediferenciovatelná, a postupuje k optimu jen velmi pomalu. Infinitely Anisotropic Canyon je obtížná pro Nelder-Mead Simplex. Simplex hledá optimum na úloze, která obsahuje extrémně strmé údolí, které je ve směru svého dna velmi ploché. To může způsobit prudké smršťování simplexu a přesažení výpočetního limitu iterací před dosažením optima. Numerické experimenty ukazují, že různé heuristiky mohou selhávat z odlišných geometrických důvodů. Zkonstruované instance nejsou vzácnými případy, ale reprezentanty širších tříd geometricky podobných instancí.
Klíčová slova:
regrese založená na pořadí; po částech lineární optimalizace; Jaeckelova disperzní funkce; Nelder-Meadova metoda; obtížné instance; gradientní metoda
Informace o studiu
Studijní program / obor:
Matematické metody v ekonomii/Ekonometrie a operační výzkum