Optimalna teorija upravljanja uvelike se koristi u znanosti, kao i u inženjerstvu. To je tehnika matematičke optimizacije koja se obično koristi u kreiranju kontrolnih politika. Za teoriju optimalnog upravljanja najviše su zaslužni Lev Pontryagin, zajedno sa svojim timom u bivšem Sovjetskom Savezu, i Amerikanac Richard Bellman. Opći cilj teorije je korištenje različitih metoda analize za određivanje parametara sustava provođenjem procesa pokušaja i pogreške.
Optimalna teorija upravljanja je korisna kada se pokušava riješiti problem kontinuirane optimizacije vremena. Teorija rješava problem utvrđivanjem zakona upravljanja za hipotetski sustav kako bi se postigla razina optimalnosti. Optimalna kontrola se sastoji od skupa različitih jednadžbi, koje opisuju putove varijabli koje troškovnu funkcionalnost svode na minimum. Funkcija troškova je u osnovi funkcija varijabli povezanih sa stanjem i kontrolom. Optimalna teorija upravljanja koristi Pontryaginov princip maksimuma, koji općenito kaže da se problem optimizacije P može riješiti korištenjem Hamiltonove funkcije H tijekom jednog razdoblja, što je potreban uvjet. Teorija se također može izvesti pomoću Hamilton-Jacobi-Bellman jednadžbe.
Kako bi se pomoglo osobi da razumije teoriju optimalnog upravljanja, obično se koristi primjer “vožnja automobilom brdovitom cestom”. Zamislite da putujete u automobilu po krševitoj cesti u pravoj liniji. Teorija može odrediti kako treba ubrzati kako bi se minimiziralo apsolutno vrijeme putovanja. U tom slučaju “sustav” čine vozilo i kamenita cesta, a kriterij optimalnosti je postizanje minimiziranja vremena putovanja. Poznato je da takvi problemi uključuju ograničenja (npr. ograničenje goriva, ograničenja brzine). Drugo pitanje može biti pronalaženje načina na koji automobil može optimizirati potrošnju goriva dok je dužan završiti određeni tečaj u određenom vremenskom roku.
Drugi primjer korištenja teorije optimalnog upravljanja je rješavanje troškovne ili sjene. Sastoji se od granične vrijednosti proširenja varijable stanja. Nakon što se to riješi, optimalna vrijednost za kontrolu može formirati diferencijalnu jednadžbu uvjetovanu svjesnošću kostata. Uobičajeno je da se ova strategija rješava za regije koje opisuju optimalnu kontrolu i izoliraju stvarne vrijednosti izbora na vrijeme.