čtvrtek 7. listopadu 2019

Lineární regrese funguje!

Pro normálně fungující podnik moc matematiky opravdu nepotřebujete. Většina vztahů je přímočarých. Tentokrát to myslím doslovně. Vzájemná závislost vypadá v grafu jako přímá čára, z matematického hlediska jde o lineární funkci. Jsou-li dvě veličiny mezi sebou svázány takovou závislostí, lze vypočítat hodnotu jedné z nich (závisle proměnné, označme ji y) pomocí druhé (nezávisle proměnné, kterou označíme x) podle vzorce y = A*x + B. Konstanty A, B bezezbytku popisují vztah obou proměnných: Čím větší A, tím větší je dopad změny proměnné x na proměnnou y a tím rychleji roste y, pokud roste x. Čím větší B, tím vyšší hodnotu nabývá proměnná y při x = 0; toto číslo pak představuje stálou část hodnoty y, uplatňující se  vedle části druhé, která je výše popsaným způsobem svázaná s hodnotou x.  Příklady:

Měsíční náklad spotřebované elektrické energie je reprezentován stálou částkou B (za elektřinu na svícení, klimatizaci, vytápění, která se – pomineme-li možné rozdíly v délce dne a venkovní teplotě – v měsíčních fakturách nijak podstatně nemění) a dále určitou hodnotou A, utracenou ve zhruba stejném rozsahu na každou hodinu, kdy běží výrobní linka. Výsledek?  Běží-li linka v měsíci x hodin, pak y = A*x + B.

Pomineme-li, že reálný podnik se nechová úplně tak, jak popisuje diagram bodu zvratu, pak lze celkové provozní náklady firmy rozložit na část B, tvořenou náklady fixními a dále stálou částí nákladů smíšených (které jsou částečně fixní a částečně variabilní, příkladem je výše zmíněná spotřeba elektřiny), a část A*x, tvořenou výkonově závislými zbytky smíšených nákladů (Ai *x) a náklady variabilními.

Hodnota podnikových zásob má svoji stálou část B, reprezentovanou položkami, které se spotřebovávají nezávisle na objemu produkce (sem patří i „ležáky“, které se nespotřebovávají vůbec) a zároveň s výkonem svázanou část A*x, která je víceméně přímo úměrná produkci x (aktuálního nebo následujícího období, podle toho, s jakým předstihem se nakupuje a jak dlouho trvá produkce) – jde o produktové vstupy, rozpracovanou produkci i zásobu hotových produktů.

Všechny výše zmíněné vztahy platit mohou, ale taky nemusí – záleží na tom, jak moc „normálně“ podnik právě funguje – například jediná realizovaná investice, vymykající se obvyklému rozsahu obnovy, může prakticky všechny zmíněné hodnoty y podstatně „rozhodit“. Právě odtud ostatně pramenila až donedávna moje skepse ohledně aplikace matematiky pro tento případ – a vida, ono to přesto někdy jde!

Dále uvedené příklady jsou autentické – v tom je jejich hlavní důkazní síla. Čísla jsou pochopitelně anonymizovaná. K potvrzení hypotézy o jednoduché lineární závislosti v uvedených případech jsou použil excelovskou funkci LINREGRESE, která sice vypadá na první pohled komplikovaně (způsob jejího použití najdete v helpu MS Excel), ale nakonec vás docela příjemně překvapí (doporučuji požít nejjednodušší formát, jak je popsán ve vzorových příkladech v helpu). Tahle funkce provádí matematický postup, zvaný „lineární regrese“ – vyhledá taková čísla A, B, která nejlépe (pochopitelně ne úplně přesně, ale s nejmenšími odchylkami) vystihují lineární závislost dvou veličin, jejichž dvojice (tedy dvojice skutečně změřených hodnot pro pokud možno co největší počet období „normálního fungování“ podniku) uvedete do vstupní tabulky.

Dostanete-li výsledek - jedinou dvojici konstant A a B, můžete pro  každé „x“ v minulosti vašeho podniku spočítat „ideální dvojče“ k jemu příslušnému, v původní tabulce uvedenému, „y“. Tyhle nové ypsilony, vynesete-li hodnoty obou typů dvojic do grafu (vodorovná osa – proměnná x: podnikové tržby, hodiny práce linky apod. , svislá osa – závisle proměnná y: hodnota spotřeby, zásob, pohledávek, závazků), budou ležet na „božsky vyhlazené“ přímce. Pozor – nejde o běžný graf, ve kterém je na vodorovné ose čas, a nejde ani o žádnou čáru, znázorňující časový průběh zleva doprava. Dva blízké body jsou si podobné v hodnotách, ale klidně může jít o časově velmi vzdálená období! V excelovském výběru musíte zvolit variantu grafu „XY bodový“. Vzdálenost bodů z původních dvojic, tedy dat „z reálného světa“ – na dále uvedených obrázcích jsou vyznačeny hnědou barvou – od svých „božských ideálů“ – na obrázcích modře – pak vyřkne definitivní soud, nakolik jsou získané hodnoty A, B vhodné – třeba k předpovědi y pro forecastovanou hodnotu x. 

Nyní již k samotným výsledkům na obr. 1 a 2: Hodnota A – v grafech sklon přímky, spojující modré body - představuje jakýsi doporučený „koeficient variability“ (čím vyšší, tím přímka stoupá rychleji), použitelný třeba pro očištění nezaviněné (výkonem zdůvodnitelné) odchylky při vyhodnocování rozpočtů. Hodnota B, v  grafech vyznačená na svislé ose,  se pak snaží uhodnout „stálou porci“ v reportovaných proměnných hodnotách: ve shodě s předchozími příklady  - poukazuje na množství fixních nákladů, a po jistém očištění také na aktuální úroveň ležáků – v případě zásob.


Obr. 1: Provozní náklady v závislosti na kvartálních tržbách


Obr. 2 Zásoby ke konci roku v závislosti na tržbách 

(kráceno; plné znění v podzimním vydání CAFIN News)