Strojové učení

Strojové učení

„Jde o aplikaci umělé inteligence, která systémům, strojům apod. dává možnost se automaticky učit a zdokonalovat se, aniž by k tomu byly explicitně naprogramovány.“

Cílem je naučit stroje, aby uměly na základě existujících dat, úspěšně zpracovat a interpretovat data, která nikdy před tím „neviděly“.

Strojové učení s učitelem (Supervised Machine Learning)

Zjednodušeně řečeno, strojové učení zpracuje vhodně připravenou historickou datovou sadu tak, aby na základě poznaných vztahů z této datové sady, bylo schopno rozpoznat, či předpovědět podobné vztahy na novém souboru, se kterým se teprve seznámí.

Vhodně připravená datová sada pak obsahuje vstupní hodnoty (features), a jednu nebo více výstupních hodnoty (labels).

Výstupy mohou být kategorické (např. barvy, modely aut, ID chyb), nebo numerické (prodejní cena auta, cena akcie, cena pozemku).

Klasifikace

Pokud jsou výstupy (labels)  kategorické hodnoty, hovoříme v rámci strojového učení o „klasifikačním problému“, tj. učíme se klasifikovat – rozpoznávat a predikovat – konkrétní jedinečnou kategorii (pomeranč, nádor, druh chyby,…).

Příklady na použití klasifikace: (Jupter Notebooky) *** link ***

Regrese

Pokud jsou výstupy (labels) numerické hodnoty, hovoříme v rámci strojového učení o „regresním problému“, tj. učíme se odhadnout/ predikovat nějaké číslo (např. prodejní cena ojetého auta s toto konfigurací bude 123.500 Kč).

Příklady na použití regrese: (Jupter Notebooky) *** link ***

Strojové učení bez učitele (Unsupervised Machine Learning)

Strojové učení bez učitele pomáhá odhalit skryté vzory v datech, která nebyla předem známá, ani žádným způsobem předem klasifikována. Protože zde postrádáme tréninkovou datovou sadu (není na čem trénovat, mnohdy ani nevíme, co přesně hledáme), probíhá učící workflow odlišným způsobem, než u klasifikačních a regresních problémů, jak je známe ze strojového učení s učitelem.

Hlavní techniky

Clustering

Clustering umožní algoritmicky rozdělit data na skupiny na základě jejich odhalené-naučené-vypočtené podobnosti.

Nové informace, které získáme např. pomocí clusteringu, lze pak použít jako doplňkovou vstupní hodnotu do modelu strojového učení s učitelem.

(clustering např. rozdělí skupinu zákazníků dle spotřebního chování na
iniciátora, ovlivňovatele, rozhodovatele, kupujícího a uživatele, a tyto kategorie pak doplní k datové sadě o spotřebiteli do modelu strojového učení s učitelem)

Asociační analýza

Algoritmy asociační analýzy umožní identifikovat sady hodnot, které se vyskytují ve vašem datovém souboru často pohromadě. Takto mohou např. obchodní řetězce optimalizovat obchodní strategie tím, že odhalí, které zboží je často prodáváno společně.

Detekce anomálií

Tyto techniky umožní odhalit nezvyklé hodnoty ve vašem datasetu. Tak lze odhalit například podvodné karetní transakce, chybný výrobek, nebo lidské chyby při vytváření dat.

Příklady na použití strojového učení bez učitele: (Jupter Notebooky) *** link ***

Reinforcement Learning

(coming  soon)