Zobrazit vše

Strojové učení nad velkými daty

Cílem tohoto kurzu je představit různé nástroje a koncepty ze strojového učení nad velkými daty.
Úroveň
Určeno účastníkům se základními znalostmi a zkušenostmi
středně pokročilý
Délka kurzu
1 den
Jazyk
 cz  eu
Kód kurzu
KT21010290
Machine learning
Kategorie:
Chcete tento kurz na míru pro vaši firmu? Kontaktujte nás

Kurzy s lektorem

Termín
Jazyk
Místo
Forma
?
Jak a kde kurz probíhá.
Cena bez DPH
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: KT21010290-0002
Cena bez DPH
4 990 Kč
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: KT21010290-0003
Cena bez DPH
4 990 Kč

Popis kurzu

Po dokončení tohoto kurzu by měli účastníci být schopni říct jaký nástroj použít pro daný problém, zjistit jestli neexistuje jednodušší řešení a znát časté chyby a umět se jim vyhnout. Speciální pozornost věnujeme Sparku jakožto univerzálnímu nástroji, který lze použít jak pro zpracování velkých dat, tak pro ML nad velkými daty.

Požadované znalosti

  • Základy práce v Pythonu a v nástroji Google Colab
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Obsah kurzu

  • Přehled konceptů a nástrojů ve zpracování velkých dat
    • Od malých k velkým datům a odhad jejich hodnoty
    • Řádkové a sloupcové databáze
    • HDFS (Hadoop Distributed File System)
    • Formáty dat – Parquet, ORC, Avro
    • Komprese – gzip, snappy, zstd
    • SQL databáze – BigQuery, Redshift, Clickhouse, Snowflake, Vertica
  • Praktický příklad na srovnání malých a velkých dat
  • Úvod do Sparku
    • MapReduce
    • Spark Computing Engine a RDDs (Resilient Distributed Datasets)
    • DataFrames
    • Spark ekosystém
    • Nejčastější chyby
    • Kde pustit Spark
    • Alternativy – Apache Beam (Dataflow), Dask, lambdas
  • Praktický příklad se Sparkem
  • ML strategie pro velká data
    • Inkrementální učení
    • Dávkové učení pro neuronové sítě
    • Distribuované trénování
    • Federated learning
    • Alternativní strategie
      • Náhodné vzorkování
      • Podmodely
      • Větší výpočetní kapacity
  • Frameworky
    • Scikit-learn a partial_fit
    • MLlib
    • Dask-ML
  • Praktické příklady s frameworky
  • Nejčastějsí chyby

Lektoři

Mojmír Vinkler
Mojmír Vinkler

S daty poprvé začal pracovat už před deseti lety, během kterých stál u vývoje ML projektů od jejich návrhu, přes implementaci až po vytváření hodnoty, a to v různých odvětvích jako je healthcare, fintech nebo marketing. V současné době dělá jako ML engineer konzultanta US startupům.

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
CompTIA 16. 1. 2025
8 pravidel, jak si užít online kurz a získat maximum z investice do školení

Pokud jste investovali do online kurzu s lektorem, je přirozené chtít z něj vytěžit co nejvíc. Sepsali jsme pravidla, která vám pomohou získat maximum z vašeho vzdělávacího zážitku.

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Náhledový obrázek novinky
Microsoft 365 15. 8. 2024
DIGI pro firmu: Ukázkové kalkulace a nejčastější dotazy

Vzdělávání zaměstnanců je díky rostoucí digitalizaci klíčové. Jak ho ale efektivně financovat? Program DIGI pro firmu nabízí příležitost, jak získat dotace na IT kurzy a ušetřit tak firemní rozpočet. Pojďme se podívat na ukázkové kalkulace a nejčastější otázky, se kterými se setkáváme.

Předchozí kurzy

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
CompTIA 16. 1. 2025
8 pravidel, jak si užít online kurz a získat maximum z investice do školení

Pokud jste investovali do online kurzu s lektorem, je přirozené chtít z něj vytěžit co nejvíc. Sepsali jsme pravidla, která vám pomohou získat maximum z vašeho vzdělávacího zážitku.

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Náhledový obrázek novinky
Microsoft 365 15. 8. 2024
DIGI pro firmu: Ukázkové kalkulace a nejčastější dotazy

Vzdělávání zaměstnanců je díky rostoucí digitalizaci klíčové. Jak ho ale efektivně financovat? Program DIGI pro firmu nabízí příležitost, jak získat dotace na IT kurzy a ušetřit tak firemní rozpočet. Pojďme se podívat na ukázkové kalkulace a nejčastější otázky, se kterými se setkáváme.

Proč s námi