Zobrazit vše

Strojové učení nad velkými daty

Cílem tohoto kurzu je představit různé nástroje a koncepty ze strojového učení nad velkými daty.
Úroveň
Určeno účastníkům se základními znalostmi a zkušenostmi
středně pokročilý
Délka kurzu
1 den
Jazyk
 cz  eu
Kód kurzu
KT21010290
Machine learning
Kategorie:
Chcete tento kurz na míru pro vaši firmu? Kontaktujte nás

Kurzy s lektorem

Termín
Jazyk
Místo
Forma
?
Jak a kde kurz probíhá.
Cena bez DPH
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: KT21010290-0002
Cena bez DPH
4 990 Kč
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: KT21010290-0003
Cena bez DPH
4 990 Kč

Popis kurzu

Po dokončení tohoto kurzu by měli účastníci být schopni říct jaký nástroj použít pro daný problém, zjistit jestli neexistuje jednodušší řešení a znát časté chyby a umět se jim vyhnout. Speciální pozornost věnujeme Sparku jakožto univerzálnímu nástroji, který lze použít jak pro zpracování velkých dat, tak pro ML nad velkými daty.

Požadované znalosti

  • Základy práce v Pythonu a v nástroji Google Colab
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Obsah kurzu

  • Přehled konceptů a nástrojů ve zpracování velkých dat
    • Od malých k velkým datům a odhad jejich hodnoty
    • Řádkové a sloupcové databáze
    • HDFS (Hadoop Distributed File System)
    • Formáty dat – Parquet, ORC, Avro
    • Komprese – gzip, snappy, zstd
    • SQL databáze – BigQuery, Redshift, Clickhouse, Snowflake, Vertica
  • Praktický příklad na srovnání malých a velkých dat
  • Úvod do Sparku
    • MapReduce
    • Spark Computing Engine a RDDs (Resilient Distributed Datasets)
    • DataFrames
    • Spark ekosystém
    • Nejčastější chyby
    • Kde pustit Spark
    • Alternativy – Apache Beam (Dataflow), Dask, lambdas
  • Praktický příklad se Sparkem
  • ML strategie pro velká data
    • Inkrementální učení
    • Dávkové učení pro neuronové sítě
    • Distribuované trénování
    • Federated learning
    • Alternativní strategie
      • Náhodné vzorkování
      • Podmodely
      • Větší výpočetní kapacity
  • Frameworky
    • Scikit-learn a partial_fit
    • MLlib
    • Dask-ML
  • Praktické příklady s frameworky
  • Nejčastějsí chyby

Lektoři

Mojmír Vinkler
Mojmír Vinkler

S daty poprvé začal pracovat už před deseti lety, během kterých stál u vývoje ML projektů od jejich návrhu, přes implementaci až po vytváření hodnoty, a to v různých odvětvích jako je healthcare, fintech nebo marketing. V současné době dělá jako ML engineer konzultanta US startupům.

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
Soft skills 18. 11. 2025
Dotační výzva 083 - na podnikové vzdělávání

Ušetřete statisíce na vzdělávání zaměstnanců. Získejte přístup k dotační příležitosti na firemní vzdělávání pro rok 2026 až 2027. Poradíme Vám, jak na to.

Náhledový obrázek novinky
CompTIA 16. 1. 2025
8 pravidel, jak si užít online kurz a získat maximum z investice do školení

Pokud jste investovali do online kurzu s lektorem, je přirozené chtít z něj vytěžit co nejvíc. Sepsali jsme pravidla, která vám pomohou získat maximum z vašeho vzdělávacího zážitku.

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Předchozí kurzy

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
Soft skills 18. 11. 2025
Dotační výzva 083 - na podnikové vzdělávání

Ušetřete statisíce na vzdělávání zaměstnanců. Získejte přístup k dotační příležitosti na firemní vzdělávání pro rok 2026 až 2027. Poradíme Vám, jak na to.

Náhledový obrázek novinky
CompTIA 16. 1. 2025
8 pravidel, jak si užít online kurz a získat maximum z investice do školení

Pokud jste investovali do online kurzu s lektorem, je přirozené chtít z něj vytěžit co nejvíc. Sepsali jsme pravidla, která vám pomohou získat maximum z vašeho vzdělávacího zážitku.

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Proč s námi