Category Archives: Adatblog

Májusi adatos rendezények

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

Viz.fo
2024. május 2-3. Power BI konferencia a Feröer-szigeteken.
viz.fo

Real-Time Analytics Summit 2024
2024. május 7-9. A StarTree által szervezett konferencia a valós idejű adatelemzésről.
rtasummit.com

Eurasian Dataviz Conference
2024. május 10. Online nemzetközi adatvizualizációs konferencia.
data-2-speak.com/conference

Gartner Data & Analytics Summit
2024. május 13-15. A Gartner adatvezetőknek szóló konferenciája londoni konferenciája.
gartner.com

Power BI Fesztivál
2024. május 14. Egész napos konferencia a Power BI felhasználóknak.
powerbifesztival.hu

DataStream
2024. május 14. A Clementine Consulting MI konferenciája.
clementine.hu

Re:Govern
2024. május 14. Az Atlan online Data és AI governance konferenciája
atlan.com/regovern

Iceberg Summit
2024. május 14-15. A Tabular online konferenciája az Iceberg nyílt táblaformátumról.
iceberg-summit.org

36. Budapest Menedzsment és Controlling Fórum
2024. május 30. Az IFUA Horváth éves konferenciája gazdasági és elemzési szakembereknek.
conf-bmcf.horvath-partners.com

Budapesti adatos meetupok

2024-es teljes rendezvénynaptárunk

Áprilisi adatkonferenciák és meetupok

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

Big Data Technology Warsaw Summit
2024. április 10-11. Adatos konferencia technikai fókuszú előadásokkal Varsóban.
bigdatatechwarsaw.eu

MDS FEST 2.0
2024. Április 8-12. Ötnapos online konferencia adatos szakemberek számára, a részvétel ingyenes.
mdsfest.com

Smart
2024. április 17. Az IVSZ IT és digitalizációs konferenciája az Akvárium klubban.
ivsz.hu

Machine Learning Prague
2024. április 22-24. Háromnapos hibrid rendezvény Prágában ML és AI szakembereknek.
mlprague.com

PyCon.DE & PyData Berlin
2024. április 22-24. Háromnapos konferencia a Python iránt érdeklődőknek.
2024.pycon.de

AI in Business
2024. május 23. A Portfólio AI témájú konferenciája a Marriot hotelben.
www.portfolio.hu

WWDVC
2024. április 28-május 3. A World Wide Data Vault Consortium éves konferenciája.
wwdvc.com

Tableau Conference
2024. április 29-május 1. A Salesforce Tableau konferenciája, amely online ingyenesen követhető.
salesforce.com/tableau-conference

Meetup események Budapesten

04.09: AI and Big Data - Tech Meetup
04.09: Gyorsítósáv az üzleti növekedéshez AI-alapú megoldásokkal
04.09: Switching to KNIME for automation - Data Connect: Budapest
04.16 bioinfoRmatics v2 
04.23 Budapest MLOps meetup
04.23 Budapest Power BI Meetup #10 @ Morgan Stanley
04.24 Budapest ML Meetup #3
04.25 Open NLP meetup Reboot
04.25 SQL alapok x Python 

2024-es rendezvénynaptárunk

Márciusi adatos konferenciák és események

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

WiDS Stanford 2024
2024. március 8. A Women in Data Science közösség konferenciája Stanfordban, amelyet online is közvetítenek majd.
widsworldwide.org/events

UnWrapped
2024. március 14-15. A Datawrapper adatvizualizációs szoftver felhasználóinak szóló ingyenes online konferencia.
datawrapper.de

DATA Festival
2024. március 19-20.  A BARC adatos konferenciája Münchenben.
barc.com/de/events

SQLBits 2024
2024. március 19-23. A SQLBits éves konferenciája Angliában, amelyhez online jegyek is elérhetőek.
sqlbits.com

WiDS Budapest 2024
2024. március 21. A Women in Data Science budapesti eseménye.
widsbudapest.com

MDS FEST 2.0
2024. március 25-29. Ötnapos online konferencia adatos szakemberek számára, a részvétel ingyenes.
mdsfest.com

Budapesti meetup események

2024-es rendezvénynaptárunk

Februári konferenciák és események

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

Data Toboggan
2024. február 3. Ingyenes online konferencia Microsoft Power BI és Fabric témákról.
datatoboggan.co.uk

Fabric February 2024
2024. február 7-9. Microsoft Fabric témájú konferencia Osloban.
fabricfebruary.com

Global Power BI & Fabric Summit
2024. február 12-16. Egyhetes online konferencia a Microsoft adatos technológiáiról.  A részvétel 145 euróba kerül.
globalpowerbisummit.com

Meetup események

2024-es rendezvénynaptárunk

A Snowflake 2023-as éve

A vezető adatplatformokról szóló sorozatunkban a Snowflake tavalyi évének legfontosabb eseményeit foglaljuk össze.

A Snowflake az újgenerációs, felhőben született adatplatformok egyik vezető képviselője, amely egy évtized alatt az adatos világ fontos szereplője lett. Működését és belső felépítését tekintve viszonylag hasonló a hagyományos adattárházas adatbáziskezelőkhöz, így a felhő felé forduló szakemberek számára könnyen érthető és kezelhető megoldást kínál.

A cég évente több alkalommal tart olyan rendezvényeket, ahol a platformhoz érkező újdonságokat jelenti be. Az egyik ilyen alkalom a júniusi Data Cloud Summit, ami egyben a cég éves felhasználói konferenciája is, a másik a novemberi Snowday virtuális esemény. A két konferencián összesen több tucatnyi újdonságot jelentettek be főleg a központi adatplatform, a natív alkalmazásfejlesztés és a data science/ML területekre fókuszálva.

Adatplatform újdonságok

Az adatmenedzsment és az adattárházas lekérdezések gyors és költséghatékony kiszolgálása továbbra is fontos cél a Snowflake számára, ennek érdekében folyamatosan fejleszti ezeket a funkciókat is.

Egységesített Iceberg támogatás

A Snowflake alapesetben saját belső, zárt formátumában tárolja az adatokat. Az utóbbi években azonban egyre népszerűbbé váltak a nyílt táblaformátumok, amelyek közül a Snowflake az Iceberget támogatja.

Az idei fejlesztéseknek köszönhetően az Iceberg táblák lekérdezése egységesebb és gyorsabb lesz, a metaadat-kezelésre pedig többféle adatkatalógus is használható lesz. A más technológiákat is használó cégek számára pedig az is fontos, hogy Apache Spark környezetből úgy is el lehet érni a Snowflake által menedzselt Iceberg táblákat, hogy nem kell közben a Snowflake compute erőforrásokért is fizetni.

Dinamikus streaming táblák

A még bétában lévő Dynamic Tables lehetővé teszi majd, hogy egyszerű SQL utasításokkal lehessen dinamikus táblákat definiálni, amelyek adattartalma automatikus frissül a források változása esetén. Megadható az is, hogy az egyes tábláknál mennyi késés (lag) az elfogadható, így szabályozható, hogy milyen sűrűn történjen az automatikus frissítés. A beépített algoritmus arra is figyel, hogy lehetőleg csak a ténylegesen új vagy megváltozott forrásadatok kerüljenek feldolgozásra.

Jobb költségmenedzsment

A Snowflake kritikusai leggyakrabban azt a problémát szokták említeni, hogy a platform költségei könnyen magasra szökhetnek. Ezt a problémát célozza a jelenleg fejlesztés alatt álló új Cost Management Interface, ami majd lehetővé teszi a költségek elemi, akár objektum szintű követését és általános vagy egyedi limitek beállítását, valamint költségcsökkentési ajánlásokat is ad.

Data Governance

A platform Data Governance megoldása a Snowflake Horizon, amely olyan újdonságokkal fog bővülni, mint az érzékeny személyes adatok biztonságosabb elemzését lehetővé tévő Differencial Privacy funkcionalitás. Említésre érdemes még a jelenleg zárt bétában lévő Data Quality Monitoring funkció és az Data Lineage UI is.

AI és ML újdonságok

A Data Science jellegű alkalmazások kiemelten fontosak a Snowflake számára, már csak azért is, mert ezen a területen a legnagyobb vetélytársnak számító Databricks jóval előrébb jár.

Document AI

A júniusi konferencián bejelentett LLM alapú megoldás a szöveges dokumentumok feldolgozásában segít. A Document AI a 2022-ben felvásárolt Applica.ai TILT modelljére épül, amely különösen jól használható üzleti dokumentumok feldolgozására (archív poszt 1 és poszt 2). A szoftver működéséről további érdekes részleteket a Snowflake termékmenedzserének blogposztjában lehet olvasni.

Snowflake Cortex

A novemberi Snowday-en aztán bejelentették a Cortexet, amely egy központi menedzselt szolgáltatás ML és LLM fejlesztésekhez.

A Cortex keretein belül a Document AI mellett a következő szolgáltatások lesznek elérhetőek:

  • Snowflake Copilot: SQL lekérdezések generálása szöveges parancsokkal
  • Universal Search: LLM alapú adat- és metaadat-kereső, amely segít megtalálni az éppen kellő adatbázis objektumokat vagy alkalmazásokat

A fenti LLM-alapú megoldások mellett a Cortex részeként számos önállóan is használható ML funkció is érkezik majd, többek között lesz szövegösszesítés, szentimentdetektálás és fordítás is. A hagyományosabb ML problémák megoldására pedig forecasting és anomáliadetektálási modellek is rendelkezésre állnak.

Data science és ML támogatás

A Snowflake a Cortex mellett számos további data science eszközön is dolgozik:

  • Snowflake Notebooks: A közkedvelt notebook-alapú felhasználó interfész natív változata, amely képes Python és SQL kódokat futtatni.
  • Snowpark ML Modeling API: Lehetővé teszi a népszerű scikit-learn keretrendszerhez hasonló Python ML funkciók rendszeren belüli futtatását, így nem kell az adatokat kliens oldalra áttölteni.
  • Snowpark Model Registry: Az ML modellek adminisztációját segítő, júniusban bejelentett szolgáltatás egyelőre zártkörű bétában van, a részletekről itt lehet olvasni.
  • Snowflake Feature Store: Az ML modellek által használt számított mezők központi tárolására szolgál. A különböző objektumokat SQL nyelvű interfészeken keresztül lehet létrehozni és menedzselni, de emellett Python API is rendelkezésre áll majd.

A fenti komponensek nagy része még fejlesztés alatt áll vagy zártkörű bétában van, de az már látszik, hogy egy valóban teljes körű data science és ML platform van készülőfélben.

Adatnatív alkalmazások

A Snowflake egyik legérdekesebb stratégiai fejlesztési iránya az adatnatív alkalmazások közvetlen támogatása. A 2022-ben élesedett Snowpark már lehetővé tette, hogy a hagyományos SQL mellett Java és Scala vagy akár Python nyelven írt alkalmazások fussanak közvetlenül a Snowflake felhőjében. Ennek a megközelítések nagy előnye, hogy adatokat nem kell mozgatni, így nincsenek ingress/egress költségek, valamint az architektúra egésze a Snowflake központi jogosultságkezelése alá tartozik.

Konténerek támogatása

A 2023-as év nagy dobása ezen a területen a Snowpark Container Services, amely egy Kubernetes alapú, szintén teljesen integrált, "belső" konténerszolgáltatás.

A december vége óta publikus bétában elérhető SPCS segítségével gyakorlatilag bármilyen alkalmazást lehet a Snowflake felhőben futtatni, ideértve például a GPU-kat is használó LLM modelleket.

Az adatplatformba natívan integrált konténerek előnyeiről jó áttekintést ad ez a blogposzt, a mélyebb technikai részletekről pedig itt lehet még olvasni.

További lehetőségek

Szintén az adatplatformba integrált hagyományos alkalmazások fejlesztését fogja segíteni a 2022-ben bejelentett Unistore, amely lehetővé teszi majd a tranzakciós és analitikus adatok egységes kezelését. A még fejlesztés alatt álló hibrid táblák oszlopalapú és soralapú tárolási technikákat is alkalmaznak, így a Snowflake OLTP jellegű feladatokra is használható lesz.

A frontendre fókuszáló fejlesztéseket pedig a két éve akvirált Streamlit könnyíti meg, amely immár a Snowflake platformjába integráltan, natív módon futtatható. Szintén a fejlesztők munkáját segíti majd a hamarosan érkező beépített Git támogatás és a parancssoros működést támogató Snowflake CLI is.

Pénzügyi eredmények és akvizíciók

A Snowflake 2020 őszén nagy port kavart fel nyilvános tőzsdei részvénykibocsátásával (IPO). Az árfolyam az első napokban rendkívül magas volt, de azóta már jóval alacsonyabb tartományokban mozog. A cég folyamatosan növekszik, de továbbra is jelentős éves veszteséget termel.

Felvásárlások

A Snowflake továbbra is nagyon aktív az akvizíciós piacon, csak 2023-ban kilenc kisebb-nagyobb felvásárlást hajtott végre. A bekebelezett cégek listája:

  • Myst AI: Idősoros előrejelzések
  • SnowConvert: Adatmigráció felhős környezetbe
  • LeapYear: Differencial Privacy megoldások
  • Neeva: Generatív AI alapú keresés
  • Touk.pl: Fejlesztői kapacitás Lengyelországban
  • Nxyz: Blockchain technológiák
  • Ponder: Skálázható Python adatfeldolgozás
  • Sisu Data: Automatizált döntéstámogatás
  • Samooha: biztonságos adatmegosztás partnerekkel

Pénzügyi eredmények

A november végén megjelent legfrissebb negyedéves jelentés alapján a főbb pénzügyi mutatók így alakultak az idén:

  • A januárban véget érő pénzügyi év első 9 hónapjában az árbevétel meghaladta a 2 milliárd dollárt, ami jelentős növekedés az előző évhez képest
  • A már szerződött, de még nem teljesített szolgáltatások (RPO, Remaining Performance Obligations) értéke 3.7 milliárd dollár
  • Az intenzív növekedés azonban továbbra is komoly veszteségekkel jár, az első kilenc hónap összesített számviteli (GAAP szerinti) vesztesége 668 millió dollár volt.

A befektetőknek szóló prezentációból az is kiderül, hogy a Snowflake bevételeinek túlnyomó többsége, nagyjából 80 százaléka az amerikai kontinensről származik, Európa aránya pedig csak 15%.

Adatkonferenciák 2024 elején

2024-ben is számos online és hibrid adatos esemény várja az érdeklődőket. Összeállításunkban az első negyedéves rendezvények közül válogattunk.

2024. január

Data Community Austria Day 2024
2024. január 25-26. A Data Community Austria kétnapos ingyenes konferenciája Bécsben.
sqlusergroupaustria.wordpress.com

SUPERWEEK 2024
2024. január 29. - február 2. Ötnapos adatos konferencia Egerszalókon.
superweek.hu

Data Vision 2024
2024. január 30. A hazai adatos vezetőknek szóló évindító üzleti reggeli Budapesten.
datavision.hu

2024. február

Data Toboggan
2024. február 3. Ingyenes online konferencia Microsoft Power BI és Fabric témákról.
datatoboggan.co.uk

Fabric February 2024
2024. február 7-9. Microsoft Fabric témájú konferencia Osloban.
fabricfebruary.com

Global Power BI & Fabric Summit
2024. február 12-16. Egyhetes online konferencia a Microsoft adatos technológiáiról.  A részvétel 145 euróba kerül.
globalpowerbisummit.com

További 2024-es események

2023-as Gartner MQ a felhős adatbázisokról

A Gartner elemzésének friss kiadása a felhős adatbázisokat kínáló cégeket rangsorolja.

A vezetők

A vezetők szegmensének elején kapnak helyet a klasszikus RDBMS szállítók, mint az Oracle és a Microsoft és a meghatározó cloud platformok is, amelyek jellemzően több különböző adatbázismotort is kínálnak.

Az Amazon portfóliójában 15+ különféle adatbázis található, ezek közül az adattárházas világban továbbra is a Redshift a legfontosabb szereplő. A Google is hasonlóan széles termékpalettával rendelkezik, itt adattárházas téren a BigQuery a meghatározó.

A vezetők között szerepel továbbra is a két újgenerációs adatanalitika platform, a Snowflake és a Databricks is.

A mezőny többi szereplője

A Vizionáriusok szegmensbe került a tavaly még a vezetők között szereplő SAP-IBM-Teradata-Cloudera négyes, valamint itt szerepel a Redis és a Neo4j.

A Kihívók szegmensében egyetlen cég található, a multimodális IRIS adatbázist forgalmazó Intersystems.

A Résszereplők között kapott helyett az EnterpriseDB (új szereplő), a Yugabite (szintén), a CockroachLabs és a Couchbase.

Kikerült viszont az elemzésből a Progress (MarkLogic), a Tencent Cloud és a TigerGraph, mert a Gartner által számított Vásárlói érdeklődési indexben (Customer Interest Index) nem voltak a legjobb 20 között.

A teljes elemzés elérhető többek között a Google és a Databricks oldalán (regisztráció szükséges).

4,4 milliárd dollárért magánkézbe kerül az Alteryx

Két tőkealap felvásárolja a tőzsdén forgalmazott Alteryx részvényeit, így a low-code, vizuális adatfeldolgozó- és elemzőplatformjáról ismert cég a jövőben ismét magánvállalat lesz.

A felvásárlás 48.25 dolláros árfolyamon történik, ami több mint 50%-os felár a szeptember elejei árazáshoz képest. A részvények 28-30 dollár körül mozogtak egy ideje, amikor a médiában megjelentek az első hírek egy potenciális felvásárlásról.

A 48 dolláros felvásárlási ár azonban csak a kora őszi árazáshoz képest kedvező, mert az Alteryx 2023-ban forgott 70 dollár körül is, az abszolút csúcs pedig 2020-ban közel 180 dollár volt.

A piacon szerényebben teljesítő cégek tőkealapok általi felvásárlása nem szokatlan, így például tőzsdei cégből magánvállalat lett a Qlik is.

Adatkonferenciák decemberben

2023. decemberi események

→ Rendezvénynaptár 2023. II. félév

Amazon S3 Express

Az Amazon új tárolószolgáltatást jelentett be a Re:Invent 2023konferencián, amely különösen az adatprojektek számára lehet érdekes.

Az S3 Express (teljes nevén S3 Express Zone One) egy újfajta tárolási egységet (directory storage bucket) használ, amely akár tízszer gyorsabb a hagyományos S3 sebességénél. Az új szolgáltatást nagy terhelésekre tervezték, így másodpercenként több százezer lekérdezést is ki tud szolgálni.

A S3 Express esetében meg lehet adni azt is, hogy melyik rendelkezésre állási zónát szeretnénk használni, így az adatok fizikailag is közel kerülhetnek a számításokat végző szerverekhez.

Az Amazon saját oldala többek között a SageMaker ML modelleket, az Athena SQL motort és a Glue adatkatalógust említi példaként arra, hogy milyen más AWS szolgáltatások profitálhatnak majd az új tárolási módból.

Hab a tortán, hogy az S3 Express árazása is kedvező, a hagyományos S3 szolgáltatásoknál akár 50 százalékkal is olcsóbb lehet.