Márciusi adatos konferenciák és események

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

WiDS Stanford 2024
2024. március 8. A Women in Data Science közösség konferenciája Stanfordban, amelyet online is közvetítenek majd.
widsworldwide.org/events

UnWrapped
2024. március 14-15. A Datawrapper adatvizualizációs szoftver felhasználóinak szóló ingyenes online konferencia.
datawrapper.de

DATA Festival
2024. március 19-20.  A BARC adatos konferenciája Münchenben.
barc.com/de/events

SQLBits 2024
2024. március 19-23. A SQLBits éves konferenciája Angliában, amelyhez online jegyek is elérhetőek.
sqlbits.com

WiDS Budapest 2024
2024. március 21. A Women in Data Science budapesti eseménye.
widsbudapest.com

MDS FEST 2.0
2024. március 25-29. Ötnapos online konferencia adatos szakemberek számára, a részvétel ingyenes.
mdsfest.com

Budapesti meetup események

2024-es rendezvénynaptárunk

Februári konferenciák és események

Havi összefoglalónk az adatos szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

Meetup események

2024-es rendezvénynaptárunk

A Snowflake 2023-as éve

A vezető adatplatformokról szóló sorozatunk első részében a Snowflake tavalyi évének legfontosabb eseményeit foglaljuk össze.

A Snowflake az újgenerációs, felhőben született adatplatformok egyik vezető képviselője, amely egy évtized alatt az adatos világ fontos szereplője lett. Működését és belső felépítését tekintve viszonylag hasonló a hagyományos adattárházas adatbáziskezelőkhöz, így a felhő felé forduló szakemberek számára könnyen érthető és kezelhető megoldást kínál.

A cég évente több alkalommal tart olyan rendezvényeket, ahol a platformhoz érkező újdonságokat jelenti be. Az egyik ilyen alkalom a júniusi Data Cloud Summit, ami egyben a cég éves felhasználói konferenciája is, a másik a novemberi Snowday virtuális esemény. A két konferencián összesen több tucatnyi újdonságot jelentettek be főleg a központi adatplatform, a natív alkalmazásfejlesztés és a data science/ML területekre fókuszálva.

Adatplatform újdonságok

Az adatmenedzsment és az adattárházas lekérdezések gyors és költséghatékony kiszolgálása továbbra is fontos cél a Snowflake számára, ennek érdekében folyamatosan fejleszti ezeket a funkciókat is.

Egységesített Iceberg támogatás

A Snowflake alapesetben saját belső, zárt formátumában tárolja az adatokat. Az utóbbi években azonban egyre népszerűbbé váltak a nyílt táblaformátumok, amelyek közül a Snowflake az Iceberget támogatja.

Az idei fejlesztéseknek köszönhetően az Iceberg táblák lekérdezése egységesebb és gyorsabb lesz, a metaadat-kezelésre pedig többféle adatkatalógus is használható lesz. A más technológiákat is használó cégek számára pedig az is fontos, hogy Apache Spark környezetből úgy is el lehet érni a Snowflake által menedzselt Iceberg táblákat, hogy nem kell közben a Snowflake compute erőforrásokért is fizetni.

Dinamikus streaming táblák

A még bétában lévő Dynamic Tables lehetővé teszi majd, hogy egyszerű SQL utasításokkal lehessen dinamikus táblákat definiálni, amelyek adattartalma automatikus frissül a források változása esetén. Megadható az is, hogy az egyes tábláknál mennyi késés (lag) az elfogadható, így szabályozható, hogy milyen sűrűn történjen az automatikus frissítés. A beépített algoritmus arra is figyel, hogy lehetőleg csak a ténylegesen új vagy megváltozott forrásadatok kerüljenek feldolgozásra.

Jobb költségmenedzsment

A Snowflake kritikusai leggyakrabban azt a problémát szokták említeni, hogy a platform költségei könnyen magasra szökhetnek. Ezt a problémát célozza a jelenleg fejlesztés alatt álló új Cost Management Interface, ami majd lehetővé teszi a költségek elemi, akár objektum szintű követését és általános vagy egyedi limitek beállítását, valamint költségcsökkentési ajánlásokat is ad.

Data Governance

A platform Data Governance megoldása a Snowflake Horizon, amely olyan újdonságokkal fog bővülni, mint az érzékeny személyes adatok biztonságosabb elemzését lehetővé tévő Differencial Privacy funkcionalitás. Említésre érdemes még a jelenleg zárt bétában lévő Data Quality Monitoring funkció és az Data Lineage UI is.

AI és ML újdonságok

A Data Science jellegű alkalmazások kiemelten fontosak a Snowflake számára, már csak azért is, mert ezen a területen a legnagyobb vetélytársnak számító Databricks jóval előrébb jár.

Document AI

A júniusi konferencián bejelentett LLM alapú megoldás a szöveges dokumentumok feldolgozásában segít. A Document AI a 2022-ben felvásárolt Applica.ai TILT modelljére épül, amely különösen jól használható üzleti dokumentumok feldolgozására (archív poszt 1 és poszt 2). A szoftver működéséről további érdekes részleteket a Snowflake termékmenedzserének blogposztjában lehet olvasni.

Snowflake Cortex

A novemberi Snowday-en aztán bejelentették a Cortexet, amely egy központi menedzselt szolgáltatás ML és LLM fejlesztésekhez.

A Cortex keretein belül a Document AI mellett a következő szolgáltatások lesznek elérhetőek:

  • Snowflake Copilot: SQL lekérdezések generálása szöveges parancsokkal
  • Universal Search: LLM alapú adat- és metaadat-kereső, amely segít megtalálni az éppen kellő adatbázis objektumokat vagy alkalmazásokat

A fenti LLM-alapú megoldások mellett a Cortex részeként számos önállóan is használható ML funkció is érkezik majd, többek között lesz szövegösszesítés, szentimentdetektálás és fordítás is. A hagyományosabb ML problémák megoldására pedig forecasting és anomáliadetektálási modellek is rendelkezésre állnak.

Data science és ML támogatás

A Snowflake a Cortex mellett számos további data science eszközön is dolgozik:

  • Snowflake Notebooks: A közkedvelt notebook-alapú felhasználó interfész natív változata, amely képes Python és SQL kódokat futtatni.
  • Snowpark ML Modeling API: Lehetővé teszi a népszerű scikit-learn keretrendszerhez hasonló Python ML funkciók rendszeren belüli futtatását, így nem kell az adatokat kliens oldalra áttölteni.
  • Snowpark Model Registry: Az ML modellek adminisztációját segítő, júniusban bejelentett szolgáltatás egyelőre zártkörű bétában van, a részletekről itt lehet olvasni.
  • Snowflake Feature Store: Az ML modellek által használt számított mezők központi tárolására szolgál. A különböző objektumokat SQL nyelvű interfészeken keresztül lehet létrehozni és menedzselni, de emellett Python API is rendelkezésre áll majd.

A fenti komponensek nagy része még fejlesztés alatt áll vagy zártkörű bétában van, de az már látszik, hogy egy valóban teljes körű data science és ML platform van készülőfélben.

Adatnatív alkalmazások

A Snowflake egyik legérdekesebb stratégiai fejlesztési iránya az adatnatív alkalmazások közvetlen támogatása. A 2022-ben élesedett Snowpark már lehetővé tette, hogy a hagyományos SQL mellett Java és Scala vagy akár Python nyelven írt alkalmazások fussanak közvetlenül a Snowflake felhőjében. Ennek a megközelítések nagy előnye, hogy adatokat nem kell mozgatni, így nincsenek ingress/egress költségek, valamint az architektúra egésze a Snowflake központi jogosultságkezelése alá tartozik.

Konténerek támogatása

A 2023-as év nagy dobása ezen a területen a Snowpark Container Services, amely egy Kubernetes alapú, szintén teljesen integrált, "belső" konténerszolgáltatás.

A december vége óta publikus bétában elérhető SPCS segítségével gyakorlatilag bármilyen alkalmazást lehet a Snowflake felhőben futtatni, ideértve például a GPU-kat is használó LLM modelleket.

Az adatplatformba natívan integrált konténerek előnyeiről jó áttekintést ad ez a blogposzt, a mélyebb technikai részletekről pedig itt lehet még olvasni.

További lehetőségek

Szintén az adatplatformba integrált hagyományos alkalmazások fejlesztését fogja segíteni a 2022-ben bejelentett Unistore, amely lehetővé teszi majd a tranzakciós és analitikus adatok egységes kezelését. A még fejlesztés alatt álló hibrid táblák oszlopalapú és soralapú tárolási technikákat is alkalmaznak, így a Snowflake OLTP jellegű feladatokra is használható lesz.

A frontendre fókuszáló fejlesztéseket pedig a két éve akvirált Streamlit könnyíti meg, amely immár a Snowflake platformjába integráltan, natív módon futtatható. Szintén a fejlesztők munkáját segíti majd a hamarosan érkező beépített Git támogatás és a parancssoros működést támogató Snowflake CLI is.

Pénzügyi eredmények és akvizíciók

A Snowflake 2020 őszén nagy port kavart fel nyilvános tőzsdei részvénykibocsátásával (IPO). Az árfolyam az első napokban rendkívül magas volt, de azóta már jóval alacsonyabb tartományokban mozog. A cég folyamatosan növekszik, de továbbra is jelentős éves veszteséget termel.

Felvásárlások

A Snowflake továbbra is nagyon aktív az akvizíciós piacon, csak 2023-ban kilenc kisebb-nagyobb felvásárlást hajtott végre. A bekebelezett cégek listája:

  • Myst AI: Idősoros előrejelzések
  • SnowConvert: Adatmigráció felhős környezetbe
  • LeapYear: Differencial Privacy megoldások
  • Neeva: Generatív AI alapú keresés
  • Touk.pl: Fejlesztői kapacitás Lengyelországban
  • Nxyz: Blockchain technológiák
  • Ponder: Skálázható Python adatfeldolgozás
  • Sisu Data: Automatizált döntéstámogatás
  • Samooha: biztonságos adatmegosztás partnerekkel

Pénzügyi eredmények

A november végén megjelent legfrissebb negyedéves jelentés alapján a főbb pénzügyi mutatók így alakultak az idén:

  • A januárban véget érő pénzügyi év első 9 hónapjában az árbevétel meghaladta a 2 milliárd dollárt, ami jelentős növekedés az előző évhez képest
  • A már szerződött, de még nem teljesített szolgáltatások (RPO, Remaining Performance Obligations) értéke 3.7 milliárd dollár
  • Az intenzív növekedés azonban továbbra is komoly veszteségekkel jár, az első kilenc hónap összesített számviteli (GAAP szerinti) vesztesége 668 millió dollár volt.

A befektetőknek szóló prezentációból az is kiderül, hogy a Snowflake bevételeinek túlnyomó többsége, nagyjából 80 százaléka az amerikai kontinensről származik, Európa aránya pedig csak 15%.

Adatkonferenciák 2024 elején

2024-ben is számos online és hibrid adatos esemény várja az érdeklődőket. Összeállításunkban az első negyedéves rendezvények közül válogattunk.

2024. január

Data Community Austria Day 2024
2024. január 25-26. A Data Community Austria kétnapos ingyenes konferenciája Bécsben.
sqlusergroupaustria.wordpress.com

SUPERWEEK 2024
2024. január 29. - február 2. Ötnapos adatos konferencia Egerszalókon.
superweek.hu

Data Vision 2024
2024. január 30. A hazai adatos vezetőknek szóló évindító üzleti reggeli Budapesten.
datavision.hu

2024. február

További 2024-es események

2023-as Gartner MQ a felhős adatbázisokról

A Gartner elemzésének friss kiadása a felhős adatbázisokat kínáló cégeket rangsorolja.

A vezetők

A vezetők szegmensének elején kapnak helyet a klasszikus RDBMS szállítók, mint az Oracle és a Microsoft és a meghatározó cloud platformok is, amelyek jellemzően több különböző adatbázismotort is kínálnak.

Az Amazon portfóliójában 15+ különféle adatbázis található, ezek közül az adattárházas világban továbbra is a Redshift a legfontosabb szereplő. A Google is hasonlóan széles termékpalettával rendelkezik, itt adattárházas téren a BigQuery a meghatározó.

A vezetők között szerepel továbbra is a két újgenerációs adatanalitika platform, a Snowflake és a Databricks is.

A mezőny többi szereplője

A Vizionáriusok szegmensbe került a tavaly még a vezetők között szereplő SAP-IBM-Teradata-Cloudera négyes, valamint itt szerepel a Redis és a Neo4j.

A Kihívók szegmensében egyetlen cég található, a multimodális IRIS adatbázist forgalmazó Intersystems.

A Résszereplők között kapott helyett az EnterpriseDB (új szereplő), a Yugabite (szintén), a CockroachLabs és a Couchbase.

Kikerült viszont az elemzésből a Progress (MarkLogic), a Tencent Cloud és a TigerGraph, mert a Gartner által számított Vásárlói érdeklődési indexben (Customer Interest Index) nem voltak a legjobb 20 között.

A teljes elemzés elérhető többek között a Google és a Databricks oldalán (regisztráció szükséges).

4,4 milliárd dollárért magánkézbe kerül az Alteryx

Két tőkealap felvásárolja a tőzsdén forgalmazott Alteryx részvényeit, így a low-code, vizuális adatfeldolgozó- és elemzőplatformjáról ismert cég a jövőben ismét magánvállalat lesz.

A felvásárlás 48.25 dolláros árfolyamon történik, ami több mint 50%-os felár a szeptember elejei árazáshoz képest. A részvények 28-30 dollár körül mozogtak egy ideje, amikor a médiában megjelentek az első hírek egy potenciális felvásárlásról.

A 48 dolláros felvásárlási ár azonban csak a kora őszi árazáshoz képest kedvező, mert az Alteryx 2023-ban forgott 70 dollár körül is, az abszolút csúcs pedig 2020-ban közel 180 dollár volt.

A piacon szerényebben teljesítő cégek tőkealapok általi felvásárlása nem szokatlan, így például tőzsdei cégből magánvállalat lett a Qlik is.

Adatkonferenciák decemberben

2023. decemberi események

→ Rendezvénynaptár 2023. II. félév

Amazon S3 Express

Az Amazon új tárolószolgáltatást jelentett be a Re:Invent 2023konferencián, amely különösen az adatprojektek számára lehet érdekes.

Az S3 Express (teljes nevén S3 Express Zone One) egy újfajta tárolási egységet (directory storage bucket) használ, amely akár tízszer gyorsabb a hagyományos S3 sebességénél. Az új szolgáltatást nagy terhelésekre tervezték, így másodpercenként több százezer lekérdezést is ki tud szolgálni.

A S3 Express esetében meg lehet adni azt is, hogy melyik rendelkezésre állási zónát szeretnénk használni, így az adatok fizikailag is közel kerülhetnek a számításokat végző szerverekhez.

Az Amazon saját oldala többek között a SageMaker ML modelleket, az Athena SQL motort és a Glue adatkatalógust említi példaként arra, hogy milyen más AWS szolgáltatások profitálhatnak majd az új tárolási módból.

Hab a tortán, hogy az S3 Express árazása is kedvező, a hagyományos S3 szolgáltatásoknál akár 50 százalékkal is olcsóbb lehet.

Adatkonferenciák október-novemberben

2023. október

Microsoft Power Platform Conference
2023. október 1-6. A Microsoft Power Platformról szóló nemzetközi konferencia Las Vegasban. Konferencia belépőjegyek 1899 dollártól kaphatók.
powerplatformconf.com

Compass Tech Summit 2023
2023. október 5-6. Data Engineering és Data science konferencia Budapesten, melynek keretében kerül megtartásra idén a Crunch Conference és a Reinforce AI Conference. Online jegyek 220 eurótól, személyes Late Bird jegyek 855 eurótól kaphatók.
crafthub/compass-tech-summit-2023

ITBN Conf-Expo 2023
2023. október 11-12. Informatikai biztonság és AI kapcsolatáról szóló konferencia és expó Budapesten, külön Business AI színpaddal. A belépés ingyenes.
www.itbn.hu/konferencia/2023

Coalesce 2023
2023. október 16-19. A dbt Labs data engineering konferenciája, mely alapvetően online, egyes városokban ((San Diego, London, Sydney) azonban élőben is zajlik. Az online részvétel ingyenes.
coalesce.getdbt.com

Digital Cube Conf
2023. október 26-27. Analitika, PPC és SEO konferencia Budapesten. Egynapos konferencia jegyek 59.990 Ft + áfa, konferencia + workshop jegyek 99.990 Ft + áfa áron érhetők el.
digitalcubeconf.com

2023. november

PASS Data Community Summit
2023. november 13-17. Microsoft fókuszú adatos megakonferencia Seattle-ben.
passdatacommunitysummit.com

2023 Forbes Tech Summit
2023. november 16. A Forbes AI trendeket is érintő konferenciája Budapesten. Super early bird jegyek 20.900 Ft-os áron kaphatók.
forbes.hu/esemenyek

Dyntell NEXT 2023
2023. november 16-17. Konferencia a mesterséges intelligencia cégvezetésben betöltött szerepéről.
dyntellnext.hu

Budapest BI Fórum
2023. november 20-22. Üzleti intelligencia, adatvizualizációs és adatanalitikai hibrid konferencia.
budapestbi.hu/2023/hu

DSC Europe 23
2023. november 20-24. Nemzetközi AI- és adatkonferencia Belgrádban.
datasciconference.com

Information+ Conference 2023
2023. november 22-24. Adatvizualizációval foglalkozó nemzetközi konferencia Edinburgh-ben.
informationplusconference.com/2023

AWS re:Invent 2023
2023. november 27 - december 1. Az Amazon Web Services konferenciája Las Vegasban, a full conference pass ára 2099 dollár.
reinvent.awsevents.com

→ Rendezvénynaptár 2023. II. félév

Adatkonferenciák augusztus-szeptemberben

2023. augusztus

MDS Fest 2023
2023. augusztus 21-25. Ötnapos online konferencia adatos szakemberek számára, a részvétel ingyenes.
mdsfest.com

2023. szeptember

SAP NOW HU 2023
2023. szeptember 10-12. Konferencia a vállalati informatika területéről, az esemény Siófokon kerül megrendezésre.
events.sap.com/hu/sap-now-2023

AI Summit 2023
2023. szeptember 11. Az AI üzleti életre, a társadalomra és az iparágakra gyakorolt hatásáról szóló konferencia Budapesten. Az early bird belépőjegyek 79 ezer forintért érhetők el.
aisummit.hu

Dreamforce 2023
2023. szeptember 12-14. A Salesforce felhasználói konferenciája San Franciscoban, az online részvétel ingyenes.
salesforce.com/dreamforce

PyData Amsterdam 2023
2023. szeptember 14-16. Háromnapos nemzetközi konferencia Amszterdamban, diákjegyek 200 eurótól kaphatók, egyéni bérlet 420 eurótól elérhető.
amsterdam.pydata.org

PyCon CZ 23
2023. szeptember 15-17. Pythonos adatkonferencia Prágában. Belépőjegyek 2200 koronától, diákok számára 900 koronától kaphatók.
cz.pycon.org/2023

Ray Summit 2023
2023. szeptember 18-19. Ray konferencia  San Franciscoban az Anyscale szervezésében. Belépőjegy 399 dollártól érhető el.
raysummit.anyscale.com

Big Data LDN 2023
2023. szeptember 20-21. Kétnapos adat és analitika konferencia Londonban. A részvétel ingyenes.
bigdataldn.com

Data Careers Summit
2023. szeptember 22. Párórás ingyenes online esemény a data karrier világáról.
datacareerssummit.com

→ Rendezvénynaptár 2023. II. félév