Februári konferenciák és események

Havi összefoglalónk az adatok szakemberek számára releváns konferenciákról és meetupokról.

Adatkonferenciák

Data Toboggan
2024. február 3. Ingyenes online konferencia Microsoft Power BI és Fabric témákról.
datatoboggan.co.uk

Fabric February 2024
2024. február 7-9. Microsoft Fabric témájú konferencia Osloban.
fabricfebruary.com

Global Power BI & Fabric Summit
2024. február 12-16. Egyhetes online konferencia a Microsoft adatos technológiáiról.  A részvétel 145 euróba kerül.
globalpowerbisummit.com

Meetup események

2024-es rendezvénynaptárunk

A Snowflake 2023-as éve

A vezető adatplatformokról szóló sorozatunk első részében a Snowflake tavalyi évének legfontosabb eseményeit foglaljuk össze.

A Snowflake az újgenerációs, felhőben született adatplatformok egyik vezető képviselője, amely egy évtized alatt az adatos világ fontos szereplője lett. Működését és belső felépítését tekintve viszonylag hasonló a hagyományos adattárházas adatbáziskezelőkhöz, így a felhő felé forduló szakemberek számára könnyen érthető és kezelhető megoldást kínál.

A cég évente több alkalommal tart olyan rendezvényeket, ahol a platformhoz érkező újdonságokat jelenti be. Az egyik ilyen alkalom a júniusi Data Cloud Summit, ami egyben a cég éves felhasználói konferenciája is, a másik a novemberi Snowday virtuális esemény. A két konferencián összesen több tucatnyi újdonságot jelentettek be főleg a központi adatplatform, a natív alkalmazásfejlesztés és a data science/ML területekre fókuszálva.

Adatplatform újdonságok

Az adatmenedzsment és az adattárházas lekérdezések gyors és költséghatékony kiszolgálása továbbra is fontos cél a Snowflake számára, ennek érdekében folyamatosan fejleszti ezeket a funkciókat is.

Egységesített Iceberg támogatás

A Snowflake alapesetben saját belső, zárt formátumában tárolja az adatokat. Az utóbbi években azonban egyre népszerűbbé váltak a nyílt táblaformátumok, amelyek közül a Snowflake az Iceberget támogatja.

Az idei fejlesztéseknek köszönhetően az Iceberg táblák lekérdezése egységesebb és gyorsabb lesz, a metaadat-kezelésre pedig többféle adatkatalógus is használható lesz. A más technológiákat is használó cégek számára pedig az is fontos, hogy Apache Spark környezetből úgy is el lehet érni a Snowflake által menedzselt Iceberg táblákat, hogy nem kell közben a Snowflake compute erőforrásokért is fizetni.

Dinamikus streaming táblák

A még bétában lévő Dynamic Tables lehetővé teszi majd, hogy egyszerű SQL utasításokkal lehessen dinamikus táblákat definiálni, amelyek adattartalma automatikus frissül a források változása esetén. Megadható az is, hogy az egyes tábláknál mennyi késés (lag) az elfogadható, így szabályozható, hogy milyen sűrűn történjen az automatikus frissítés. A beépített algoritmus arra is figyel, hogy lehetőleg csak a ténylegesen új vagy megváltozott forrásadatok kerüljenek feldolgozásra.

Jobb költségmenedzsment

A Snowflake kritikusai leggyakrabban azt a problémát szokták említeni, hogy a platform költségei könnyen magasra szökhetnek. Ezt a problémát célozza a jelenleg fejlesztés alatt álló új Cost Management Interface, ami majd lehetővé teszi a költségek elemi, akár objektum szintű követését és általános vagy egyedi limitek beállítását, valamint költségcsökkentési ajánlásokat is ad.

Data Governance

A platform Data Governance megoldása a Snowflake Horizon, amely olyan újdonságokkal fog bővülni, mint az érzékeny személyes adatok biztonságosabb elemzését lehetővé tévő Differencial Privacy funkcionalitás. Említésre érdemes még a jelenleg zárt bétában lévő Data Quality Monitoring funkció és az Data Lineage UI is.

AI és ML újdonságok

A Data Science jellegű alkalmazások kiemelten fontosak a Snowflake számára, már csak azért is, mert ezen a területen a legnagyobb vetélytársnak számító Databricks jóval előrébb jár.

Document AI

A júniusi konferencián bejelentett LLM alapú megoldás a szöveges dokumentumok feldolgozásában segít. A Document AI a 2022-ben felvásárolt Applica.ai TILT modelljére épül, amely különösen jól használható üzleti dokumentumok feldolgozására (archív poszt 1 és poszt 2). A szoftver működéséről további érdekes részleteket a Snowflake termékmenedzserének blogposztjában lehet olvasni.

Snowflake Cortex

A novemberi Snowday-en aztán bejelentették a Cortexet, amely egy központi menedzselt szolgáltatás ML és LLM fejlesztésekhez.

A Cortex keretein belül a Document AI mellett a következő szolgáltatások lesznek elérhetőek:

  • Snowflake Copilot: SQL lekérdezések generálása szöveges parancsokkal
  • Universal Search: LLM alapú adat- és metaadat-kereső, amely segít megtalálni az éppen kellő adatbázis objektumokat vagy alkalmazásokat

A fenti LLM-alapú megoldások mellett a Cortex részeként számos önállóan is használható ML funkció is érkezik majd, többek között lesz szövegösszesítés, szentimentdetektálás és fordítás is. A hagyományosabb ML problémák megoldására pedig forecasting és anomáliadetektálási modellek is rendelkezésre állnak.

Data science és ML támogatás

A Snowflake a Cortex mellett számos további data science eszközön is dolgozik:

  • Snowflake Notebooks: A közkedvelt notebook-alapú felhasználó interfész natív változata, amely képes Python és SQL kódokat futtatni.
  • Snowpark ML Modeling API: Lehetővé teszi a népszerű scikit-learn keretrendszerhez hasonló Python ML funkciók rendszeren belüli futtatását, így nem kell az adatokat kliens oldalra áttölteni.
  • Snowpark Model Registry: Az ML modellek adminisztációját segítő, júniusban bejelentett szolgáltatás egyelőre zártkörű bétában van, a részletekről itt lehet olvasni.
  • Snowflake Feature Store: Az ML modellek által használt számított mezők központi tárolására szolgál. A különböző objektumokat SQL nyelvű interfészeken keresztül lehet létrehozni és menedzselni, de emellett Python API is rendelkezésre áll majd.

A fenti komponensek nagy része még fejlesztés alatt áll vagy zártkörű bétában van, de az már látszik, hogy egy valóban teljes körű data science és ML platform van készülőfélben.

Adatnatív alkalmazások

A Snowflake egyik legérdekesebb stratégiai fejlesztési iránya az adatnatív alkalmazások közvetlen támogatása. A 2022-ben élesedett Snowpark már lehetővé tette, hogy a hagyományos SQL mellett Java és Scala vagy akár Python nyelven írt alkalmazások fussanak közvetlenül a Snowflake felhőjében. Ennek a megközelítések nagy előnye, hogy adatokat nem kell mozgatni, így nincsenek ingress/egress költségek, valamint az architektúra egésze a Snowflake központi jogosultságkezelése alá tartozik.

Konténerek támogatása

A 2023-as év nagy dobása ezen a területen a Snowpark Container Services, amely egy Kubernetes alapú, szintén teljesen integrált, "belső" konténerszolgáltatás.

A december vége óta publikus bétában elérhető SPCS segítségével gyakorlatilag bármilyen alkalmazást lehet a Snowflake felhőben futtatni, ideértve például a GPU-kat is használó LLM modelleket.

Az adatplatformba natívan integrált konténerek előnyeiről jó áttekintést ad ez a blogposzt, a mélyebb technikai részletekről pedig itt lehet még olvasni.

További lehetőségek

Szintén az adatplatformba integrált hagyományos alkalmazások fejlesztését fogja segíteni a 2022-ben bejelentett Unistore, amely lehetővé teszi majd a tranzakciós és analitikus adatok egységes kezelését. A még fejlesztés alatt álló hibrid táblák oszlopalapú és soralapú tárolási technikákat is alkalmaznak, így a Snowflake OLTP jellegű feladatokra is használható lesz.

A frontendre fókuszáló fejlesztéseket pedig a két éve akvirált Streamlit könnyíti meg, amely immár a Snowflake platformjába integráltan, natív módon futtatható. Szintén a fejlesztők munkáját segíti majd a hamarosan érkező beépített Git támogatás és a parancssoros működést támogató Snowflake CLI is.

Pénzügyi eredmények és akvizíciók

A Snowflake 2020 őszén nagy port kavart fel nyilvános tőzsdei részvénykibocsátásával (IPO). Az árfolyam az első napokban rendkívül magas volt, de azóta már jóval alacsonyabb tartományokban mozog. A cég folyamatosan növekszik, de továbbra is jelentős éves veszteséget termel.

Felvásárlások

A Snowflake továbbra is nagyon aktív az akvizíciós piacon, csak 2023-ban kilenc kisebb-nagyobb felvásárlást hajtott végre. A bekebelezett cégek listája:

  • Myst AI: Idősoros előrejelzések
  • SnowConvert: Adatmigráció felhős környezetbe
  • LeapYear: Differencial Privacy megoldások
  • Neeva: Generatív AI alapú keresés
  • Touk.pl: Fejlesztői kapacitás Lengyelországban
  • Nxyz: Blockchain technológiák
  • Ponder: Skálázható Python adatfeldolgozás
  • Sisu Data: Automatizált döntéstámogatás
  • Samooha: biztonságos adatmegosztás partnerekkel

Pénzügyi eredmények

A november végén megjelent legfrissebb negyedéves jelentés alapján a főbb pénzügyi mutatók így alakultak az idén:

  • A januárban véget érő pénzügyi év első 9 hónapjában az árbevétel meghaladta a 2 milliárd dollárt, ami jelentős növekedés az előző évhez képest
  • A már szerződött, de még nem teljesített szolgáltatások (RPO, Remaining Performance Obligations) értéke 3.7 milliárd dollár
  • Az intenzív növekedés azonban továbbra is komoly veszteségekkel jár, az első kilenc hónap összesített számviteli (GAAP szerinti) vesztesége 668 millió dollár volt.

A befektetőknek szóló prezentációból az is kiderül, hogy a Snowflake bevételeinek túlnyomó többsége, nagyjából 80 százaléka az amerikai kontinensről származik, Európa aránya pedig csak 15%.

Adatkonferenciák 2024 elején

2024-ben is számos online és hibrid adatos esemény várja az érdeklődőket. Összeállításunkban az első negyedéves rendezvények közül válogattunk.

2024. január

Data Community Austria Day 2024
2024. január 25-26. A Data Community Austria kétnapos ingyenes konferenciája Bécsben.
sqlusergroupaustria.wordpress.com

SUPERWEEK 2024
2024. január 29. - február 2. Ötnapos adatos konferencia Egerszalókon.
superweek.hu

Data Vision 2024
2024. január 30. A hazai adatos vezetőknek szóló évindító üzleti reggeli Budapesten.
datavision.hu

2024. február

Data Toboggan
2024. február 3. Ingyenes online konferencia Microsoft Power BI és Fabric témákról.
datatoboggan.co.uk

Fabric February 2024
2024. február 7-9. Microsoft Fabric témájú konferencia Osloban.
fabricfebruary.com

Global Power BI & Fabric Summit
2024. február 12-16. Egyhetes online konferencia a Microsoft adatos technológiáiról.  A részvétel 145 euróba kerül.
globalpowerbisummit.com

További 2024-es események

2023-as Gartner MQ a felhős adatbázisokról

A Gartner elemzésének friss kiadása a felhős adatbázisokat kínáló cégeket rangsorolja.

A vezetők

A vezetők szegmensének elején kapnak helyet a klasszikus RDBMS szállítók, mint az Oracle és a Microsoft és a meghatározó cloud platformok is, amelyek jellemzően több különböző adatbázismotort is kínálnak.

Az Amazon portfóliójában 15+ különféle adatbázis található, ezek közül az adattárházas világban továbbra is a Redshift a legfontosabb szereplő. A Google is hasonlóan széles termékpalettával rendelkezik, itt adattárházas téren a BigQuery a meghatározó.

A vezetők között szerepel továbbra is a két újgenerációs adatanalitika platform, a Snowflake és a Databricks is.

A mezőny többi szereplője

A Vizionáriusok szegmensbe került a tavaly még a vezetők között szereplő SAP-IBM-Teradata-Cloudera négyes, valamint itt szerepel a Redis és a Neo4j.

A Kihívók szegmensében egyetlen cég található, a multimodális IRIS adatbázist forgalmazó Intersystems.

A Résszereplők között kapott helyett az EnterpriseDB (új szereplő), a Yugabite (szintén), a CockroachLabs és a Couchbase.

Kikerült viszont az elemzésből a Progress (MarkLogic), a Tencent Cloud és a TigerGraph, mert a Gartner által számított Vásárlói érdeklődési indexben (Customer Interest Index) nem voltak a legjobb 20 között.

A teljes elemzés elérhető többek között a Google és a Databricks oldalán (regisztráció szükséges).

4,4 milliárd dollárért magánkézbe kerül az Alteryx

Két tőkealap felvásárolja a tőzsdén forgalmazott Alteryx részvényeit, így a low-code, vizuális adatfeldolgozó- és elemzőplatformjáról ismert cég a jövőben ismét magánvállalat lesz.

A felvásárlás 48.25 dolláros árfolyamon történik, ami több mint 50%-os felár a szeptember elejei árazáshoz képest. A részvények 28-30 dollár körül mozogtak egy ideje, amikor a médiában megjelentek az első hírek egy potenciális felvásárlásról.

A 48 dolláros felvásárlási ár azonban csak a kora őszi árazáshoz képest kedvező, mert az Alteryx 2023-ban forgott 70 dollár körül is, az abszolút csúcs pedig 2020-ban közel 180 dollár volt.

A piacon szerényebben teljesítő cégek tőkealapok általi felvásárlása nem szokatlan, így például tőzsdei cégből magánvállalat lett a Qlik is.

Adatkonferenciák decemberben

2023. decemberi események

→ Rendezvénynaptár 2023. II. félév

Amazon S3 Express

Az Amazon új tárolószolgáltatást jelentett be a Re:Invent 2023konferencián, amely különösen az adatprojektek számára lehet érdekes.

Az S3 Express (teljes nevén S3 Express Zone One) egy újfajta tárolási egységet (directory storage bucket) használ, amely akár tízszer gyorsabb a hagyományos S3 sebességénél. Az új szolgáltatást nagy terhelésekre tervezték, így másodpercenként több százezer lekérdezést is ki tud szolgálni.

A S3 Express esetében meg lehet adni azt is, hogy melyik rendelkezésre állási zónát szeretnénk használni, így az adatok fizikailag is közel kerülhetnek a számításokat végző szerverekhez.

Az Amazon saját oldala többek között a SageMaker ML modelleket, az Athena SQL motort és a Glue adatkatalógust említi példaként arra, hogy milyen más AWS szolgáltatások profitálhatnak majd az új tárolási módból.

Hab a tortán, hogy az S3 Express árazása is kedvező, a hagyományos S3 szolgáltatásoknál akár 50 százalékkal is olcsóbb lehet.

Adatkonferenciák október-novemberben

2023. október

Microsoft Power Platform Conference
2023. október 1-6. A Microsoft Power Platformról szóló nemzetközi konferencia Las Vegasban. Konferencia belépőjegyek 1899 dollártól kaphatók.
powerplatformconf.com

Compass Tech Summit 2023
2023. október 5-6. Data Engineering és Data science konferencia Budapesten, melynek keretében kerül megtartásra idén a Crunch Conference és a Reinforce AI Conference. Online jegyek 220 eurótól, személyes Late Bird jegyek 855 eurótól kaphatók.
crafthub/compass-tech-summit-2023

ITBN Conf-Expo 2023
2023. október 11-12. Informatikai biztonság és AI kapcsolatáról szóló konferencia és expó Budapesten, külön Business AI színpaddal. A belépés ingyenes.
www.itbn.hu/konferencia/2023

Coalesce 2023
2023. október 16-19. A dbt Labs data engineering konferenciája, mely alapvetően online, egyes városokban ((San Diego, London, Sydney) azonban élőben is zajlik. Az online részvétel ingyenes.
coalesce.getdbt.com

Digital Cube Conf
2023. október 26-27. Analitika, PPC és SEO konferencia Budapesten. Egynapos konferencia jegyek 59.990 Ft + áfa, konferencia + workshop jegyek 99.990 Ft + áfa áron érhetők el.
digitalcubeconf.com

2023. november

PASS Data Community Summit
2023. november 13-17. Microsoft fókuszú adatos megakonferencia Seattle-ben.
passdatacommunitysummit.com

2023 Forbes Tech Summit
2023. november 16. A Forbes AI trendeket is érintő konferenciája Budapesten. Super early bird jegyek 20.900 Ft-os áron kaphatók.
forbes.hu/esemenyek

Dyntell NEXT 2023
2023. november 16-17. Konferencia a mesterséges intelligencia cégvezetésben betöltött szerepéről.
dyntellnext.hu

Budapest BI Fórum
2023. november 20-22. Üzleti intelligencia, adatvizualizációs és adatanalitikai hibrid konferencia.
budapestbi.hu/2023/hu

DSC Europe 23
2023. november 20-24. Nemzetközi AI- és adatkonferencia Belgrádban.
datasciconference.com

Information+ Conference 2023
2023. november 22-24. Adatvizualizációval foglalkozó nemzetközi konferencia Edinburgh-ben.
informationplusconference.com/2023

AWS re:Invent 2023
2023. november 27 - december 1. Az Amazon Web Services konferenciája Las Vegasban, a full conference pass ára 2099 dollár.
reinvent.awsevents.com

→ Rendezvénynaptár 2023. II. félév

Adatkonferenciák augusztus-szeptemberben

2023. augusztus

MDS Fest 2023
2023. augusztus 21-25. Ötnapos online konferencia adatos szakemberek számára, a részvétel ingyenes.
mdsfest.com

2023. szeptember

SAP NOW HU 2023
2023. szeptember 10-12. Konferencia a vállalati informatika területéről, az esemény Siófokon kerül megrendezésre.
events.sap.com/hu/sap-now-2023

AI Summit 2023
2023. szeptember 11. Az AI üzleti életre, a társadalomra és az iparágakra gyakorolt hatásáról szóló konferencia Budapesten. Az early bird belépőjegyek 79 ezer forintért érhetők el.
aisummit.hu

Dreamforce 2023
2023. szeptember 12-14. A Salesforce felhasználói konferenciája San Franciscoban, az online részvétel ingyenes.
salesforce.com/dreamforce

PyData Amsterdam 2023
2023. szeptember 14-16. Háromnapos nemzetközi konferencia Amszterdamban, diákjegyek 200 eurótól kaphatók, egyéni bérlet 420 eurótól elérhető.
amsterdam.pydata.org

PyCon CZ 23
2023. szeptember 15-17. Pythonos adatkonferencia Prágában. Belépőjegyek 2200 koronától, diákok számára 900 koronától kaphatók.
cz.pycon.org/2023

Ray Summit 2023
2023. szeptember 18-19. Ray konferencia  San Franciscoban az Anyscale szervezésében. Belépőjegy 399 dollártól érhető el.
raysummit.anyscale.com

Big Data LDN 2023
2023. szeptember 20-21. Kétnapos adat és analitika konferencia Londonban. A részvétel ingyenes.
bigdataldn.com

Data Careers Summit
2023. szeptember 22. Párórás ingyenes online esemény a data karrier világáról.
datacareerssummit.com

→ Rendezvénynaptár 2023. II. félév

Gartner Hype Cycle for AI

A Gartner friss anyaga az aktuális AI trendeket és technológiákat elemzi. A görbe csúcsán nem meglepő módon a Generative AI található, amely a ChatGPT tavaly novemberi berobbanása óta egyfolytában a figyelem középpontjában áll.

A csúcshoz még csak közeledő technológiák között található a Responsible AI, a Prompt Engineering és a Data-Centric AI.  A ModelOps és a Syntethic Data viszont már átjutott a  hype csúcsán és úton van az átmeneti kiábrándultság szakasza felé.

A teljes elemzés egy ingyenes regisztráció után letölthető a Snorkel AI oldaláról.