Tag Archives: Elemzés

2023-as Gartner MQ a felhős adatbázisokról

A Gartner elemzésének friss kiadása a felhős adatbázisokat kínáló cégeket rangsorolja.

A vezetők

A vezetők szegmensének elején kapnak helyet a klasszikus RDBMS szállítók, mint az Oracle és a Microsoft és a meghatározó cloud platformok is, amelyek jellemzően több különböző adatbázismotort is kínálnak.

Az Amazon portfóliójában 15+ különféle adatbázis található, ezek közül az adattárházas világban továbbra is a Redshift a legfontosabb szereplő. A Google is hasonlóan széles termékpalettával rendelkezik, itt adattárházas téren a BigQuery a meghatározó.

A vezetők között szerepel továbbra is a két újgenerációs adatanalitika platform, a Snowflake és a Databricks is.

A mezőny többi szereplője

A Vizionáriusok szegmensbe került a tavaly még a vezetők között szereplő SAP-IBM-Teradata-Cloudera négyes, valamint itt szerepel a Redis és a Neo4j.

A Kihívók szegmensében egyetlen cég található, a multimodális IRIS adatbázist forgalmazó Intersystems.

A Résszereplők között kapott helyett az EnterpriseDB (új szereplő), a Yugabite (szintén), a CockroachLabs és a Couchbase.

Kikerült viszont az elemzésből a Progress (MarkLogic), a Tencent Cloud és a TigerGraph, mert a Gartner által számított Vásárlói érdeklődési indexben (Customer Interest Index) nem voltak a legjobb 20 között.

A teljes elemzés elérhető többek között a Google és a Databricks oldalán (regisztráció szükséges).

Gartner Hype Cycle for AI

A Gartner friss anyaga az aktuális AI trendeket és technológiákat elemzi. A görbe csúcsán nem meglepő módon a Generative AI található, amely a ChatGPT tavaly novemberi berobbanása óta egyfolytában a figyelem középpontjában áll.

A csúcshoz még csak közeledő technológiák között található a Responsible AI, a Prompt Engineering és a Data-Centric AI.  A ModelOps és a Syntethic Data viszont már átjutott a  hype csúcsán és úton van az átmeneti kiábrándultság szakasza felé.

A teljes elemzés egy ingyenes regisztráció után letölthető a Snorkel AI oldaláról.

A vezető felhős adatbázisok 2022-ben

Megjelent a Gartner idei elemzése a felhős adatbázisok piacáról.

Az adatbázis-piac érettségét jól mutatja, hogy a 20 szállító több mint fele a Vezetők szegmensében található.

A teljes elemzés elérhető a Gartner oldalán.

A vezető felhős adatbázisok

December elején jelent meg a Gartner legfrissebb elemzése a felhős adatbázisplatformokról, amely a tranzakciós és analitikus adatbáziskezelőkkel egyaránt foglalkozik.

Gartner Magic Quadrant for Cloud Database Management Systems 2021

Nem meglepő módon a legjobb értékelést a nagy vezető felhőszolgáltatók kaptak (Microsoft, Amazon, Google), amelyekhez még az Oracle csatlakozik.

A vezetők szegmensébe kerültek az olyan régi motorosok is, mint a Teradata, az IBM vagy a SAP.  Szintén itt kapott helyet a feltörekvőnek számító Snowflake és a Databricks is.

A teljes elemzés elérhető többek között az Oracle, a Teradata vagy a Databricks oldalán.

Fontos még kiemelni, hogy a mágikus négyzet csak egy általános áttekintést ad, ezért az analitikus illetve operatív képességek iránt közelebbről érdeklődnek érdemes még átnézni a következő két részletesebb elemzést is:

Gartner Critical Capabilities for Cloud DBMSs for Analytical Use Cases (Teradata reprint)
→ Gartner Critical Capabilities for Cloud DBMSs for Operational Use Cases (Oracle reprint)

 

Gartner Hype Cycle for Data Management

forrás

Gartner Data Science MQ 2021

Az új Data Science és Machine Learning mágikus négyzetben 20 cég szerepel, azaz 4 újonccal bővült a tavalyi 16-os csapat.

Gartner Magic Quadrant for Data Science and Machine Learning Platforms, 2021

A  négy új szereplő az Alibaba Cloud, az Amazon Web Services, a Cloudera és a Samsung SDS.

Vezetők szegmense

Az élboly létszámában nincs változás, ismét 6 cég kapott helyet a szegmensben. Egy helycsere történt azonban, az Alteryx kikerült innen, az IBM viszont visszakapta a helyét.

  • A SAS továbbra is a vezetők között, immár nyolcadik éve. A cég sikeresen modernizálta szoftverkínálatát, ideértve a felhős és open source technológiák támogatását is, bár a cég imázsában ez nem feltétlenül jelenik még meg. A licenszelés és árazás is egyszerűsödött, de ezen a téren van még tennivaló.
  • Az IBM idén visszakerült  az élbolyba  a tavalyi Challenger helyezése után. A Gartner úgy látja, hogy mostanra beértek a hosszabb távú termékfejlesztési és -integrációs munkák és a Watson Studio sokat tudó, jól használható data science platformmá vált.
  • Megőrizte a szegmensben a helyét a MATLAB-ról ismert Mathworks, a tavaly nyáron 100 millió dollár tőkét bevont Dataiku, a tőzsdére készülődő Databricks és a data science platformjában több felvásárlás eredményét integráló Tibco is.

Kihívók

Ebben a szegmensben hagyományosan kevés cég szokott szerepelni, tavaly és idén is csak 1-1 szereplő volt.

  • Az idei szereplő az Alteryx , amely a vezetők szegmenséből érkezett. A Gartner az idei elemzésben a megújított, Analytics Process Automation (APA) fókuszú termékstratégia kapcsán inti óvatosságra a vásárlókat. Az Alteryx esetében  a magas árazás is hagyományosan problémás pont, az egyébként valóban kiválóan használható Alteryx Designer 1 éves előfizetése több mint 5.000 dollár.

Vizionáriusok

A jó szakmai stratégiával és jövőképpel, de ehhez képest kevésbe érett végrehajtási képességekkel rendelkező cégeket gyűjtő szegmensben ismét népes társaság gyűlt össze.

  • Mind a 3 nagy felhőszolgáltató cég itt szerepel. A Microsoft Azure ML a legerősebb a végrehajtási tengely mentén, a Google Cloud AI pedig a vízió teljességében vezet AI kutatási hátterének is köszönhetően. A mágikus négyzetben most először felbukkanó Amazon ML  megoldása kicsit hátrébb kapott helyet.
  • Ismét ebben a szegmensben szerepel az automatizált ML képességeiről ismert DataRobot és a számos open source eszközt is kínáló H2O.ai
  • Szintén a szegmens tagja a sok szempontból hasonló felületű, vizuális modellépítést biztosító RapidMiner és KNIME.

Résszereplők

A negyedik szegmens cégei is komoly szakmai és piaci eredményeket értek már el a data science területén. A Gartner módszertana szerint az elemzésbe bekerüléshez ugyanis vagy évi 75 millió dolláros árbevétel szükséges vagy elég 10 millió dollár árbevétel is, de  minimum 18%-os éves növekedés mellett.

  • A 4 új szereplő közül három található itt: A Cloudera a megújított  big data platformjába integrált ML megoldást kínál,  a Samsung a Brightics open source eszközt fejleszti,  az Alibaba Cloud AI platformja pedig elsősorban az ázsiai piacon ismert.
  • Az Anaconda jól ismert a Pythonos világban ingyenes szoftverdisztribúciója révén, emellett a cég többféle fizetős kereskedelmi verziót is kínál.
  • A Domino idén került át ebbe a szegmensbe a vizionáriusok közül. A viszonylag kevésbé ismert cég szoftverei elsősorban a nagyobb data science csapatok körében használatosak.
  • Az Altair neve is kevesebbeknek lehet ismerős, de a technológia mögött az az Angoss áll, amelyet 2018-ban megvett a DataWatch, amelyet aztán az Altair vásárolt fel.

A teljes elemzés regisztráció nélkül letölthető a SAS jóvoltából. A 2020-as verzióról itt írtunk. Érdemes még a 2021-es BI platform MQ-ról szóló cikkünket is olvasni.

Gartner BI MQ 2021

Megjelent a Gartner legfrissebb elemzése a BI platformokról, amelyben összesen 20 szoftverszállító szerepel.

Az élbolyban egy változás van tavalyhoz képest, a ToughtSpot átkerült a Vizionáriusok szegmensbe, így a vezetők között a Microsoft-Tableau-Qlik hármas maradt.

A Kihívók szegmensben is egy csere történt, a MicroStrategy és a Looker (Google)  páros mellé bekerült a Domo, viszont a TIBCO most már nem itt, hanem a jobb alsó negyedben szerepel.

Teljesen új szereplő az idei elemzésben az AWS (Amazon QuickSight) és az Infor, amely 2017-ben felvásárolta a Birst-et.

Növekvő BI piac

A Gartner adatai szerint a modern BI platformok piaca 2019-ben 6 milliárd dolláros volt, az éves növekedés üteme 19%, ami enyhe lassulás a 2018-as 22%-hoz képest.

A felhasználók száma viszont továbbra is drasztikusan bővül, főleg annak köszönhetően, hogy az egy felhasználóra jutó licenszelési költség az elmúlt években sokat csökkent, sokkal megfizethetőbbek lettek a BI eszközök.

A felhasználói adaptáció tekintetében a Microsoft dominál, köszönhetően az agresszív licenszelésnek és az Office és Azure platformokkal kialakított integrációknak.

A vezetők közelebbről

Microsoft

A Microsoft évek óta őrzi első helyét a BI MQ-ban a Power BI  töretlen népszerűségének köszönhetően.

Az erősségek között szerepel az Office 365 és Teams integráció, amelynek köszönhetően számos vállalat számára a Power BI az elsődleges, de facto opció az analitika területén. A Power BI kedvező áron kínál széles körű adatelemző képességeket, amelyet jól egészítenek ki az Azure felhőben elérhető  adatmenedzsment és mesterséges intelligencia funkciók.

A hátrányok között az on-prem futtatható Power BI Reporting Server funkcionális hiányosságait, a Microsoft platformhoz való szigorú kötődést, és az önkiszolgálás kapcsán felmerülő data governance kérdéseket lehet említeni.

Tableau

A Tableau tavalyhoz hasonlóan idén is a második legjobb pozíciót foglalja el az elemzésben. A 2019-es  Salesforce felvásárlással új lehetőségek nyíltak meg a cég előtt, mind technológiai, mind üzleti szempontból.

Az előnyök között szerepel a kiemelkedő vizuálizás képességek és a kiváló felhasználó élmény, a lelkes felhasználói tábor és a Salesforce-kapcsolat.

A hátrányok között említendők a felhős környezet némileg még mindig limitált képességei, a versenytársakhoz képest magasabb árazás és a felvásárlással együtt járó integrációs kihívások.

Qlik

A vezetők csoportjának harmadik tagja a Qlik , amely számos kisebb-nagyobb akvizíciónak köszönhetően igen széles funkcionalitást kínál. A Qlik 2016 óta nem önálló tőzsdei cég, hanem a Thomas Bravo befektetőcég portfóliójába tartozik.

A platform erőssége a rugalmasság, egyformán támogatja az on-prem  telepítéseket és a nagyobb felhőszolgáltatókat. A korábbi felvásárlásoknak köszönhetően közös ernyő alatt kínál szinte minden fontos funkciót, az adatintegrációtól a ML/AI képességekig. A Qlik erősen fókuszál a Data Literacy területére is, ami a felhasználói adaptáció szempontjából fontos.

A nehézségek között szerepel a meglehetősen komplex árazás, különösen az on-prem telepítések esetén. A sok felvásárlás miatt a technológiai stack nem homogén, ami itt is extra költségekkel és feladatokkal járhat. A másik két vezetőhöz képest a Qlik piaci lendülete is alacsonyabb a Gartner metrikái szerint.

A Gartner Magic Quadrant for Analytics and Business Intelligence Platforms elemzés teljes változata itt vagy itt érhető el.

2020 Rewind – Databricks

2020-es visszatekintő sorozatunk korábbi részei: Adatplatformok, Snowflake

A Snowflake mellett a Databricks a másik olyan adatplatform cég, amely kizárólag a publikus felhőben kínálja szoftverét. A két cég nagyjából egyszerre indult és hasonló pályát is futott be, azonban amíg a Snowflake az adattárházas világból indult, addig a Databricks eredeti fókusza inkább a data science volt.

Sparkos gyökerek

A Databrickset a Sparkot megálmodó csapat hozta létre 2013-ban és eleinte főleg a data science felhasználókat célozta felhőben futó Spark platformjával. Az induláskor ez kizárólag az AWS-t jelentetette, de 2018-ban Azure Databricks néven megjelent a Microsoft-féle verzió is, ami szintén hamar népszerű lett.

Az idő múlásával aztán kezdett megváltozni a Databricks profilja. A cég természetesen továbbra is erősen kötődik a Sparkhoz, és folyamatosan fejleszti azt,  emellett azonban egyre aktívabb más területeken is.

A fontosabb innovációk között szerepel a gépi tanulás és AI projektek életciklusának menedzselését segitő MLflow, amellyel a modellek tanítását és futtatását lehet optimalizálni, valamint a modellkomponeseket újra felhasználhatóan tárolni.

A másik fontos projekt a Delta Lake, ami a data lake jellegű, általában Parquet fájlokra építő adattárolást egészíti ki tranzakciós képességekkel. Mindkét projekt open source, ami azt jelenti, hogy bárki használhatja, nem csak a Databricks ügyfelei használhatják.

Ezekből a  fejlesztésekből is látható, hogy a Databricks egyre inkább szeretne kimozdulni hagyományos területéről, a Sparkhoz kötődő, elosztott adatelemzési és ML feladatok kiszolgálásától, és mind horizontálisan, mint vertikálisan kiterjeszteni termékkínálatát.

2020-es főbb események

Az év elején jelent meg a Data Lakehouse koncepció, amely szerint ideje egyesíteni a hagyományos adattárházak és a Data Lake megoldások előnyeit egy új, közös platformban.

A nagyobb adattárházas projektek jobb kiszolgálását is több fejlesztés célozza. Júniusban bejelentették a nagy teljesítményű  Delta Engine motort , amely C++-ban készült, élesen szakítva a Spark Scala nyelvhez kötődő hagyományaival. Emellett  felvásárolták  az SQL lekérdezések és dashboardok készítését segítő  Redash-t, és erre építve novemberben megjelent az SQL Analytics, amely kifejezetten az SQL-ben dolgozó elemzőknek és fejlesztőknek szól.

Az egyik régi/új célcsoportja a Databricksnek azok a data scientist-ek, akik saját gépeiken futtatnak jellemzően Python scripteket. Számukra jó hír a Koalas könyvtár 1.0 változatának megjelenése, amely lehetővé teszi a Pandas kódok Sparkon történő futtatását. Szintén ennek a rétegnek szól a novemberben bejelentett Single-Node cluster támogatás, így könnyen és olcsón tudnak egyszerűbb feladatokat elvégezni a Databricks környezetben.

Szintén novemberben rendezték meg  a Data+AI Europe online konferenciát, amelynek videóanyaga bárki számára elérhető, jó áttekintést adva az összes újdonságról. A cég vezetői időnként tudományos konferenciákon is előadnak, így tavaly jelent meg többek között részletes technikai publikáció a Delta Lake és a Data Lakehouse kapcsán is.

Szintén sok érdekességet tartalmaz a  cég egyik alapítójának a novemberi Scale at the Bay konferencián készül,  Youtube-n elérhető előadása is.

2021-ben irány a tőzsde

A különböző forrásokból származó hírek szerint a Databricks árbevétele mára elérte az évi 350 millió dollárt, ami igen dinamikus növekedés a 2019-es 200 millió dollár után.

A számok ismeretében nem csoda, hogy a várakozások szerint a cég 2021-ben meg fog jelenni a tőzsdén is. Hogy sikerül-e megismételni majd a Snowflake sikertörténetét, az még elválik, de a két cég ügyfélköre, árbevétele és növekedési potenciálja sokban hasonlít.

2020 Rewind – Snowflake

2020 és az utóbbi néhány év talán legérdekesebb adatmenedzsment sztorija az olyan cégek felemelkedése, amelyek már a felhőben születtek és soha nem is rendelkeztek hagyományos adatközpontokban, a céges tűzfal mögött futtatható verzióval. 

A Snowflake története remekül illusztrálja azt, hogy egyáltalán nem lehetetlen sikert elérni olyan területeken sem, ahol már évtizedes múlttal rendelkező szereplők  uralják a piacot.

5 év alatt a csúcsra

A 2012-ben alapított cég csak 2015-ben indult be igazán, tehát mindössze 5 év alatt lett a felhős adattárházak szegmensének egyik meghatározó szereplője. Mindezt úgy érte el, hogy egyszerre versenyzett a hagyományos adattárház szállítókkal (Oracle, Teradata),  és a felhős cégek saját DW megoldásaival is (Amazon Redshift, Google BigQuery).

A sikerhez kellett az, hogy az Oracle-s háttérből érkező alapítók jókor voltak jó helyen,  és kellett egy korszerű technológiai vízió is. A későbbi siker az induláskor azonban még egyáltalán nem volt biztosra vehető, hiszen akkor még messze nem volt egyértelmű, hogy a cégek szívesen tárolják majd értékes adataikat a felhőben, erről érdemes az egyik korai befektető visszaemlékezését olvasni.

Rekorddöntő IPO

A Snowflake idén szeptemberben aztán óriási tűzijátékkal lépett ki a tőzsdére, az elemzők szerint ez volt minden idők legnagyobb szoftveres IPO-ja.

Egy hónappal korábban még 80 dollár körüli kibocsátási árfolyamról volt szó, de a részvények végül 120 dollárért kerültek a piacra. Ez azonban annyira nem vette el a befektetők kedvét, hogy még ehhez képest is több mint kétszeresére verték fel az árakat, sőt, egy időre 300 dollár fölé is ment az árfolyam a kibocsátás napján.

A cég teljes értéke így meghaladta a 70 milliárd dollárt, és jó néhány korai alkalmazott és vezető dollármilliárdos lett, köztük a cég első és a jelenlegi CEO-ja is.

Platformfejlesztések

Technológiai szempontból érdekes, hogy a  novemberi Data Cloud Summit konferencián bejelentetett újdonságok között szerepel a sorszintű jogosultságkezelés, a különböző objektumok címkézése (tagging) és a Python, Java és Scala nyelven írt tárolt eljárások támogatása.  

korábbi fejlesztésekkel (materializált nézetek, oszlopok maszkolása) is együtt nézve látható, hogy a Snowflake tovább dolgozik azon, hogy a hagyományos adattárházak által biztosított teljesítménynövelő, adatvédelmi és kényelmi funkciók minél szélesebb körét kínálja - cloudos környezetben.

Intenzív növekedés, jelentős veszteség

Ez a fejlesztési stratégia  összefügg azzal, hogy a Snowflake vezetői egyre nagyobb és komolyabb adattárházakkal rendelkező cégeket szeretnének a platformon látni. A cég decemberben közzétett negyedéves pénzügyi jelentése szerint már 65 olyan ügyféllel rendelkeznek, akik évi 1 millió dollárnál többet költenek.

A negyedéves árbevétel amúgy 160 millió dollár volt, ami 119%-os éves növekedést jelent.  A gyors növekedés és intenzív fejlesztés persze nincs ingyen, ezt mutatja a negyedév 168 millió dolláros vesztesége is.  Ez azonban egy szokatlanul rossz érték,  a januárban forduló pénzügyi év első 9 hónapja alatt az árbevétel összesen 400 millió dollár körül volt, amihez "mindössze" 340 millió dolláros veszteség társult.

A befektetők mindezt továbbra is jól fogadják, december elején az árfolyam egy időre megközelítette a 400 dollárt is, többre értékelve a céget, mint az IBM vagy az AMD. Az árfolyam kicsit visszaesett azóta, de jelenleg is 300 dollár fölött van, ami 80 milliárd dolláros cégértéket jelent.

Hazai helyzet

A Snowflake iránt itthon is egyre nagyobb az érdeklődés. Igazán nagy, publikus hazai referencia még nem ismert, de több kisebb felhasználója van már a platformnak.

A Snowflake hazai partnere a Meta Consulting, akik többek között a Budapest Data Fórumon tartottak bemutató előadást.

 

 

Gartner mágikus négyzet a felhős adatbázisokról

A felhőben futó adatplatformok népszerűségét jelzi, hogy a Gartner egy új, dedikált elemzést készített a szegmens szereplőiről.

Gartner Magic Quadrant for Cloud Database Management Systems, November 2020

Az élbolyban a három domináns cloud szolgáltató  - AWS, Microsoft, Google - ott van az Oracle, a Teradata és az IBM is, akik a hagyományos vállalati adatközpontokban futó adatbázisok világából egyre eredményesebben lépnek a felhő felé.

Az SAP és Alibaba is a vezetők közé került, az előbbi elsősorban a SAP HANA cloud népszerűsége miatt, az utóbbi pedig az ázsiai piacon betöltött szerepe alapján.

Szerepel a mágikus négyzetben a meglehetősen népszerű Snowflake és Databricks is, azonban a vezetők szegmensébe még nem tudtak bekerülni. Hasonló a Cloudera helyzete is, aki a Vizionáriusok között szerepel a Databrickssel együtt.

A teljes elemzés regisztráció után letölthető többek között a Teradata, a Google vagy az AWS oldaláról.