Tag Archives: Data Science

Gartner Data Science MQ 2021

Az új Data Science és Machine Learning mágikus négyzetben 20 cég szerepel, azaz 4 újonccal bővült a tavalyi 16-os csapat.

Gartner Magic Quadrant for Data Science and Machine Learning Platforms, 2021

A  négy új szereplő az Alibaba Cloud, az Amazon Web Services, a Cloudera és a Samsung SDS.

Vezetők szegmense

Az élboly létszámában nincs változás, ismét 6 cég kapott helyet a szegmensben. Egy helycsere történt azonban, az Alteryx kikerült innen, az IBM viszont visszakapta a helyét.

  • A SAS továbbra is a vezetők között, immár nyolcadik éve. A cég sikeresen modernizálta szoftverkínálatát, ideértve a felhős és open source technológiák támogatását is, bár a cég imázsában ez nem feltétlenül jelenik még meg. A licenszelés és árazás is egyszerűsödött, de ezen a téren van még tennivaló.
  • Az IBM idén visszakerült  az élbolyba  a tavalyi Challenger helyezése után. A Gartner úgy látja, hogy mostanra beértek a hosszabb távú termékfejlesztési és -integrációs munkák és a Watson Studio sokat tudó, jól használható data science platformmá vált.
  • Megőrizte a szegmensben a helyét a MATLAB-ról ismert Mathworks, a tavaly nyáron 100 millió dollár tőkét bevont Dataiku, a tőzsdére készülődő Databricks és a data science platformjában több felvásárlás eredményét integráló Tibco is.

Kihívók

Ebben a szegmensben hagyományosan kevés cég szokott szerepelni, tavaly és idén is csak 1-1 szereplő volt.

  • Az idei szereplő az Alteryx , amely a vezetők szegmenséből érkezett. A Gartner az idei elemzésben a megújított, Analytics Process Automation (APA) fókuszú termékstratégia kapcsán inti óvatosságra a vásárlókat. Az Alteryx esetében  a magas árazás is hagyományosan problémás pont, az egyébként valóban kiválóan használható Alteryx Designer 1 éves előfizetése több mint 5.000 dollár.

Vizionáriusok

A jó szakmai stratégiával és jövőképpel, de ehhez képest kevésbe érett végrehajtási képességekkel rendelkező cégeket gyűjtő szegmensben ismét népes társaság gyűlt össze.

  • Mind a 3 nagy felhőszolgáltató cég itt szerepel. A Microsoft Azure ML a legerősebb a végrehajtási tengely mentén, a Google Cloud AI pedig a vízió teljességében vezet AI kutatási hátterének is köszönhetően. A mágikus négyzetben most először felbukkanó Amazon ML  megoldása kicsit hátrébb kapott helyet.
  • Ismét ebben a szegmensben szerepel az automatizált ML képességeiről ismert DataRobot és a számos open source eszközt is kínáló H2O.ai
  • Szintén a szegmens tagja a sok szempontból hasonló felületű, vizuális modellépítést biztosító RapidMiner és KNIME.

Résszereplők

A negyedik szegmens cégei is komoly szakmai és piaci eredményeket értek már el a data science területén. A Gartner módszertana szerint az elemzésbe bekerüléshez ugyanis vagy évi 75 millió dolláros árbevétel szükséges vagy elég 10 millió dollár árbevétel is, de  minimum 18%-os éves növekedés mellett.

  • A 4 új szereplő közül három található itt: A Cloudera a megújított  big data platformjába integrált ML megoldást kínál,  a Samsung a Brightics open source eszközt fejleszti,  az Alibaba Cloud AI platformja pedig elsősorban az ázsiai piacon ismert.
  • Az Anaconda jól ismert a Pythonos világban ingyenes szoftverdisztribúciója révén, emellett a cég többféle fizetős kereskedelmi verziót is kínál.
  • A Domino idén került át ebbe a szegmensbe a vizionáriusok közül. A viszonylag kevésbé ismert cég szoftverei elsősorban a nagyobb data science csapatok körében használatosak.
  • Az Altair neve is kevesebbeknek lehet ismerős, de a technológia mögött az az Angoss áll, amelyet 2018-ban megvett a DataWatch, amelyet aztán az Altair vásárolt fel.

A teljes elemzés regisztráció nélkül letölthető a SAS jóvoltából. A 2020-as verzióról itt írtunk. Érdemes még a 2021-es BI platform MQ-ról szóló cikkünket is olvasni.

Új Data Science eszközök a Neo4j gráf platformjához

Megjelent a Neo4j gráfalapú adatkezelő platformjának legújabb eleme, a hálózati  elemzéseket támogató Neo4j for Graph Data Science keretrendszert.

A keretrendszer lehetővé teszi a különböző hálózati algoritmusok futtatását a Neo4j adatbáziskezelőben tárolt gráfokon. A beépített algoritmusok a következő főbb csoportokba tartoznak:

  • Community Detection - kapcsolódó közösségek keresése
  • Centrality - a legfontosabb csomópontok azonosítása
  • Similarity - hasonló elemek megtalálása
  • Pathfinding - legrövidebb vagy leghatékonyabb utak keresése a gráfon belül
  • Link Prediction -  ismeretlen vagy jövőbeli kapcsolatok előrejelzése

A további részletekről a Neo4j bejelentéséből lehet tájékozódni, valamint április 28-án lesz  egy egész napos online bemutató esemény is.

 

A vezető Data Science és ML platformok

Megjelent a Gartner piacelemző sorozatának második tagja, amely a data science és gépi tanulási képességeket biztosító szoftverplatformokkal foglalkozik.

Ez a szegmens nagyon érdekes és komplex, hiszen fej-fej mellett versenyeznek az olyan sok évtizedes múlttal rendelkező óriások, mint a SAS vagy IBM és a néhány évvel ezelőtt még nem is létező, sokszor  open source technológiákra koncentráló cégek.

A Data Science felhasználók is több nagy csoportra oszthatóak, az egyik tábor jobban szereti a modelleket R vagy Python kódként fejleszteni, míg mások előnyben részesítik a vizuális, előre elkészített komponensekre alapuló modellezést.

Nem volt könnyű dolga így a Gartner elemzőinek, akik körülbelül 70 szállítót vizsgáltak meg, akik közül végül 16 került be a mágikus négyzetbe.

Gartner Magic Quadrant for Data Science and Machine Learning Platforms, February 2020

Érdekesség, hogy az ábra alapján a  szállítók nagy része kifejezetten erős vízióval rendelkezik, hiszen a 6 vezető mellett 7-en szerepelnek a vizionárius szegmensben, míg az ábra bal oldalán összesen 3 cég található. Ez jól mutatja, hogy mennyire új még ez a piac, szemben például a BI szoftverekével.

Vezetők

Az Alteryx sokáig az önkiszolgáló adatelőkészítés (data prep) specialistája volt, nagyon kényelmes és hatékony vizuális eszközöket kínálva az adatok tisztogatásához. A szoftver szélesebb körű elterjedésének fő gátja a relatíve magas árazás volt. Az utóbbi években egyre erősebben fókuszál a cég az általános data science feladatokra is, több akvizíciót is végrehajtva (Feature Labs, Clear Story, Yhat) ezen a területen.

A Databricks elsősorban Apache Spark-alapú, felhőben futó adatmenedzsment platformjáról ismert, amely nagyon népszerű mind az Amazon, mind a Microsoft ügyfelei körében. A data science területén külön érdekesség a 2018-ban bemutatott, a gépi tanulás teljes életciklusát támogató nyílt forráskódú Mlflow keretrendszer.

A francia hátterű Dataiku a kisebb szállítók közé tartozik, jelenleg nagyjából 300 ügyféllel rendelkezik. A cég egyre erősebben fókuszál az USA piacra, ahonnan most már a bevételének fele származik. A termékfejlesztésben hangsúlyos a kollaboráció, a könnyű tanulhatóság és a data governance támogatása.

A Mathworks hazánkban is jól ismert  MATLAB szoftveréről, különösen a tudományos és műszaki területen. A cég idén került be a vezetők közé, többek között a modern ML technológiák egyre jobb támogatásával.

A SAS hagyományosan erős az innovációs és R&D terén, amelynek köszönhetően az elmúlt években teljesen megújította termékportfólióját, többek között a SAS Viya in-memory adatkezelő platform és a Visual Data Mining and Machine Learning szoftver révén.

A TIBCO hazánkban inkább a Spotfire adatvizualizációs szoftverről ismert, azonban a cég Data Science platformja is egyre erősebb, többek között stratégiai felvásárlásoknak (Alpine Data, Statistica) köszönhetőn.

A teljes elemzés több cég weboldaláról is letölthető, általában rövid ingyenes regisztráció után:
Databricks, Dataiku, SAS