A vezető Data Science és ML platformok

Megjelent a Gartner piacelemző sorozatának második tagja, amely a data science és gépi tanulási képességeket biztosító szoftverplatformokkal foglalkozik.

Ez a szegmens nagyon érdekes és komplex, hiszen fej-fej mellett versenyeznek az olyan sok évtizedes múlttal rendelkező óriások, mint a SAS vagy IBM és a néhány évvel ezelőtt még nem is létező, sokszor  open source technológiákra koncentráló cégek.

A Data Science felhasználók is több nagy csoportra oszthatóak, az egyik tábor jobban szereti a modelleket R vagy Python kódként fejleszteni, míg mások előnyben részesítik a vizuális, előre elkészített komponensekre alapuló modellezést.

Nem volt könnyű dolga így a Gartner elemzőinek, akik körülbelül 70 szállítót vizsgáltak meg, akik közül végül 16 került be a mágikus négyzetbe.

Gartner Magic Quadrant for Data Science and Machine Learning Platforms, February 2020

Érdekesség, hogy az ábra alapján a  szállítók nagy része kifejezetten erős vízióval rendelkezik, hiszen a 6 vezető mellett 7-en szerepelnek a vizionárius szegmensben, míg az ábra bal oldalán összesen 3 cég található. Ez jól mutatja, hogy mennyire új még ez a piac, szemben például a BI szoftverekével.

Vezetők

Az Alteryx sokáig az önkiszolgáló adatelőkészítés (data prep) specialistája volt, nagyon kényelmes és hatékony vizuális eszközöket kínálva az adatok tisztogatásához. A szoftver szélesebb körű elterjedésének fő gátja a relatíve magas árazás volt. Az utóbbi években egyre erősebben fókuszál a cég az általános data science feladatokra is, több akvizíciót is végrehajtva (Feature Labs, Clear Story, Yhat) ezen a területen.

A Databricks elsősorban Apache Spark-alapú, felhőben futó adatmenedzsment platformjáról ismert, amely nagyon népszerű mind az Amazon, mind a Microsoft ügyfelei körében. A data science területén külön érdekesség a 2018-ban bemutatott, a gépi tanulás teljes életciklusát támogató nyílt forráskódú Mlflow keretrendszer.

A francia hátterű Dataiku a kisebb szállítók közé tartozik, jelenleg nagyjából 300 ügyféllel rendelkezik. A cég egyre erősebben fókuszál az USA piacra, ahonnan most már a bevételének fele származik. A termékfejlesztésben hangsúlyos a kollaboráció, a könnyű tanulhatóság és a data governance támogatása.

A Mathworks hazánkban is jól ismert  MATLAB szoftveréről, különösen a tudományos és műszaki területen. A cég idén került be a vezetők közé, többek között a modern ML technológiák egyre jobb támogatásával.

A SAS hagyományosan erős az innovációs és R&D terén, amelynek köszönhetően az elmúlt években teljesen megújította termékportfólióját, többek között a SAS Viya in-memory adatkezelő platform és a Visual Data Mining and Machine Learning szoftver révén.

A TIBCO hazánkban inkább a Spotfire adatvizualizációs szoftverről ismert, azonban a cég Data Science platformja is egyre erősebb, többek között stratégiai felvásárlásoknak (Alpine Data, Statistica) köszönhetőn.

A teljes elemzés több cég weboldaláról is letölthető, általában rövid ingyenes regisztráció után:
Databricks, Dataiku, SAS

Comments are closed.