Megjelent a Gartner piacelemző sorozatának második tagja, amely a data science és gépi tanulási képességeket biztosító szoftverplatformokkal foglalkozik.
Ez a szegmens nagyon érdekes és komplex, hiszen fej-fej mellett versenyeznek az olyan sok évtizedes múlttal rendelkező óriások, mint a SAS vagy IBM és a néhány évvel ezelőtt még nem is létező, sokszor open source technológiákra koncentráló cégek.
A Data Science felhasználók is több nagy csoportra oszthatóak, az egyik tábor jobban szereti a modelleket R vagy Python kódként fejleszteni, míg mások előnyben részesítik a vizuális, előre elkészített komponensekre alapuló modellezést.
Nem volt könnyű dolga így a Gartner elemzőinek, akik körülbelül 70 szállítót vizsgáltak meg, akik közül végül 16 került be a mágikus négyzetbe.
Érdekesség, hogy az ábra alapján a szállítók nagy része kifejezetten erős vízióval rendelkezik, hiszen a 6 vezető mellett 7-en szerepelnek a vizionárius szegmensben, míg az ábra bal oldalán összesen 3 cég található. Ez jól mutatja, hogy mennyire új még ez a piac, szemben például a BI szoftverekével.
Vezetők
Az Alteryx sokáig az önkiszolgáló adatelőkészítés (data prep) specialistája volt, nagyon kényelmes és hatékony vizuális eszközöket kínálva az adatok tisztogatásához. A szoftver szélesebb körű elterjedésének fő gátja a relatíve magas árazás volt. Az utóbbi években egyre erősebben fókuszál a cég az általános data science feladatokra is, több akvizíciót is végrehajtva (Feature Labs, Clear Story, Yhat) ezen a területen.
A Databricks elsősorban Apache Spark-alapú, felhőben futó adatmenedzsment platformjáról ismert, amely nagyon népszerű mind az Amazon, mind a Microsoft ügyfelei körében. A data science területén külön érdekesség a 2018-ban bemutatott, a gépi tanulás teljes életciklusát támogató nyílt forráskódú Mlflow keretrendszer.
A francia hátterű Dataiku a kisebb szállítók közé tartozik, jelenleg nagyjából 300 ügyféllel rendelkezik. A cég egyre erősebben fókuszál az USA piacra, ahonnan most már a bevételének fele származik. A termékfejlesztésben hangsúlyos a kollaboráció, a könnyű tanulhatóság és a data governance támogatása.
A Mathworks hazánkban is jól ismert MATLAB szoftveréről, különösen a tudományos és műszaki területen. A cég idén került be a vezetők közé, többek között a modern ML technológiák egyre jobb támogatásával.
A SAS hagyományosan erős az innovációs és R&D terén, amelynek köszönhetően az elmúlt években teljesen megújította termékportfólióját, többek között a SAS Viya in-memory adatkezelő platform és a Visual Data Mining and Machine Learning szoftver révén.
A TIBCO hazánkban inkább a Spotfire adatvizualizációs szoftverről ismert, azonban a cég Data Science platformja is egyre erősebb, többek között stratégiai felvásárlásoknak (Alpine Data, Statistica) köszönhetőn.
A teljes elemzés több cég weboldaláról is letölthető, általában rövid ingyenes regisztráció után:
Databricks, Dataiku, SAS