Tag Archives: Hálózatok

Új Data Science eszközök a Neo4j gráf platformjához

Megjelent a Neo4j gráfalapú adatkezelő platformjának legújabb eleme, a hálózati  elemzéseket támogató Neo4j for Graph Data Science keretrendszert.

A keretrendszer lehetővé teszi a különböző hálózati algoritmusok futtatását a Neo4j adatbáziskezelőben tárolt gráfokon. A beépített algoritmusok a következő főbb csoportokba tartoznak:

  • Community Detection - kapcsolódó közösségek keresése
  • Centrality - a legfontosabb csomópontok azonosítása
  • Similarity - hasonló elemek megtalálása
  • Pathfinding - legrövidebb vagy leghatékonyabb utak keresése a gráfon belül
  • Link Prediction -  ismeretlen vagy jövőbeli kapcsolatok előrejelzése

A további részletekről a Neo4j bejelentéséből lehet tájékozódni, valamint április 28-án lesz  egy egész napos online bemutató esemény is.

 

Merre tart a gráfok világa?

A  napokban tartott a gráfalapú adatbázisok területén meghatározó szerepet játszó Neo4j egy elemzőknek szóló eseményt, ahol főleg a  piaci trendekről és termékújdonságokról esett szó. Ebből az anyagból válogatunk néhány érdekességet.

Gráfok a vállalati életben

A legtöbb szervezetben az információkat elsősorban valamilyen klasszikus relációs adatbázis-kezelőben menedzselik, de egyre terjednek az adatokat csomópontok és élek hálózataként ábrázoló gráf adatbázisok is.

A gráfok egyik tipikus alkalmazási területe a pénzügyi tranzakciók elemzése és a csalásfelderítés, hiszen egy bank ügyfeleit (a csomópontok) számtalan különböző kapcsolat (az élek) kötik össze. Ilyenek a cégek között küldött és a fogadott utalások, de él lehet egyéb olyan közös adat is, mint az azonos székhely vagy cégvezető.

 

Szintén népszerű gráf alkalmazási terület az ajánlórendszerek, az árazás, vagy a felhasználók és ügyfelek hálózatainak elemzése.

A gráfok előnyei

A gráfok használatának számos előnye lehet, például a hálózatként megjelenő adatmodell elég közel áll a hétköznapi gondolkodáshoz, így könnyebben érthető a felhasználók számára.

Másik nagy előny a sebesség: a különböző hálózatos jellegű lekérdezések sokkal gyorsabbak egy gráf adatbázison futtatva, mintha ugyanazt az információt SQL segítségével szeretnénk kinyerni relációs táblákból.

Gráf és hagyományos adatbázis teljesítménye az adatmennyiség függvényében (forrás: Neo4j)

Különösen igaz ez, ha az adatok mennyisége nagyobb, illetve a bejárandó kapcsolatok száma (a "connectedness") magas.

Gráfos technológiák

A gráf adatbázis piacon elég sok szereplő van jelen, a DB Engines ranglistájában több mint 30 szoftver szerepel, a GraphAware blogon megjelent Graph Technology Landscape 2020 elemzés pedig még ennél is jóval szélesebb kört fed le.

A Neo4j néhány fontosabb mutatója

A legismertebb gráfokra specializált  cég a hasonló nevű adatbáziskezelőt gyártó Neo4j. A cég pénzügyi adatairól viszonylag keveset lehet tudni, mivel magánkézben lévő vállalatról van szó, de az ismert, hogy idáig 160 millió dollár kockázati tőkét kaptak.

A Neo4j újdonságai

A termékportfólió központi eleme a Neo4j natív gráfalapú adatbáziskezelő, amelynek néhány hete jelent meg a legújabb, 4.0-ás változata, amely többek között jobb skálázhatóságot és kifinomult jogosultságkezelési képességeket hozott.

A Neo4j adatbázis két fő változata az ingyenes, open source Community Edition és a vállalati igényeket kiszolgáló,  fizetős Enterprise Edition.

Tavaly november óta a szoftver Neo4j Aura néven elérhető felhőben futó, teljesen menedzselt platformként is. Az online szolgáltatást egy egyszerű előfizetéssel bárki igénybe veheti, így nem kell saját szervert telepíteni, menedzselni és frissíteni.

A porfólió harmadik érdekes eleme a Neo4j Bloom, amely interaktív adatvizualizációs és elemző felületet biztosít az adatbázisban tárolt gráfokhoz.

A Ne4j Bloom interaktív lekérdező és vizualizációs felület

A Bloom használatával könnyen áttekinthetők a nagyobb, bonyolultabb hálózatok is, az adatok közötti eligazodást intelligens kereső és különböző vizuális segédletek támogatják.

Érdekesség még a Neo4j-tól származó, immár open source Cypher lekérdezőnyelv és a jelentős mértékben erre alapuló, ISO standard státuszra törekvő GQL nyelv is.

Gráftalálkozók

A Neo4j áprilisban rendezi meg New Yorkban a GraphConnect 2020 konferenciát, ahol várhatóan újabb fejlesztések és üzleti esettanulmányok kerülnek bemutatásra majd.

A gráfelmélet atyjaként is tisztelt Euler születésnapján, április 15-én pedig világszerte lesznek kisebb-nagyobb gráf témájú események. A Global Graph Celebration Day hazai kiadása a CEU-n lesz, jelentkezni a Facebook vagy Meetup eseményeken lehet.