Adatkonferenciák július-augusztusban

SciPy 2022
2022. július 11-17. Konferencia a Python tudományos és adatalapú alkalmazásairól, ideértve a high-performance computing, machine learning és data science témákat is. A virtuális jegy ára 100 dollár.
scipy2022.scipy.org

EuroPython
2022. július 11-július 17. A legnagyobb európai Python konferencia, amit ez alkalommal Dublinban rendeznek meg. Az online jegyek ára néhány száz dollár.
ep2022.europython.eu

Beam Summit
2022. július 18-20. Három napos hibrid konferencia az Apache Beam használatáról és kihívásairól. Az online részvétel ingyenes.
2022.beamsummit.org

rstudio::conf(2022)
2022.július 25-28. Az RStudio személyes részvétellel rendezett konferenciája Washingtonban.
rstudio.com/conference

JuliaCon
2022. július 27-29.  A Julia nyelv kedvelőinek szóló ingyenes konferencia.
juliacon.org/2022/

Recommender Systems Summit 2022
2022. július 28. Ingyenes, online beszélgetés a Netflix, a Twitter, a Weights & Biases és a Coveo szakértőivel a deep learning ajánlórendszerekről.
nvidia.com/en-us/events/deep-learning-recommender-systems-summit

Data Analytics Careers Summit
2022. augusztus 12. Pár órás online esemény a data karrier világáról.
datacareerssummit.com

Real-Time Analytics Summit
2022. augusztus 16-17. A StarTree adatkonferenciája a valós idejű adatfeldolgozásról. A jegyek  ára 450 dollár, de regisztráció ellenében a felvételek ingyenesen visszanézhetőek lesznek a konferencia után 2 héttel.
startree.ai/real-time-analytics-summit

Ray Summit 2022
2022. augusztus 23-24. Ray konferencia és hands-on kurzus San Franciscoban az Anyscale szervezésében.
anyscale.com/ray-summit-2022

Rendezvénynaptár 2022. I. félév (január-június)

Rendezvénynaptár 2022. II. félév (július-december)

Photo by Ethan Robertson on Unsplash

Snowflake újdonságok Las Vegasból

A héten zajlik a Snowflake nagyszabású felhasználói konferenciája, a Snowflake Summit Las Vegasban.  Az idén újra élőben megrendezett eseményen több mint tízezren vesznek részt az egész világról.

Hagyomány, hogy a cégek az ilyen konferenciákon jelentik be a legfontosabb újdonságokat, fejlesztéseket. A Snowflake is így járt el, íme a legfontosabb hírek listája.

OLTP alkalmazások

A legizgalmasabb a új hibrid táblatípusra épülő Unistore, amelyek segítségével a Snowflake immár tranzakciós adatbázisként is használható lesz. A hibrid táblák az analitikus lekérdezések mellett támogatják az OLTP világban szokásos funkciókat is (soralapú tárolás, elsődleges kulcsok használata, külső kulcshivatkozások stb.)

Az új képességgel a Snowflake már nem csak az adattárházas igényeket tudja majd kiszolgálni, hanem képes lesz egyetlen rendszerben támogatni az analitikus és a tranzakciós feladatokat.

Iceberg  külső táblák 

Szintén az adattárolási képességeket színesi az Iceberg formátumú külső táblák támogatása. Az open source Apache Iceberg a data lake  architektúrák egyik népszerű táblaformátuma, amely hasznos extra adatmenedzsment képességeket nyújt.

A jövőben az Icebergben tárolt adatokat nem kell áttölteni a Snowflake saját belső adattárába, hanem maradhatnak az ügyfelek adattároló rétegében (például S3-on) és onnan közvetlenül lekérdezhetőek lesznek.  Demó videó itt.

Ide kapcsolódó hír még, hogy a külső tábla mechanizmus segítségével hamarosan majd on-premise (azaz nem felhős) adatforrások is elérhetőek lesznek Snowflake alól.

Pythonos fejlesztői környezet

Különösen a data science alkalmazások szempontjából lesz érdekes a Python támogatása a Snowpark fejlesztői környezetben. Az Anacondával kötött szövetségnek köszönhetően sokféle adatfeldolgozó és ML feladat a jövőben Pythonban is elvégezhető lesz.

Natív Snowflake alkalmazások

A Native Application Framework segítségével  olyan alkalmazások készíthetőek, amelyek közvetlenül a Snowflake platformon futnak, kihasználva a platform által nyújtott funkciókat.

A keretrendszer segítségével fejlesztett alkalmazások a Snowflake Marketplace piacterén keresztül értékesíthetőek is lesznek majd.

További hírek és érdekességek

A kiemelt 4 témán felül sok más bejelentés is érkezett: Streamlit integráció, streaming adatbetöltés javítása, materializált táblák, SQL Machine Learning, teljesítményjavító fejlesztések, jobb data governance és auditing.

Szintén érdekesek azok a hírek, amelyek a Snowflake saját befektetési alapja, a Snowflake Ventures tranzakcióról szólnak, például a Matillion és Domino Labs is kapott friss tőkét az alaptól.

Részletesebb információkért ezt a két posztot érdemes még elolvasni:

Adatkonferenciák júniusban

Knowledge Gap
2022. június 1-3. Az adatmodellezés és adatarchitektúra témájú konferencia online kerül megrendezésre. A teljes árú jegy €390, míg a kedvezményes diákjegy €39.
knowledgegap.info

ITexec 2022
2022. június 2-3. Az ITBUSINESS rendezvénye Adatgazdagság témában. A részvétel IT vezetők számára ingyenes.
itbusiness.hu

PyCon Italia 2022
2022. június 2-5. Az olasz PyCon konferencia Firenzében lesz. Csak személyesen lehet csatlakozni az eseményhez. A jegyek a teljes konferenciára €150-tól, diákoknak pedig €80-tól érhetőek el.
pycon.it/en

DataRobot AIX 22
2022. június 7-8. A DataRobot AI, Analytics, és Data Science témájú virtuális konferenciája. A részvétel ingyenes.
aix.datarobot.com

MLOps World 2022
2022. június 7-10. Az MLOPS-fókuszú  konferencia elsősorban személyes módon kerül megrendezésre Kanadában.
mlopsworld.com

Applied ML Summit
2022. június 9. A Google Cloud ML és AI témájú online konferenciája. A részvétel ingyenes.
cloudonair.withgoogle.com

Berlin Buzzwords 2022
2022. június 12-14. A konferencia személyes lesz, a standard jegyár 760 EUR.
2022.berlinbuzzwords.de

Budapest Data Fórum 
2022. június 13-15.  A hazai közösségnek szóló data engineering, adattárház és  big data konferencia.  A részvétel személyesen vagy online lehetséges.
budapestdata.hu

Snowflake Summit
2022. június 13-16. A Snowflake globális konferenciája Las Vegasban, a részvétel csak személyes.
snowflake.com/summit

PyData London
2022. június 17-19.  A személyes részvételű konferencia az adatokkal foglalkozó Python felhasználóknak szól. Az Early bird jegyárak 175 fonttól kezdődnek.
pydata.org/london2022

useR 2022
2022. június 20-23.  A legnagyobb R-es konferencia idén ismét online lesz, a részvételi díjak régiótól függően 0 és 85 dollár között mozognak.
user2022.r-project.org

Datalift summit
2022. június 22-24. Az AI Guild konferenciája Berlinben lesz, a részvételi díj €349/fő.
thedatalift.eu

The Data Thread
2022. június 23. A Voltron Data ingyenes online konferenciája.
thedatathread.com

ML Conference Munich 2022
2022. június 27-29. Hibrid formában kerül megrendezésre a konferencia. A helyszínre szóló bérleteket €935-tól, míg az online jegyeket €743-tól lehet megvásárolni.
mlconference.ai/munich/

Data + AI Summit
2022. június 27-30. A Databricks éves konferenciája, az online részvétel ingyenes.
databricks.com/dataaisummit

 

Éves rendezvénynaptár

 

Photo by Corey Agopian on Unsplash

Adatkonferenciák májusban

Budapest ML Fórum
2022. május 3-4. A data science, ML és  AI témájú konferencia második alkalommal kerül megrendezésre. Online jegyek 56 000 Ft-tól, hibrid konferenciajegyek pedig 70 000 Ft+ÁFA-tól érhetőek el.
budapestml.hu

Gartner Data & Analytics Summit
2022. május 9-11. A Gartner rendezvénye a legjelentősebb kihívásokkal foglalkozik, amelyekkel az adatelemzési vezetők szembesülnek, miközben a jövő leginnovatívabb szervezeteit építik. Jegyek 3000 eurótól.
gartner.com/en/conferences

Beyond 2022
2022. május 9-12. A ThoughtSpot data és analytics témájú konferenciája. Early Bird jegyek 795 dollártól.
thoughtspot.com/beyond2022

Google I/O
2022. május 11-12. A Google által minden évben megrendezett, San Franciscó-i helyszínű, kétnapos fejlesztői konferencia. Online ingyenesen követhető.
io.google/2022/

Qlik World
2022. május 16-19. A Qlik nagyszabású éves felhasználói konferenciája online kerül megrendezésre.
qlik.com/qlikworld/

Tableau Conference 2022
2022. május 17-19. A Tableau konferenciája idén hibrid formában tér vissza, az online részvétel ingyenes.
tableau.com/events/conference

Metadata Day 2022
2022. május 17-18. Ingyenes online metadata konferencia a LinkedIn és az Acryl Data szervezésében.
metadataday2022.splashthat.com

HOUG Konferencia 2022
2022. május 17-18. A magyarországi Oracle-felhasználók Egyesületének rendezvénye idén Siófokon kap helyet. A részvételi díj 60 0000 Ft + ÁFA.
konferenciak.ezconf.eu

apply()
2022. május 18-19. A Tecton ML Data engineering témájú konferenciája. Az online eseményen a részvétel ingyenes.
applyconf.com

dataSTREAM 2022
2022. május 19. A Clementine egynapos éves konferenciája idén Budapesten kap helyet. A részvétel díja 35000 Ft + ÁFA/fő.
clementine.hu

Data Reliability Engineering Conference 2022
2022. május 25-26. A Bigeye online eseményen a részvétel ingyenes.
drecon.org

Informatica World 2022
2022. május 24-26. Az Informatica konferenciája Las Vegasban lesz. Az all inclusive bérlet 1895 dollártól érhető el.
informaticaworld.com

DATA festival
2022. május 24-25. Az elsősorban német piacra koncentráló konferencia Münchenben leszvissza. A 2 napos jegyek €690-tól érhetőek el.
data-festival.com

Graph + AI Summit
2022. május 24-25. A Tigergraph rendezvénye. A részvétel ingyenes.
tigergraph.com/graphaisummit

34. e-BMCF - Budapesti Menedzsment és Controlling Fórum
2022. május 26. A Horváth & Partners rendezvényének fő témája a  transzformáció és fenntarthatóság a vállalatirányításban. Idén Budapesten kap helyet a fórum, de online is követhető lesz. Az online részvétel díja 29000 Ft + ÁFA/fő.
conf-bmcf.horvath-partners.com

Machine Learning Prague 2022
2022. május 27-29. A prágai ML konferencia idén ismét helyszíni lesz. A napijegyek a konferenciára €240-tól indulnak.
mlprague.com

-> Éves rendezvénynaptár

 

Photo by Tim Gouw on Unsplash

Adatkonferenciák áprilisban

Google Data Cloud Summit EMEA
2022. április 6. A Google ingyenes online AI és ML témájú konferenciája.
cloudonair.withgoogle.com 

ScaleUp:AI 
2022. április 6-7. Az Insight Partners AI témájú konferenciája. Az online bérletek 349 dollártól érhetőek el.
scaleup.events

PyCon DE & PyData Berlin
2022. április 11-13. Két év kihagyás után ismét lesz  PyCon DE & PyData Berlin, angol nyelven. Online jegyek 50 és 190 euró között érhetőek el, a helyszíni jegyek ára 200 és 500 euró között mozog (diákok / magánszemélyek / vállalati résztvevők).
2022.pycon.de

Kafka Summit
2022. április 25-26. Idén offline, Londonban rendezik meg a Kafka globális felhasználói konferenciáját.  Early Bird jegyek £345-tól.
kafka-summit.org

További események
→ 2022. éves eseménynaptár

 

Photo by Julian B. Sölter on Unsplash

Adatkonferenciák márciusban

Subsurface Live Winter 2022
2022. március 2-3. A Dremio éves online cloud data konferenciája, a részvétel ingyenes.
dremio.com/subsurface/live/winter2022

Women in Data Science
2022. március 7. A Women in Data Science több, mint 60 Data Science területen dolgozó nő megszervezésével létrejött konferencia. A részvétel a diákoknak $20, a teljes árú jegy $49.
widsconference.org

Power BI Summit
2022. március 7-11. A Power BI Summit az egyik legnagyobb Power BI konferencia. Az előadásokat online lehet majd követni,  a részvétel pedig 99.99 dollárba kerül.
globalpowerbisummit.com

Reinforce
2022. március 8-10. Ismét visszatér az Ericsson fémjelezte hazai AI konferencia, ezúttal hibrid kivitelben. Helyszíni részvételre az Early Bird jegyek 280 euro-tól, míg az online jegyek 150 euro-tól érhetőek el.
reinforceconf.com

SQLBits 2022
2022. március 8-12. Az SQLBits a világ egyik legnagyobb adatkonferenciája, amelyet hibrid formában rendeznek meg. Napijegyek £400-tól, az 5 napos bérletek pedig £1000-tól érhetőek el, online pedig 40% kedvezménnyel lehet csatlakozni a konferenciához.
arcade.sqlbits.com

Business Intelligence Conference
2022. március 9. Az IIR Hungary BI konferenciája idén Budapesten kerül megrendezésre. Részvételi díj 139.000 Ft + ÁFA.
iir-hungary.hu/rendezvenyek

NVIDIA GTC 2022
2022. március 21-24. Az NVIDIA globális online AI témájú konferenciája. A konferencián a részvétel ingyenes, az egynapos workshopok $99-tól elérhetőek.
nvidia.com/gtc/

Domopalooza
2022. március 22-25. A Domo BI témájú konferenciája. Salt Lake City-ben kerül megrendezésre, de online is követhető. A részvétel ez esetben ingyenes.
domo.com/domopalooza

SciMLCon
2022. március 23. Az online esemény a Julia-alapú SciML-eszközök fejlesztésére és alkalmazásaira összpontosít. A konferencián a részvétel ingyenes.
scimlcon.org/2022/

Arize:Observe
2022. március 29.  Online Machine Learning Observability konferencia, a részvétel ingyenes.
observe.arize.com

További események
→ 2022. éves eseménynaptár

Photo by Annie Spratt on Unsplash

Fundraising by data companies in 2021

2021 was quite an exciting year in terms of funding for both data startups and established companies. We tracked more than a hundred data-related funding events during the year.

Several vendor has raised more than once, most notably AirByte that went through three rounds ($5.2M, $26M and $150M).  Databricks was the largest fundraiser with a total of USD $2.6 billion in 2 rounds.


Click here for the hi-res version

 

General data platforms and infrastructure
This category mostly includes data companies not belonging to any of the more specific subcategories. Databricks leads with 2 mega-rounds, honorable mentions include Dremio (data lakes), Anyscale (working on scaling Python with Ray) and Coiled (working on scaling Python with Dask).

  • Databricks - $1.6B series H in August and $1B series G in February 2021
  • Dremio - $135M series D in January 2021
  • AnyScale - $100M series C in December 2021
  • StreamNative - $23M series A in September 2021
  • Treeverse - $23M series A in July 2021
  • Coiled - $21M series A in June 2021

Databases and SQL engines
This is our largest category due to the many different flavours of databases  and SQL & NOSQL engines. The graph database segment was quite active with Neo4j and  TigerGraph raising large rounds, followed by ArangoDB and MemGraph. Funding for analytic SQL engines and cloud DW platforms included Clickhouse, Firebolt, Starburst (Presto), Imply (Druid), StarTree (Apache Pinot),  and Ahana (Presto). Other honorable mentions include Redis Labs (in-memory DB), distributed SQL vendors Yugabyte and Cockroach Labs, and time-series specialist TimeScale and QuestDB.


  • Neo4j - $325M series F in June 2021
  • Clickhouse - $250M series B in October 2021 and $50M series A in September
  • YugaByte - $188M series C in October 2021 and $48M series B in March 2021
  • Cockroach Labs - $160M series E in January 2021
  • Firebolt - $127M series B in June 2021
  • Redis Labs - $110M series G in April 2021
  • TigerGraph - $105M series C in February 2021
  • Starburst - $100M series C in January 2021
  • SingleStore - $80M series F in September 2021
  • Imply - $70M series C in June 2021
  • TimeScale - $40M series B in May 2021
  • ArangoDB - $27.8M series B in October 2021
  • Startree - $24M series A in May 2021
  • Ahana - $20M series A in August 2021
  • QuestDB - $12M series A in November 2021
  • MemGraph - $9.3M seed in October 2021

Data Integration, ETL and Reverse ETL

Cloud-based ETL was all the rage, where Fivetran raised the largest round, followed by Matillion and Hevo Data.   In the open source segment Airbyte has gone from a $5.2M seed round in March to a $150M series B December in ten months and Meltano spun off Gitlab raising a seed round. Reverse ETL vendors Hightouch and Census raised early rounds. Prefect and ElementEtl (the company behind Dagster) focus on data orchestration and workflow management.

 

 

  • Fivetran - $565M series D in September 2021
  • AirByte - $5.2M seed in March 2021, $26M series A in May, $150M series B  in December
  • dbt Labs - $150M series C in June 2021
  • Matillion - $100M series D in February 2021
  • Hightouch - $12M series A in July 2021, $40M series B in November 2021
  • Prefect - $11.5M series A in February 2021, $32M series B in June 2021
  • Hevo Data - $30M series B in December 2021
  • Census - $16M series A in February 2021
  • ElementETL - $14M series A in November 2021
  • Meltano - $4.2M seed in June 2021

Data Quality and observability

Data observability, data reliability and data quality vendors attracted a lot of attention in 2021. Monte Carlo and Big Eye raised twice within the year, and there are several other startups raising their first rounds.

  • Monte Carlo - $60M series C in August and $25M series B in February
  • BigEye - $45M series B in September 2021 and $17M series A in April 2021
  • AccelData - $35M series B in September 2021
  • Anomalo - $33M series A in October 2021
  • Datafold - $20M series A in November 2021
  • Soda - $13M series A in February 2021

Data governance, metadata, data catalogs

Collibra and Alation, both well established players in the data governance segment have raised significant rounds. There also new entrants raising their first rounds of capital: Stemma works on Amundsen which originates from Lyft, while Acryl Data focuses on the DataHub project coming from LinkedIn.

  • Collibra - $250M series F in November 2021
  • Alation - $110M series D in June 2021
  • Atlan - $16M series A in May 2021
  • Acryl Data - $9M seed in June 2021
  • Stemma - $4.8M seed in June 2021

BI and data visualization

Grafana (operational dashboards),  Jedox (financial planning & EPM) and ThoughtSpot (search-based BI) are well-known vendors in the space, raising significant amounts of additional capital. Upcoming startups Metabase and Preset (working on Apache Superset) focuses on open source data visualization software. Noteable offers collaborative data visualization notebooks.

  • Grafana - $220M series C in August 2021
  • Jedox - $100M in January 2021
  • ToughtSpot - $100M series F in November 2021
  • Preset - $35.9M series B in August 2021
  • Metabase - $30M series B in August 2021
  • Noteable - $21M series A in November 2021

Data Science, ML, AI

It's a very broad and active category so the list is just a sample of a few selected subcategories: General data science and ML platforms (Dataiku, DataRobot, H20.ai), MLOPS (Weights & Biases, Comet),  data labeling and annotation (Scale AI, Snorkel, Sama) and synthetic data generation (Gretel, Tonic). Streamlit and Hex provides productivity  tools for data scientists and Iterative works on DVC.

  • Dataiku - $400M series E in August 2021
  • Scale AI - $325M series E in April 2021
  • DataRobot - $300M series G in July 2021
  • Weights & Biases - $135M series C in October 2021
  • Snorkel - $85M series C in August 2021 and $35M series B in April 2021
  • H2O.AI - $100M series E in November 2021
  • Sama - $70M series B in November 2021
  • Comet - $50M series B in November 2021
  • Gretel - $50M series B in October 2021
  • Streamlit - $35M series B in April 2021
  • Tonic.ai - $35M series B in September 2021
  • Hex - $5.5M seed in March 2021 and $16M series A in October
  • Iterative - $20M  Series A in July 2021

 

Errors or omissions? Please drop me an email (bence@adat.blog) or reach out on LinkedIn.

Adatkonferenciák február-március

Microstrategy World 2022
2022. február 1-2.A MicroStrategy online BI konferenciája. A részvétel ingyenes.
microstrategy.com/en/world-2022

DataOps Unleashed
2022. február 2. A konferencia fő témája az adatvezérelt rendszerek, találkozhatunk AI/ML előadásokkal is. A részvétel ingyenes.
dataopsunleashed.com

Outlier
2022. február 4-5. A Data Visualization Society idén második alkalommal rendezi meg online adatvizualizációs konferenciáját, az Outliert.  A jegyárak 59 dollárnál kezdődnek.
outlierconf.com

Datanova
2022. február 9-10. A Presto elosztott SQL motorról ismert Starburst Data rendezvénye.  A  részvétel ingyenes.
starburst.io/info/datanova2022/

mlcon 2.0
2022. február 22-23. A cnvrg.io virtuális konferenciája, AI és ML témában. A részvétel ingyenes.
cnvrg.io/mlcon

Data Art for Climate Action
2022. február 23-26. A DACA az éghajlati adatok vizualizációjáról és szonifikációjáról szóló konferencia. A tervezett két helyszíni esemény helyett végül teljes egészében online kerül megrendezésre, így a részvétel mindenki számára ingyenes.
dataclimate.org

AWS Innovate
2022. február 24. Az Amazon és az Intel közös virtuális konferenciája AI & Machine Learning témában. A részvétel ingyenes.
aws.amazon.com/events/innovate-online-conference/

Subsurface Live Winter 2022
2022. március 2-3. A Dremio éves online cloud data konferenciája, a részvétel ingyenes.
dremio.com/subsurface/live/winter2022

Women in Data Science
2022. március 7. A Women in Data Science több, mint 60 Data Science területen dolgozó nő megszervezésével létrejött konferencia. A részvétel a diákoknak $20, a teljes árú jegy $49.
widsconference.org

Power BI Summit
2022. március 7-11. A Power BI Summit az egyik legnagyobb Power BI konferencia. Az előadásokat online lehet majd követni,  a részvétel pedig 99.99 dollárba kerül.
globalpowerbisummit.com

Reinforce
2022. március 8-10. Ismét visszatér az Ericsson fémjelezte hazai AI konferencia, ezúttal hibrid kivitelben. Helyszíni részvételre az Early Bird jegyek 280 euro-tól, míg az online jegyek 150 euro-tól érhetőek el.
reinforceconf.com

SQLBits 2022
2022. március 8-12. Az SQLBits a világ egyik legnagyobb adatkonferenciája, amelyet hibrid formában rendeznek meg. Napijegyek £400-tól, az 5 napos bérletek pedig £1000-tól érhetőek el, online pedig 40% kedvezménnyel lehet csatlakozni a konferenciához.
arcade.sqlbits.com

Business Intelligence Conference
2022. március 9. Az IIR Hungary BI konferenciája idén Budapesten kerül megrendezésre. Részvételi díj 139.000 Ft + ÁFA.
iir-hungary.hu/rendezvenyek

NVIDIA GTC 2022
2021. november 8-11. Az NVIDIA globális online AI témájú konferenciája. A konferencián a részvétel ingyenes, az egynapos workshopok $99-tól elérhetőek.
nvidia.com/gtc/

Domopalooza
2022. március 22-25. A Domo BI témájú konferenciája. Salt Lake City-ben kerül megrendezésre, de online is követhető. A részvétel ez esetben ingyenes.
domo.com/domopalooza

SciMLCon
2022. március 23. Az online esemény a Julia-alapú SciML-eszközök fejlesztésére és alkalmazásaira összpontosít. A konferencián a részvétel ingyenes.
scimlcon.org/2022/

 

Photo by Storiès on Unsplash

Felvásárolja az Idera a Yellowfint

A BI piaci konszolidációja tovább zajlik, a sort januárban az Alteryx-Trifacta felvásárlás indította, most pedig a technológiai ernyőcégként működő Idera vette meg az ausztrál Yellowfint.

Yellowfin

A Yellowfin egyike a kisebb, de innovatív BI cégeknek, amely több ezer ügyféllel rendelkezik 50 országban, a végfelhasználók száma pedig 3 millió körül van. A 2021-es Gartner BI mágikus négyzetben a Yellowfin a vizionáriusok szegmensében kapott helyet.

A cég technológiai fejlesztései közül említésre méltó az adatokat automatikusan monitorozó Yellowfin Signal és a decemberben megjelent természetes nyelvű Guided NLQ lekérdezőfelület.

Idera

A houstoni székhelyű Idera több tucatnyi kisebb-nagyobb szoftvercéget vásárolt fel az elmúlt években.

Az adatos akvizíciók közül a legismertebb az adattárház automatizációval foglalkozó  Wherescape, amelyet 2019-ben vett meg az Idera. A portfólióban szerepel még a nyílt data lake platformot kínáló Qubole és a Javascript alapú FusionCharts adatvizualizációs csomag.

Új kiadás Wes McKinney Python könyvéből

A pandas csomag a Python adatelemzési svájci bicskája, gyakorlatilag mindenhol találkozunk vele.  A csomag szerzője Wes McKinney, akinek Python for Data Analyis című, a pandas használatát bemutató  könyve alapműnek számít.

Az új kiadás már a Python 3.10 és a pandas 1.4 verziókra épül, bemutatva az elmúlt néhány év legfontosabb változásait.

A harmadik kiadásból is lesz a weben ingyen olvasható "open access" verzió.  Az első 6 fejezet máris elérhető:

  1. Preliminaries
  2. Python Language Basics, IPython, and Jupyter Notebooks
  3. Built-in Data Structures, Functions, and Files
  4. NumPy Basics: Arrays and Vectorized Computation
  5. Getting Started with pandas
  6. Data Loading, Storage, and File Formats

A nyomtatott és ebook kiadások később jelennek meg majd.