Microsoft oznamuje Azure Databricks pro nejvýkonnější analytické projekty streamování

Ikona času čtení 3 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Databricks poskytuje platformu Unified Analytics Platform pro týmy datové vědy, aby spolupracovali s datovým inženýrstvím a obory podnikání na vytváření datových produktů. Na dnešní vývojářské události Connect() společnost Microsoft oznámila, nové Služba Azure Databricks pro nejvýkonnější projekty analýzy streamování. Microsoft na této nové službě spolupracoval se zakladateli Apache Spark. Azure Databricks je analytická platforma založená na Apache Spark, která nabízí nastavení jedním kliknutím, zjednodušené pracovní postupy a interaktivní pracovní prostor. Azure Databricks také přichází s nativní integrací s Azure SQL Data Warehouse, Azure Storage, Azure Cosmos DB, Azure Active Directory a Power BI. Přečtěte si o této integraci níže.

  • Rozmanitost typů virtuálních počítačů: Zákazníci mohou používat všechny stávající virtuální počítače, včetně řady F pro scénáře strojového učení, řady M pro scénáře s masivní pamětí, řady D pro obecné účely atd.
  • Zabezpečení a soukromí: V Azure je vlastnictví a kontrola dat na zákazníkovi. Azure Databricks jsme vytvořili tak, aby dodržovaly tyto standardy. Naším cílem je, aby Azure Databricks poskytovaly všechny certifikace souladu, které zbytek Azure dodržuje.
  • Flexibilita topologie sítě: Zákazníci mají různé potřeby síťové infrastruktury. Azure Databricks podporuje nasazení v zákaznických virtuálních sítích, které mohou řídit, ke kterým zdrojům a jímkám lze přistupovat a jak k nim přistupovat.
  • Integrace Azure Storage a Azure Data Lake: Tyto služby úložiště jsou k dispozici uživatelům Databricks prostřednictvím DBFS, aby poskytovaly ukládání do mezipaměti a optimalizovanou analýzu existujících dat.
  • Azure Power BI: Uživatelé mohou připojit Power BI přímo ke svým clusterům Databricks pomocí JDBC, aby mohli interaktivně dotazovat data ve velkém měřítku pomocí známých nástrojů.
  • Azure Active Directory poskytuje řízení přístupu k prostředkům a už se používá ve většině podniků. Nasazení pracovních prostorů Azure Databricks v zákaznických předplatných, takže AAD lze přirozeně použít k řízení přístupu ke zdrojům, výsledkům a úlohám.
  • Azure SQL Data Warehouse, Azure SQL DB a Azure CosmosDB: Azure Databricks snadno a efektivně nahrává výsledky do těchto služeb pro další analýzu a obsluhu v reálném čase, což usnadňuje vytváření kompletních datových architektur v Azure.
  • Interně používáme Azure Container Services ke spouštění řídicí roviny Azure Databricks a datových rovin prostřednictvím kontejnerů.
  • Accelerated Networking poskytuje nejrychlejší virtualizovanou síťovou infrastrukturu v cloudu. Azure Databricks to využívá k dalšímu zlepšení výkonu Spark.
  • Nejnovější generace hardwaru Azure (Dv3 VM) s NvMe SSD schopnými dosáhnout 100us latence na IO. Díky nim je výkon I/O Databricks ještě lepší.

Společnost Microsoft dnes oznámila, že se připojuje k MariaDB Foundation jako platinový člen. Brzy vydají náhled Azure Database for MariaDB pro plně spravovanou službu MariaDB v cloudu. Také oznámili, že Apache Cassandra API podporuje Cosmos DB. Budou nabízet Cassandru jako službu v rámci globální distribuce na klíč, více úrovní konzistence a špičkových SLA.

Více o tématech: Apache Cassandra API, Apache Sparks, blankyt, Azure Cosmos DB, Azure Databricks, microsoft

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *