Microsoft julkistaa Azure Databricksin tehokkaimpiin suoratoistoanalytiikkaprojekteihin

Lukuajan kuvake 3 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Databricks tarjoaa Unified Analytics -alustan datatieteen ryhmille, jotka voivat tehdä yhteistyötä tietotekniikan ja liiketoimintalinjojen kanssa datatuotteiden rakentamiseksi. Microsoft tänään Connect()-kehittäjätapahtumassa ilmoitti uusi Azure Databricks -palvelu tehokkaimpia suoratoistoanalytiikkaprojekteja varten. Microsoft työskenteli Apache Sparkin perustajien kanssa tämän uuden palvelun luomiseksi. Azure Databricks on Apache Spark -pohjainen analytiikka-alusta, joka tarjoaa yhden napsautuksen asennuksen, virtaviivaiset työnkulut ja interaktiivisen työtilan. Azure Databricks sisältää myös natiiviintegraation Azure SQL Data Warehousen, Azure Storagen, Azure Cosmos DB:n, Azure Active Directoryn ja Power BI:n kanssa. Lue tästä integraatiosta alla.

  • VM-tyyppien monimuotoisuus: Asiakkaat voivat käyttää kaikkia olemassa olevia virtuaalikoneita, mukaan lukien F-sarja koneoppimisskenaarioihin, M-sarja massiivisiin muistiskenaarioihin, D-sarja yleiskäyttöön jne.
  • Suojaus ja tietosuoja: Azuressa tietojen omistus ja hallinta on asiakkaalla. Olemme rakentaneet Azure Databricksin noudattamaan näitä standardeja. Pyrimme siihen, että Azure Databricks tarjoaa kaikki vaatimustenmukaisuussertifikaatit, joita muu Azure noudattaa.
  • Joustavuus verkkotopologiassa: Asiakkailla on erilaisia ​​verkkoinfrastruktuuritarpeita. Azure Databricks tukee käyttöönottoja asiakkaiden VNET:issä, jotka voivat hallita, mitä lähteitä ja nieluja voidaan käyttää ja miten niitä käytetään.
  • Azure Storage- ja Azure Data Lake -integraatio: Nämä tallennuspalvelut ovat Databricks-käyttäjien saatavilla DBFS:n kautta, jotta ne tarjoavat välimuistin ja optimoidun analyysin olemassa olevista tiedoista.
  • Azure Power BI: Käyttäjät voivat yhdistää Power BI:n suoraan Databricks-klusteriinsa JDBC:n avulla tehdäkseen tiedoista interaktiivisia kyselyitä suuressa mittakaavassa tuttujen työkalujen avulla.
  • Azure Active Directory ohjaa resurssien käyttöä, ja se on jo käytössä useimmissa yrityksissä. Azure Databricks -työtilat otetaan käyttöön asiakkaiden tilauksissa, joten luonnollisesti AAD:tä voidaan käyttää lähteiden, tulosten ja töiden pääsyn hallintaan.
  • Azure SQL Data Warehouse, Azure SQL DB ja Azure CosmosDB: Azure Databricks lataa tulokset helposti ja tehokkaasti näihin palveluihin lisäanalyysiä ja reaaliaikaista käyttöä varten, mikä helpottaa päästä päähän -tietoarkkitehtuurien rakentamista Azuressa.
  • Käytämme sisäisesti Azure Container Services -palvelua Azure Databricksin ohjaustason ja datatasojen suorittamiseen säiliöiden kautta.
  • Accelerated Networking tarjoaa nopeimman virtualisoidun verkkoinfrastruktuurin pilvessä. Azure Databricks hyödyntää tätä parantaakseen Sparkin suorituskykyä entisestään.
  • Uusimman sukupolven Azure-laitteisto (Dv3 VM:t), joissa on NvMe SSD:t, jotka pystyvät nostamaan 100 us:n viiveen IO:ssa. Nämä parantavat Databricksin I/O-suorituskykyä entisestään.

Tähän liittyen Microsoft ilmoitti tänään liittyvänsä MariaDB Foundationiin platinajäseneksi. Pian he julkaisevat Azure Database for MariaDB:n esikatselun täysin hallittua MariaDB-palvelua varten pilvessä. He ilmoittivat myös, että Apache Cassandra API tukee Cosmos DB:tä. He tarjoavat Cassandraa avaimet käteen -periaatteella maailmanlaajuisen jakelun, useiden yhdenmukaisuustasojen ja alan johtavien SLA-sopimusten kautta.

Lisää aiheista: Apache Cassandra API, Apache Sparks, taivaansininen, Azure Cosmos DB, Azure-tietokannat, microsoft

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *