Microsoft julkistaa Azure Databricksin tehokkaimpiin suoratoistoanalytiikkaprojekteihin
3 min. lukea
Julkaistu
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Databricks tarjoaa Unified Analytics -alustan datatieteen ryhmille, jotka voivat tehdä yhteistyötä tietotekniikan ja liiketoimintalinjojen kanssa datatuotteiden rakentamiseksi. Microsoft tänään Connect()-kehittäjätapahtumassa ilmoitti uusi Azure Databricks -palvelu tehokkaimpia suoratoistoanalytiikkaprojekteja varten. Microsoft työskenteli Apache Sparkin perustajien kanssa tämän uuden palvelun luomiseksi. Azure Databricks on Apache Spark -pohjainen analytiikka-alusta, joka tarjoaa yhden napsautuksen asennuksen, virtaviivaiset työnkulut ja interaktiivisen työtilan. Azure Databricks sisältää myös natiiviintegraation Azure SQL Data Warehousen, Azure Storagen, Azure Cosmos DB:n, Azure Active Directoryn ja Power BI:n kanssa. Lue tästä integraatiosta alla.
- VM-tyyppien monimuotoisuus: Asiakkaat voivat käyttää kaikkia olemassa olevia virtuaalikoneita, mukaan lukien F-sarja koneoppimisskenaarioihin, M-sarja massiivisiin muistiskenaarioihin, D-sarja yleiskäyttöön jne.
- Suojaus ja tietosuoja: Azuressa tietojen omistus ja hallinta on asiakkaalla. Olemme rakentaneet Azure Databricksin noudattamaan näitä standardeja. Pyrimme siihen, että Azure Databricks tarjoaa kaikki vaatimustenmukaisuussertifikaatit, joita muu Azure noudattaa.
- Joustavuus verkkotopologiassa: Asiakkailla on erilaisia verkkoinfrastruktuuritarpeita. Azure Databricks tukee käyttöönottoja asiakkaiden VNET:issä, jotka voivat hallita, mitä lähteitä ja nieluja voidaan käyttää ja miten niitä käytetään.
- Azure Storage- ja Azure Data Lake -integraatio: Nämä tallennuspalvelut ovat Databricks-käyttäjien saatavilla DBFS:n kautta, jotta ne tarjoavat välimuistin ja optimoidun analyysin olemassa olevista tiedoista.
- Azure Power BI: Käyttäjät voivat yhdistää Power BI:n suoraan Databricks-klusteriinsa JDBC:n avulla tehdäkseen tiedoista interaktiivisia kyselyitä suuressa mittakaavassa tuttujen työkalujen avulla.
- Azure Active Directory ohjaa resurssien käyttöä, ja se on jo käytössä useimmissa yrityksissä. Azure Databricks -työtilat otetaan käyttöön asiakkaiden tilauksissa, joten luonnollisesti AAD:tä voidaan käyttää lähteiden, tulosten ja töiden pääsyn hallintaan.
- Azure SQL Data Warehouse, Azure SQL DB ja Azure CosmosDB: Azure Databricks lataa tulokset helposti ja tehokkaasti näihin palveluihin lisäanalyysiä ja reaaliaikaista käyttöä varten, mikä helpottaa päästä päähän -tietoarkkitehtuurien rakentamista Azuressa.
- Käytämme sisäisesti Azure Container Services -palvelua Azure Databricksin ohjaustason ja datatasojen suorittamiseen säiliöiden kautta.
- Accelerated Networking tarjoaa nopeimman virtualisoidun verkkoinfrastruktuurin pilvessä. Azure Databricks hyödyntää tätä parantaakseen Sparkin suorituskykyä entisestään.
- Uusimman sukupolven Azure-laitteisto (Dv3 VM:t), joissa on NvMe SSD:t, jotka pystyvät nostamaan 100 us:n viiveen IO:ssa. Nämä parantavat Databricksin I/O-suorituskykyä entisestään.
Tähän liittyen Microsoft ilmoitti tänään liittyvänsä MariaDB Foundationiin platinajäseneksi. Pian he julkaisevat Azure Database for MariaDB:n esikatselun täysin hallittua MariaDB-palvelua varten pilvessä. He ilmoittivat myös, että Apache Cassandra API tukee Cosmos DB:tä. He tarjoavat Cassandraa avaimet käteen -periaatteella maailmanlaajuisen jakelun, useiden yhdenmukaisuustasojen ja alan johtavien SLA-sopimusten kautta.
Käyttäjäfoorumi
0-viestit