Microsoft najavljuje Azure Databricks za najučinkovitije analitičke projekte strujanja

Ikona vremena čitanja 3 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

Databricks pruža Unified Analytics Platformu za timove za podatkovne znanosti za suradnju s podatkovnim inženjeringom i poslovnim linijama za izradu podatkovnih proizvoda. Na današnjem događaju za razvojne programere Connect(), Microsoft najavio Novi Usluga Azure Databricks za najučinkovitije projekte analize strujanja. Microsoft je surađivao s osnivačima Apache Spark za ovu novu uslugu. Azure Databricks je analitička platforma zasnovana na Apache Sparku koja nudi postavljanje jednim klikom, pojednostavljene tijekove rada i interaktivni radni prostor. Azure Databricks također dolazi s izvornom integracijom s Azure SQL Data Warehouse, Azure Storage, Azure Cosmos DB, Azure Active Directory i Power BI. Pročitajte o ovoj integraciji u nastavku.

  • Raznolikost tipova VM-a: Kupci mogu koristiti sve postojeće VM-ove uključujući F-seriju za scenarije strojnog učenja, M-seriju za scenarije velike memorije, D-seriju za opću namjenu itd.
  • Sigurnost i privatnost: U Azureu vlasništvo i kontrola podataka je na korisniku. Izgradili smo Azure Databricks kako bismo se pridržavali ovih standarda. Cilj nam je da Azure Databricks pruži sve certifikate o usklađenosti kojih se pridržava ostatak Azurea.
  • Fleksibilnost mrežne topologije: Korisnici imaju različite potrebe mrežne infrastrukture. Azure Databricks podržava implementacije u korisničkim VNET-ovima, koji mogu kontrolirati kojim se izvorima i prijemnicima može pristupiti i kako im se pristupa.
  • Integracija Azure Storage i Azure Data Lake: ove su usluge pohrane izložene korisnicima Databricks-a putem DBFS-a kako bi se osiguralo predmemorija i optimizirana analiza postojećih podataka.
  • Azure Power BI: Korisnici mogu povezati Power BI izravno sa svojim Databricks klasterima pomoću JDBC-a kako bi interaktivno upitali podatke u masovnom obimu koristeći poznate alate.
  • Azure Active Directory pruža kontrolu pristupa resursima i već se koristi u većini poduzeća. Radni prostori Azure Databricks implementiraju se u pretplatama korisnika, tako da se naravno AAD može koristiti za kontrolu pristupa izvorima, rezultatima i poslovima.
  • Azure SQL Data Warehouse, Azure SQL DB i Azure CosmosDB: Azure Databricks jednostavno i učinkovito prenosi rezultate u ove usluge za daljnju analizu i posluživanje u stvarnom vremenu, što olakšava izgradnju end-to-end arhitektura podataka na Azureu.
  • Interno koristimo Azure Container Services za pokretanje Azure Databricks kontrolne ravnine i podatkovne ravnine putem spremnika.
  • Accelerated Networking pruža najbržu virtualiziranu mrežnu infrastrukturu u oblaku. Azure Databricks to koristi za daljnje poboljšanje performansi Sparka.
  • Najnovija generacija Azure hardvera (Dv3 VM-ovi), s NvMe SSD-ovima koji mogu povećati latenciju od 100us na IO-u. To čini Databricks I/O performanse još boljim.

U vezi s tim, Microsoft je danas objavio da se pridružuju MariaDB Foundation kao platinasti član. Uskoro će objaviti pregled Azure baze podataka za MariaDB za potpuno upravljanu MariaDB uslugu u oblaku. Također su objavili da Apache Cassandra API podržava Cosmos DB. Ponudit će Cassandru kao uslugu preko globalne distribucije po principu ključ u ruke, više razina dosljednosti i vodeće SLA-ove u industriji.

Više o temama: Apache Cassandra API, Apache Sparks, plavetnilo, Azure Cosmos DB, Azure Databricks, Microsoft

Ostavi odgovor

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena *