Microsoft công bố Azure Databricks cho các dự án phân tích phát trực tuyến hiệu suất cao nhất

Biểu tượng thời gian đọc 3 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Databricks cung cấp Nền tảng phân tích hợp nhất cho các nhóm khoa học dữ liệu cộng tác với kỹ thuật dữ liệu và các ngành kinh doanh để xây dựng các sản phẩm dữ liệu. Tại sự kiện dành cho nhà phát triển Connect () hôm nay, Microsoft công bố cái mới Dịch vụ Azure Databricks cho các dự án phân tích phát trực tuyến hiệu suất cao nhất. Microsoft đã làm việc với những người sáng lập Apache Spark cho dịch vụ mới này. Azure Databricks là một nền tảng phân tích dựa trên Apache Spark, cung cấp thiết lập bằng một cú nhấp chuột, quy trình làm việc được sắp xếp hợp lý và không gian làm việc tương tác. Azure Databricks cũng đi kèm với tích hợp gốc với Azure SQL Data Warehouse, Azure Storage, Azure Cosmos DB, Azure Active Directory và Power BI. Đọc về tích hợp này bên dưới.

  • Đa dạng các loại máy ảo: Khách hàng có thể sử dụng tất cả các máy ảo hiện có bao gồm F-series cho các kịch bản máy học, M-series cho các kịch bản bộ nhớ lớn, D-series cho mục đích chung, v.v.
  • Bảo mật và Quyền riêng tư: Trong Azure, khách hàng có quyền sở hữu và kiểm soát dữ liệu. Chúng tôi đã xây dựng Azure Databricks để tuân thủ các tiêu chuẩn này. Chúng tôi mong muốn Azure Databricks cung cấp tất cả các chứng nhận tuân thủ mà phần còn lại của Azure tuân theo.
  • Tính linh hoạt trong cấu trúc liên kết mạng: Khách hàng có nhu cầu đa dạng về cơ sở hạ tầng mạng. Azure Databricks hỗ trợ triển khai trong các VNET của khách hàng, có thể kiểm soát những nguồn và phần chìm nào có thể được truy cập và cách chúng được truy cập.
  • Lưu trữ Azure và tích hợp Azure Data Lake: Các dịch vụ lưu trữ này được tiếp xúc với người dùng Databricks thông qua DBFS để cung cấp bộ nhớ đệm và phân tích tối ưu hóa dữ liệu hiện có.
  • Azure Power BI: Người dùng có thể kết nối Power BI trực tiếp với các cụm Databricks của họ bằng JDBC để truy vấn dữ liệu tương tác ở quy mô lớn bằng các công cụ quen thuộc.
  • Azure Active Directory cung cấp các kiểm soát quyền truy cập vào tài nguyên và đã được sử dụng trong hầu hết các doanh nghiệp. Không gian làm việc Azure Databricks triển khai trong đăng ký của khách hàng, vì vậy, AAD đương nhiên có thể được sử dụng để kiểm soát quyền truy cập vào các nguồn, kết quả và công việc.
  • Azure SQL Data Warehouse, Azure SQL DB và Azure CosmosDB: Azure Databricks tải kết quả lên các dịch vụ này một cách dễ dàng và hiệu quả để phân tích sâu hơn và phục vụ theo thời gian thực, giúp việc xây dựng kiến ​​trúc dữ liệu end-to-end trên Azure trở nên đơn giản.
  • Trong nội bộ, chúng tôi sử dụng Dịch vụ vùng chứa Azure để chạy mặt phẳng điều khiển Azure Databricks và mặt phẳng dữ liệu thông qua vùng chứa.
  • Mạng được tăng tốc cung cấp cơ sở hạ tầng mạng ảo hóa nhanh nhất trên đám mây. Azure Databricks sử dụng điều này để cải thiện hơn nữa hiệu suất của Spark.
  • Thế hệ phần cứng Azure mới nhất (máy ảo Dv3), với SSD NvMe có khả năng tăng độ trễ 100us trên IO. Những điều này làm cho hiệu suất Databricks I / O thậm chí còn tốt hơn.

Trên một lưu ý liên quan, Microsoft hôm nay đã thông báo rằng họ sẽ tham gia Quỹ MariaDB với tư cách là thành viên bạch kim. Họ sẽ sớm phát hành bản xem trước Cơ sở dữ liệu Azure cho MariaDB cho một dịch vụ MariaDB được quản lý hoàn toàn trên đám mây. Họ cũng thông báo rằng hỗ trợ API Apache Cassandra cho Cosmos DB. Họ sẽ cung cấp Cassandra như một dịch vụ phân phối toàn cầu theo phương thức chìa khóa trao tay, nhiều cấp độ nhất quán và SLA hàng đầu trong ngành.

Diễn đàn người dùng

Tin nhắn 0