Microsoft объявляет о доступности виртуальной машины Linux Data Science на рынке Azure.
2 минута. читать
Опубликовано
Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее
Виртуальная машина Microsoft Data Science — это образ виртуальной машины (ВМ) Azure, предварительно установленный и настроенный с несколькими популярными инструментами, которые обычно используются для анализа данных и машинного обучения. Некоторые из включенных инструментов — это Microsoft R Server Developer Edition, дистрибутив Anaconda Python, Azure SDK и многое другое. Сегодня Microsoft объявила о доступности виртуальной машины Linux Data Science на рынке Azure. Этот пользовательский образ виртуальной машины создан на базе OpenLogic CentOS Linux версии 7.2. Ниже приведен список инструментов, предварительно установленных и настроенных на виртуальной машине Linux Data Science Virtual Machine.
- Microsoft R Открыть (с библиотекой ядра Intel Math).
- Дистрибутив Anaconda Python с Python 2.7 и 3.5.
- Jupyter Notebooks с ядром Python и R для просмотра и разработки данных в браузере.
- Инструменты Azure: интерфейс командной строки Azure для управления ресурсами Azure, Azure Storage Explorer для работы с большими двоичными объектами Azure.
- Локальный экземпляр базы данных Postgres.
- Инструменты машинного обучения:
- Машинное обучение Azure: производство моделей R и Python, созданных локально на виртуальной машине, в нашу облачную службу машинного обучения Azure с помощью предустановленных библиотек.
- Инструментарий вычислительной сети (CNTK): Программное обеспечение для глубокого обучения от Microsoft Research.
- Ваупал Ваббит: система машинного обучения, поддерживающая такие методы, как онлайн, хеширование, allreduce, сокращения, Learning2Search, активное и интерактивное обучение.
- XGBoost: Инструмент, обеспечивающий быструю и точную реализацию бустинг-дерева.
- погремушка (Аналитический инструмент R для легкого обучения): инструмент с графическим интерфейсом, который позволяет очень легко начать работу с аналитикой данных в R, с графическим исследованием данных, моделями ML и генерацией кода R.
- Средства разработки: Azure SDK на Java, Python, Node.js, Ruby, PHP; Eclipse IDE с подключаемым модулем Azure Toolkit; редакторы кода, такие как vim, gedit и Emacs (с надстройками ESS, auctex); Драйверы SQL Server и инструменты командной строки, такие как bcp (массовое копирование), sqlcmd (текстовая утилита запросов SQL Server); Графический клиент SQuirreL SQL для доступа к различным базам данных.
- Удаленный доступ через текстовый интерфейс через SSH-клиент (например, PuTTY или команду ssh) или через графический рабочий стол (требуется отдельная однократная установка X2Go на клиентский компьютер).
Подробнее об этом здесь.