Исследовать >   IBM PartnerWorld
 |  |  |  |  | 
Перевод
中文(简体)中文(漢字)EnglishFrançaisItaliano日本語한국어PortuguêsРусскийEspañol
по Transposh - translation plugin for wordpress

Виджет перевод предоставляется для вашего удобства, чтобы облегчить перевод на английском языке этого блога на несколько языков. Если вы решите использовать этот объект автоматизированного перевода, Пожалуйста, поймите, что там могут быть отклонения между автоматизированного перевода и оригинальной английской версии. IBM не несет ответственности за любые такие отклонения автоматизированного перевода и предлагает переведенной версии "КАК" без гарантий любого рода.

АНАЛИТИКА Создание спроса Инфраструктура Во всем мире

Решение проблемы больших данных

Решение проблемы больших данных

Построение масштабируемой, высокопроизводительный кластер данных для обслуживания больших аналитических данных

Большие аналитические данные проекты неизбежно начинаются с большими надеждами и грандиозными планами. Начало работы с Hadoop и Спарк прост. Пилотные проекты начинаются с инструментами с открытым исходным кодом, образец данных и скромная цель. Пилотный успех может быть один видом ранее независимых данных, что позволяет впритык отчетности клиента или процесс. И тут начинается самое интересное. Реальные данные. Регулярные отчеты. Масштабирование кластера.

Самое слабое звено и самый простой вопрос для адреса хранения. хранения данных с открытым исходным кодом по умолчанию, Hadoop Distributed File System (HDFS), не был разработан для предприятия. Например, данные организации хотят анализировать почти всегда из других источников. Он может иметь информацию о клиенте, который должен быть обеспечен и контролируемым доступом. Неизбежно, другие приложения или пользователи также хотят использовать одни и те же данные, что и большой кластер данных, используя стандартные интерфейсы файлов или объектов.

Решение состоит в том, чтобы построить масштабируемое, высокопроизводительный кластер данных для обслуживания больших аналитических данных, также поддерживает стандартные протоколы. С полной поддержкой HDFS и масштабируемой производительностью ведущей параллельной файловой системы, Сервер IBM Упругие хранения (ESS) 5.2 является идеальным строительным блоком для большого хранения данных Google Analytics. Построенный с IBM Spectrum Scale, HDFS прозрачный разъем позволяет с открытым исходным кодом Hadoop и Spark, рамки для работы без каких-либо изменений. На самом деле, Hortonworks недавно бумажно-сертифицированный IBM Spectrum Scale по его портфелю.

Реальная проблема для бизнес-партнеров IBM будет строить бизнес-кейс для ESS 5.2 и IBM Spectrum Scale с тремя основными заинтересованными сторонами в большом проекте анализа данных.

Ученый данные на основной пилот команды будет сопротивляться любым дивергенцию от выбора с открытым исходным кодом, потому что он или она боится, решение не будет выступать в качестве кластера чешуи. Проверенные на массивных скоплениях, параллельная файловая система IBM Spectrum Scale удаляет узкие данных общие для других решений. Он может превзойти HDFS на многих тестах. Однако, это устранение преобразования употребляют данные и извлечения времени, что позволит значительно ускорить время прозрения и убедить ученый ДАННЫМ реально смотреть на IBM Spectrum Scale и ESS.

Для ИТ-отдела, который должен поддерживать окружающую среду, выбор ESS может снизить как капитальные и эксплуатационные расходы решения. Поскольку ЕСС использует передовые кодирование стирания для распространения и защиты данных, хранения ESS данных требуется только 22 процентов больше, чем физическая память данных. В противоположность, HDFS использует трехходовую репликацию-300 процентов данных, проанализированные. В дополнение, ESS является архитектурой, чтобы выжить несколько неудач и безопасную целостность данных. Резервные пути данных и из конца в конец контрольной сумма делают большинство вопросов строго фоновой задачи для ремонта, не является чрезвычайной. ESS GUI обеспечивает полный обзор аппаратного и программного обеспечения, и интегрируется в IBM Spectrum Control для портфолио хранения и тенденции.

Бизнес-линия исполнительной спонсирует проект, вероятно, будет знать о безопасности и управления данными и результатами, для хранения данных с открытым исходным кодом не обеспечивает. Соблюдение секретности и правила часто требует возможности аудита мошенничества, Риск или соответствие результата с архивами. Это тривиальное для систем масштаба IBM Spectrum, которые поддерживаются IBM Spectrum Защищать и большинство основных решений для резервного копирования.

Однако, это может быть видение будущего больших данных организации о том, что исполнительный найти наиболее убедительным. IBM Spectrum Scale и Hadoop Connector может федеративные несколько источников данных в единое представление HDFS. Он может охватывать географические регионы для глобального сотрудничества. Плюс, он может автоматически уровня на ленту, на помещения объекта хранения или облака по-настоящему архив и анализа на месте.

IBM Spectrum Scale, особенно ESS 5.2 все-вспышки решение, является идеальной причиной, чтобы обсудить план для большого анализа данных с вашими клиентами. Они по-прежнему могут находиться в пилотной стадии, но вы будете готовы к ним, когда они перемещаются из песочница для производства. Вы можете, дайте мне знать, что вы думаете, используя комментарии есть ниже.

Дуг О'Флахерти
Менеджер, Маркетинг IBM Spectrum Solutions

Дуглас О'Флахерти ведет IBM Spectrum Solutions маркетинговые команды, которая включает в себя IBM Spectrum Storage и IBM Spectrum Computing портфели. Его опыт включает в себя как крупные компании и стартапы, и он был с IBM, так как 2015. Г-н. О'Флахерти является давним евангелист ГПЦ и больших данных в коммерческих приложениях.

Связанные с Статьи

ВАШИ КОММЕНТАРИИ

Ваш электронный адрес не будет опубликован. Обязательные поля отмечены *

Имя *

Отправить по электронной почте *

Веб-сайт