Esplora >   IBM PartnerWorld
 |  |  |  |  | 
Traduzione
中文(简体)中文(漢字)EnglishFrançaisItaliano日本語한국어PortuguêsРусскийEspañol
da Transposh - plugin di traduzione per wordpress

È presente un widget di traduzione per la vostra comodità facilitare la traduzione della versione in lingua inglese di questo blog in diverse lingue. Se si sceglie di utilizzare questo strumento di traduzione automatica, vi prego di capire ci possono essere differenze tra la traduzione automatica e la versione originale inglese. IBM non è responsabile per qualsiasi tali deviazioni di traduzione automatizzata e offre la versione tradotta "COME È" senza garanzie di alcun tipo.

ANALYTICS Generazione di domanda Infrastrutture In tutto il mondo

Affrontare la sfida dei Big Data

Affrontare la sfida dei Big Data

Costruire un scalabile, cluster di dati ad alte prestazioni per servire le grandi analisi dei dati

I grandi progetti di analisi dei dati cominciano inevitabilmente con grandi speranze e grandi progetti. Iniziare con Hadoop e Spark è semplice. I progetti pilota iniziano con strumenti open source, dati di esempio e un obiettivo modesto. successo pilota potrebbe essere una singola visualizzazione dei dati precedentemente indipendente che consenta una notifica end-to-end di un cliente o un processo. E poi inizia il divertimento. dati reali. relazioni periodiche. Scaling il cluster.

L'anello più debole e la questione più facile da affrontare è di stoccaggio. L'archiviazione dei dati open source di default, Hadoop Distributed File System (HDFS), non è stato progettato per l'impresa. Per esempio, i dati organizzazioni vogliono analizzare è quasi sempre da altre fonti. Può avere le informazioni del cliente che ha bisogno di essere protetto e ad accesso controllato. Inevitabilmente, altre applicazioni o utenti vogliono anche di utilizzare gli stessi dati come il grande cluster di dati tramite interfacce di file o oggetti standard del settore.

La soluzione è quella di costruire una soluzione scalabile, cluster di dati ad alte prestazioni per servire le grandi analisi dei dati che supporta anche i protocolli standard di settore. Con il supporto completo HDFS e prestazioni scalabili del file principale sistema parallelo, IBM Elastic Storage Server (ESS) 5.2 è l'elemento perfetto per il grande stoccaggio di analisi dei dati. costruito con IBM Spectrum Scala, il connettore HDFS trasparente consente open source Hadoop e Spark quadri per funzionare senza alcuna modifica. Infatti, Hortonworks recentemente carta certificata IBM Spectrum Scala tutto il suo portafoglio.

La vera sfida per i Business Partner IBM sarà la costruzione il business case per ESS 5.2 e scala IBM Spectrum con i tre principali parti interessate in un grande progetto di analisi dei dati.

Lo scienziato dei dati sul core team pilota resistere a qualsiasi divergenza tra le opzioni open source perché lui o lei teme la soluzione non si esibirà come la bilancia a grappolo. Provata su cluster di massa, il file parallele sistema IBM Spectrum Scala rimuove il i colli di bottiglia dei dati comune ad altre soluzioni. Si può sovraperformare HDFS su molti parametri di riferimento. Tuttavia, è l'eliminazione dei dati ingerire trasformazione ed estrazione tempo che accelerare notevolmente il tempo necessario per la comprensione dei dati e convincere gli scienziati di guardare davvero in IBM Spectrum Scala e ESS.

Per il reparto IT che deve supportare l'ambiente, la scelta di ESS può abbassare sia il CapEx e OpEx della soluzione. Poiché ESS utilizza la codifica cancellazione avanzata per distribuire e proteggere i dati, la memorizzazione dei dati ESS richiede solo circa 22 per cento in più rispetto ai dati di archiviazione fisica. In contrasto, HDFS utilizza tre vie replica-300 per cento dei dati oggetto di analisi. Inoltre, ESS è progettato per sopravvivere guasti multipli e l'integrità dei dati sicura. percorsi di dati ridondanti e end-to-end di checksum fanno la maggior parte delle questioni strettamente un'attività in background per la riparazione, Non una situazione di emergenza. La GUI ESS fornisce una visione completa di hardware e software, e si integra in IBM spettro di controllo per una vista portafoglio di stoccaggio e tendenze.

Il dirigente d'azienda-line sponsorizzando il progetto sarà probabilmente consapevole della sicurezza e della governance dei dati e dei risultati che la memorizzazione dei dati open source non fornisce. Il rispetto della privacy e regolamenti spesso richiede la capacità di controllare una frode, rischio o la conformità risultato con gli archivi. Questi sono banali per i sistemi IBM scala Spectrum, che sono supportati da IBM Spectrum Proteggere e la maggior parte delle soluzioni di backup principali.

Tuttavia, può essere la visione del futuro big data dell'organizzazione che un dirigente troverà più convincente. IBM Spectrum Scala e il Hadoop connettore può associare più fonti di dati in una singola vista HDFS. Esso può estendersi aree geografiche per la collaborazione globale. Più, esso può automaticamente fila nastro, on-premises di stoccaggio oggetto o il cloud per allineare archivio e analizzare sul posto.

IBM Spectrum Scala, in particolare l'ESS 5.2 tutto-flash soluzione, è un motivo perfetto per discutere la tabella di marcia per le grandi analisi dei dati con i vostri clienti. Essi possono essere ancora in una fase pilota, ma sarete pronti per loro quando si spostano da sandbox alla produzione. È possibile fatemi sapere cosa ne pensate utilizzando i commenti qui sotto sono dotate di.

Doug O'Flaherty
Manager, IBM Spectrum Solutions Marketing

Douglas O'Flaherty conduce le squadre IBM spettro di soluzioni di marketing, che comprende i portafogli IBM spettro di stoccaggio e IBM Spectrum Computing. Il suo background comprende sia le grandi aziende e start-up ed è stato con IBM dal 2015. Signor. O'Flaherty è un evangelista di lunga data per HPC e Big Data in applicazioni commerciali.

Correlati Articoli

PUBBLICA I TUOI COMMENTI

Il tuo indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

Nome *

Posta elettronica *

Sito Web