> Enjeux IT > Silicon Valley – Hortonworks unifie données au repos et en mouvement

Silicon Valley – Hortonworks unifie données au repos et en mouvement

Enjeux IT - Par José Diz - Publié le 12 avril 2016
email

Silicon Valley Tour, Hortonworks unifie données au repos et données en mouvement

Silicon Valley – Hortonworks unifie données au repos et en mouvement

En intégrant étroitement sa plateforme HDP (et son data lake) et sa plateforme de streaming analytique Dataflow, Hortonworks étend son potentiel Big Data à l’Internet des objets et même, à l’Internet of Anything.

Après son entrée en bourse en décembre 2014, Hortonworks s’est installée dans un nouvel immeuble de Santa Clara. Cependant, pour des raisons pratiques, nous les avons rencontrés dans leurs bureaux, au cœur de San Francisco.

Quand on est l’un des trois pionniers d’Hadoop, ou plus largement du Big Data, la course à l’innovation devient un des leviers majeurs de réussite. Et plus encore pour Hortonworks qui est positionnée comme éditeur 100% open source, sans version Premium, Enterprise ou privilégiée pour les souscripteurs. 

Avec les objets connectés et autres capteurs ou senseurs de l’Internet des objets, les flux de données à gérer et/ou à stocker (ou non) peuvent vite devenir ingérables. 

Le comportement des données à la loupe

Les “data at rest” (données au repos) sont les informations stockées  sur des supports de stockage persistants (base de données, tableurs, bureautique, datawarehouse…). 

Les “data in use” (données en cours d’utilisation) sont celles qui servent actuellement et se trouvent sur un support de stockage volatiles. Enfin, “data in motion” (ou data in transit, données en transit ou en mouvement) qualifie les données en cours de transit sur des réseaux publics ou privés.

La vision d’Hortonworks pour ses plateformes de données de nouvelle génération consiste à conjuguer les outils gérant ces divers types de données. « Les flux de données en mouvement dans l’entreprise circulent de “façon aveugle” à travers des silos ou des “points aveugles”, tandis que les “données au repos” sont très fragmentées augmentant les coûts de fonctionnement et de maintenance, » explique Herb Cunitz, président d’HortonWorks. « En combinant nos plateformes Dataflow 1.2 (pour le data-in-motion)  et Horton Data Platform 2.4  (pour le data-at-rest, avec son datalake), nous proposons une combinaison intelligente prête pour des actions cohérentes, évitant les disparitions ou la non-visibilité de données en mouvement et unifiant l’historique riche et complet des données au repos.»  

(((IMG8313)))

Nouvelles versions intégrées de Dataflow et HDP

Annoncé début mars, Hortonworks Dataflow 1 .2 est une plateforme de gestion de données en mouvement pour de l’analytique en continu, intégrant moteurs Apache Kafka et Apache Storm. Elle repose sur la technologie Apache Nifi (dont l’éditeur a racheté le spécialiste Onyara en août 2015), qui gère des flux très importants de données de tout format en mode bidirectionnel. Le tout avec des mesures de sécurité évoluées, et des fonctions de traçabilité. Hortonworks a donc achevé l’intégration du NiFi avec les moteurs précités, mais aussi avec sa plateforme HDP qui sert de stockage pour les données à conserver. 

Ainsi, l’entreprise peut collecter, déplacer et stocker les données en temps réel, quelles que soient la source et la destination. Et en profiter pour réaliser une analyse en continu. Une aubaine pour “l’Internet of Anything” mis en avant par l’éditeur open source. Rappel : tous ces logiciels Hortonworks sont intégralement en open source.

Le président rappelle également que l’intégration d’Apache Spark 1.6 dans HDP 2.4 lui confère des performances inédites en streaming, 10 fois supérieures aux implémentations Spark du marché. Sans oublier l’optimisation automatique de la mémoire de cette nouvelle version d’HDP.

100% open source et rentable dès cette année !

Après avoir levé 100 millions de dollars en bourse, Hortonworks poursuit sa course vers l’équilibre financier. « Dans un premier temps, nous avions annoncé parvenir à cet équilibre en 2017, » rappelle Herb Cunitz, qui annonce confiant : « Désormais, nous devrions être rentables dès 2016 ! En période de crise, l’open source devient un argument de poids pour les entreprises, surtout lorsqu’il est de qualité avec un support assuré par des spécialistes. » 

Contrairement à nombre de distributions open source (quel que soient les projets), les logiciels Hortonworks sont 100% open source. Dans ces conditions, comment assurer un revenu conséquent ? Il semblerait que les entreprises fassent confiance à l’éditeur puisque 75% de ses revenus proviendraient du support, et 25% de la formation. « Les technologies évoluent trop vite pour que la plupart des entreprises puissent suivre assidument. Or, c’est justement la spécialité de nos équipes, qui y consacrent l’essentiel de leur temps, » assure le président. L’écosystème des partenaires se développe, les formations se poursuivent et les technologies autour de Big Data et des données sont très dynamiques. Voilà qui devrait contribuer à la réussite de ce modèle.

Téléchargez cette ressource

Préparer l’entreprise aux technologies interconnectées

Préparer l’entreprise aux technologies interconnectées

Avec la « quatrième révolution industrielle », les environnements hyperconnectés entraînent de nouveaux risques en matière de sécurité. Découvrez, dans ce guide Kaspersky, comment faire face à cette nouvelle ère de vulnérabilité.

Enjeux IT - Par José Diz - Publié le 12 avril 2016