{"id":2604,"date":"2016-06-30T18:53:01","date_gmt":"2016-06-30T23:53:01","guid":{"rendered":"http:\/\/itsoftware.com.co\/content\/?p=2604"},"modified":"2020-11-19T16:40:10","modified_gmt":"2020-11-19T21:40:10","slug":"que-es-apache-hadoop","status":"publish","type":"post","link":"https:\/\/itsoftware.com.co\/content\/que-es-apache-hadoop\/","title":{"rendered":"Apache Hadoop: \u00bfQu\u00e9 es, para qu\u00e9 sirve, en qu\u00e9 se usa?"},"content":{"rendered":"<p><strong>Apache Hadoop<\/strong> es un proyecto de la organizacion Apache, que se encarga de desarrollar un software abierto, confiable y escalable para la computaci\u00f3n distribuida.<\/p>\n<figure id=\"attachment_2605\" aria-describedby=\"caption-attachment-2605\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2016\/06\/hadoop-logo.jpg\"><img decoding=\"async\" class=\"wp-image-2605 size-medium\" src=\"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2016\/06\/hadoop-logo-300x71.jpg\" alt=\"Apache hadoop\" width=\"300\" height=\"71\" \/><\/a><figcaption id=\"caption-attachment-2605\" class=\"wp-caption-text\">Apache Hadoop<\/figcaption><\/figure>\n<p><!--more--><\/p>\n<p>Apache Hadoop es un \u00abframework\u00bb (marco de trabajo) que permite procesamiento distribuido de grandes conjuntos de datos, a trav\u00e9s de \u00abclusters\u00bb (grupos) de computadores, usando modelos simples de programaci\u00f3n. Est\u00e1 dise\u00f1ado para escalar desde pocos servidores a miles de servidores, cada uno ofreciendo su propio almacenamiento y procesamiento local.<\/p>\n<p>La librer\u00eda Hadoop est\u00e1 dise\u00f1ada para detectar y manajar fallas en la capa de aplicaci\u00f3n, y as\u00ed entregar un servicio de alta disponibilidad sobre un cluster de computadores, cada uno de los cuales puede estar propenso a fallas.<\/p>\n<p>El proyecto Hadoop consta de los siguientes m\u00f3dulos:<\/p>\n<ul>\n<li><strong>Hadoop Common<\/strong>: Son las utilidades comunes que soportan a los dem\u00e1s m\u00f3dulos Hadoop.<\/li>\n<\/ul>\n<ul>\n<li><strong>Hadoop Distribuited File System (HDFS):<\/strong> Es un sistema distribuido de archivos que provee un acceso de alto rendimiento a los datos de la aplicaci\u00f3n.<\/li>\n<\/ul>\n<ul>\n<li><strong>Hadoop YARN<\/strong>: Es un framework para programar tareas y gestionar los recursos del cluster.<\/li>\n<\/ul>\n<ul>\n<li><strong>Hadoop MapReduce<\/strong>: Es un sistema basado en YARN para procesamiento en paralelo de grandes conjuntos de datos.<\/li>\n<\/ul>\n<p>Adem\u00e1s de Hadoop, otros proyectos relacionados en los que trabaja Apache son:<\/p>\n<ul>\n<li><strong>Ambari:\u00a0<\/strong>Es una herramienta web para aprovisionar, gestionar y monitorear los clusters Apache Hadoop.<\/li>\n<\/ul>\n<ul>\n<li><strong>Avro<\/strong>: Es un sistema de serializaci\u00f3n de datos.<\/li>\n<\/ul>\n<ul>\n<li><strong>Cassandra<\/strong>: Es una base de datos multi-maestro en configuraci\u00f3n non-single-failure.<\/li>\n<\/ul>\n<ul>\n<li><strong>Chukwa<\/strong>: Es un sistema de recolecci\u00f3n de datos para gestionar grandes sistemas distribuidos.<\/li>\n<\/ul>\n<ul>\n<li><strong>HBase:<\/strong> Es una base de datos escalable y distribuida, que soporte almacenamiento de datos estructurados para tablas grandes.<\/li>\n<\/ul>\n<ul>\n<li><strong>Hive:<\/strong> Es una infraestructura data-warehouse que provee resumen de datos y consultas ad-hoc.<\/li>\n<\/ul>\n<ul>\n<li><strong>Mohout:<\/strong> Es una librer\u00eda escalable de aprendizaje de m\u00e1quina y de miner\u00eda de datos.<\/li>\n<\/ul>\n<ul>\n<li><strong>Pig:<\/strong> Es un framework para procesamiento en paralelo, con un lenguaje de alto nivel de flujo de datos.<\/li>\n<\/ul>\n<ul>\n<li><strong>Spark:<\/strong> Es un motor de computo r\u00e1pido y general para los datos Hadoop. Provee un modelo de programaci\u00f3n simpre y expresivo que soporta un amplio rango de aplicaciones, incluyendo ETL, aprendizaje de m\u00e1quina, flujos de procesos y computaci\u00f3n gr\u00e1fica.<\/li>\n<\/ul>\n<ul>\n<li><strong>Tez:<\/strong> Es un framework de programaci\u00f3n de flujo de datos, construido sobre Hadoop YARN.<\/li>\n<\/ul>\n<ul>\n<li><strong>ZooKeeper:<\/strong> Es un serivicio de coordinaci\u00f3n de alto rendimiento para aplicaciones distrubuidas.<\/li>\n<\/ul>\n<p>Apache Hadoop es una herramienta muy potente y al alcance de cualquiera para iniciarse en el mundo del manejo de big data, y el procesamiento en paralelo de grandes cantidades de informaci\u00f3n.<\/p>\n<p>Este art\u00edculo hace parte del servicio de divulgaci\u00f3n de conomimiento de <a href=\"http:\/\/itsoftware.com.co\">ITSoftware SAS<\/a>.<\/p>\n<hr \/>\n<blockquote><p><img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter size-full wp-image-7852\" src=\"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2017\/01\/Cartel-ITS.png\" alt=\"\" width=\"1343\" height=\"307\" srcset=\"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2017\/01\/Cartel-ITS.png 1343w, https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2017\/01\/Cartel-ITS-300x69.png 300w, https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2017\/01\/Cartel-ITS-768x176.png 768w, https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2017\/01\/Cartel-ITS-1024x234.png 1024w\" sizes=\"(max-width: 1343px) 100vw, 1343px\" \/><\/p><\/blockquote>\n<blockquote><p><span style=\"color: #3366ff;\"><em><strong><a style=\"color: #3366ff;\" href=\"http:\/\/www.itsoftware.com.co\">ITSoftware SAS<\/a><\/strong><\/em> es una empresa dedicada a innovar en el desarrollo de aplicaciones web y m\u00f3viles, destinadas a mejorar el desempe\u00f1o de los procesos de las empresas.<\/span><\/p>\n<p><span style=\"color: #3366ff;\">Te apoyamos para construir las soluciones que necesitas para tu negocio actual o tu emprendimiento. Ven y cons\u00faltanos en <strong><em><a style=\"color: #3366ff;\" href=\"http:\/\/www.itsoftware.com.co\">www.itsoftware.com.co<\/a><\/em>.<\/strong><\/span><\/p><\/blockquote>\n<hr \/>\n<h3>Si te gust\u00f3, por favor no te olvides de compartirlo en las redes sociales. \ud83d\ude09<\/h3>\n","protected":false},"excerpt":{"rendered":"<p>Apache Hadoop es un proyecto de la organizacion Apache, que se encarga de desarrollar un software abierto, confiable y escalable para la computaci\u00f3n distribuida.<\/p>\n","protected":false},"author":1,"featured_media":8676,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[97,707],"tags":[712,708,320,760,501,709,759,758],"class_list":["post-2604","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-bases-de-datos","category-big-data","tag-apache-hadoop","tag-big-data","tag-data-mining","tag-desarrollo-de-aplicaciones-colombia","tag-diseno-de-software","tag-mapreduce","tag-mineria-de-datos-bogota","tag-mineria-de-datos-colombia"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2016\/06\/hadoop-logo-1.jpg","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts\/2604","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/comments?post=2604"}],"version-history":[{"count":0,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts\/2604\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/media\/8676"}],"wp:attachment":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/media?parent=2604"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/categories?post=2604"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/tags?post=2604"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}