{"id":379,"date":"2016-06-24T17:53:04","date_gmt":"2016-06-24T22:53:04","guid":{"rendered":"http:\/\/itsoftware.com.co\/content\/?p=379"},"modified":"2019-05-18T12:56:07","modified_gmt":"2019-05-18T17:56:07","slug":"que-es-big-data","status":"publish","type":"post","link":"https:\/\/itsoftware.com.co\/content\/que-es-big-data\/","title":{"rendered":"Big Data: \u00bfQu\u00e9 es, en qu\u00e9 consiste y d\u00f3nde se aplica?"},"content":{"rendered":"<p>En el mundo de la computaci\u00f3n actual es usual escuchar el t\u00e9rmino <em><strong>Big Data<\/strong><\/em>. En este art\u00edculo voy a tratar de forma general de este t\u00e9rmino, qu\u00e9 es, qu\u00e9 informaci\u00f3n contiene, para qu\u00e9 sirve, y cu\u00e1l es su importancia.<\/p>\n<figure id=\"attachment_5653\" aria-describedby=\"caption-attachment-5653\" style=\"width: 385px\" class=\"wp-caption aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" class=\" wp-image-5653\" src=\"https:\/\/itsoftware.com.co\/content\/wp-content\/uploads\/2016\/06\/Big-data.jpg\" alt=\"Big data\" width=\"385\" height=\"214\" \/><figcaption id=\"caption-attachment-5653\" class=\"wp-caption-text\">Big data<\/figcaption><\/figure>\n<p><!--more--><\/p>\n<p>En la actualidad se generan millones de datos a cada segundo, provenientes de diferentes fuentes, en forma de datos estructurados, no estructurados o semiestructurados. Hay tanta informaci\u00f3n que en ocasiones no se sabe qu\u00e9 informaci\u00f3n se debe recolectar para analizar, y si vale la pena el costo de manejarlos en bases de datos relacionales o bajo otros esquemas.<\/p>\n<p>El volumen actual de datos se generan desde multitud de or\u00edgenes, como smartphones, sistemas GPS, sensores de temperatura, humedad, el\u00e9ctricos, presi\u00f3n, m\u00e9dicos, sistemas de facturaci\u00f3n, impuestos, historias cl\u00ednicas, redes sociales, internet, correos electr\u00f3nicos, datos biom\u00e9tricos, por nombrar algunos de ellos. Es tan grande la cantidad de datos, que para que \u00e9stos puedan ser realmente efectivos, se necesita que puedan ser analizados muy r\u00e1pidamente.<\/p>\n<p>Generalmente se catalogan las fuentes de <em><strong>big data<\/strong> <\/em>en las siguientes categor\u00edas:<\/p>\n<ul>\n<li><strong>Web y redes sociales<\/strong>: Twitter, Facebook, Instagram, contenido web, etc.<\/li>\n<li><strong>Datos biom\u00e9tricos<\/strong>: Reconocimiento facial, huellas digitales, mapas de ADN, retina, etc.<\/li>\n<li><strong>Machine-to-Machine<\/strong>: Lecturas de sensores, RFID, GPS, temperatura, etc.<\/li>\n<li><strong>Generados por humanos<\/strong>: Grabaciones de voz de Call Centers, emails, registros m\u00e9dicos, notas de voz, documentos electr\u00f3nicos, etc.<\/li>\n<li><strong>Grandes datos de transacciones<\/strong>: Registros de facturaci\u00f3n, ventas, compras, registros detallados de llamadas etc.<\/li>\n<\/ul>\n<blockquote><p><em>Tambi\u00e9n puedes leer\u00a0<a href=\"https:\/\/itsoftware.com.co\/content\/que-es-la-base-de-datos-apache-cassandra\/\" rel=\"bookmark\">\u00bfQu\u00e9 es la base de datos Apache Cassandra? <\/a><\/em><\/p><\/blockquote>\n<p>En t\u00e9rminos de tama\u00f1o, en big data se habla en petabytes o exabyte, para darnos una idea de estos t\u00e9rminos, miremos sus valores expresados en bytes:<\/p>\n<p><em>Gigabyte = 10<sup>9<\/sup> = 1,000,000,000<\/em><em><br \/>\n<em>Terabyte = 10<sup>12<\/sup> = 1,000,000,000,000<\/em><br \/>\n<em>Petabyte = 10<sup>15<\/sup> = 1,000,000,000,000,000<\/em><br \/>\n<em>Exabyte = 10<sup>18<\/sup> = 1,000,000,000,000,000,000<\/em><\/em><\/p>\n<p>El an\u00e1lisis r\u00e1pido de toda esta cantidad de informaci\u00f3n, se ha vuelto \u00fatil para las compa\u00f1\u00edas para determinar tendencias o comportamiento de clientes, ventas, proveedores, insumos, etc. que en otras circunstancias pasar\u00edan desapercibidos.\u00a0 As\u00ed mismo en otras \u00e1reas el an\u00e1lisis de grandes cantidades de datos, es de suma importancia para encontrar patrones, como por ejemplo en la gesti\u00f3n de una ciudad, el comportamiento de los signos vitales de una persona, tendencias de compra, etc.<\/p>\n<blockquote><p><em>Tambi\u00e9n te puede interesar\u00a0<a href=\"https:\/\/itsoftware.com.co\/content\/que-es-y-para-que-sirve-mysql\/\" rel=\"bookmark\">\u00bfQu\u00e9 es y para que sirve MySQL Database?<\/a><\/em><\/p><\/blockquote>\n<p>Existen varias plataformas y metodolog\u00edas para el manejo de <strong>big data<\/strong>, a continuaci\u00f3n nombrar\u00e9 algunas de ellas:<\/p>\n<ul>\n<li><em>Hadoop (MapReduce) (Descrito en m\u00e1s detalle en el art\u00edculo <a href=\"https:\/\/itsoftware.com.co\/content\/que-es-mapreduce-para-procesamiento-en-paralelo\/\">\u00bfQu\u00e9 es MapReduce?<\/a>)<br \/>\n<\/em><\/li>\n<li><em>Avro<\/em><\/li>\n<li><a href=\"https:\/\/itsoftware.com.co\/content\/que-es-la-base-de-datos-apache-cassandra\/\"><em>Cassandra<\/em><\/a><\/li>\n<li><em>Chukwa<\/em><\/li>\n<li><em>Flume<\/em><\/li>\n<li><em>HBase<\/em><\/li>\n<li><em>Hive<\/em><\/li>\n<li><em>Jaql<\/em><\/li>\n<li><em>Lucene<\/em><\/li>\n<li><em>Oozie<\/em><\/li>\n<li><em>Pig<\/em><\/li>\n<li><em>ZooKeeper<\/em><\/li>\n<\/ul>\n<p>Gracias a los avances en las redes de datos, las grandes capacidades de almacenamiento, procesadores m\u00e1s potentes y distribuidos, el an\u00e1lisis y gesti\u00f3n de <strong>big data<\/strong> est\u00e1 empezando a cambiar el paradigma de las instituciones en la toma de decisiones; pudiendo tener mejores puntos de vista sobre el comportamiento de cualquier variable, permitiendo que la toma de decisiones pueda ser lo m\u00e1s acertada posible desde el punto de vista estad\u00edstico.<\/p>\n<p>Este art\u00edculo hace parte del sistema de divulgaci\u00f3n de conocimiento de <a href=\"http:\/\/itsoftware.com.co\">ITSoftware SAS<\/a>.<\/p>\n<h3>Si te gust\u00f3, por favor no olvides compartirlo en las redes sociales. \ud83d\ude09<\/h3>\n","protected":false},"excerpt":{"rendered":"<p>En el mundo de la computaci\u00f3n actual es usual escuchar el t\u00e9rmino Big Data. En este art\u00edculo voy a tratar de forma general de este t\u00e9rmino, qu\u00e9 es, qu\u00e9 informaci\u00f3n[&#8230;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[97,707],"tags":[376,708,320,977,978,976,711,247],"class_list":["post-379","post","type-post","status-publish","format-standard","hentry","category-bases-de-datos","category-big-data","tag-bases-de-datos","tag-big-data","tag-data-mining","tag-desarrollo-de-aplicaciones-moviles-bogota","tag-diseno-de-bases-de-datos","tag-empresas-de-desarrollo-de-software-bogota","tag-hadoop","tag-mineria-de-datos"],"aioseo_notices":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts\/379","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/comments?post=379"}],"version-history":[{"count":0,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/posts\/379\/revisions"}],"wp:attachment":[{"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/media?parent=379"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/categories?post=379"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/itsoftware.com.co\/content\/wp-json\/wp\/v2\/tags?post=379"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}