¿Qué es NOSQL y qué BigData?

Entre las novedades que Delphi 10 Seattle ha integrado está el soporte a bases de datos NOSQL con FireDAC como componente de conexión. Debido a que  el término NoSQL ha sido desconocido para mi durante mucho tiempo así que decidí investigar un poco sobre el mismo y su relación con BigData.

Un poco de historia

Desde el nacimiento de la informática, esta ha tenido como principal objetivo la recolección, almacenamiento y gestión de datos. A partir de las necesidades de gestión automática de los mismos. En 1970 se establecen los fundamentos teóricos del modelo relacional de base de datos y gracias a ello se ha pasado de almacenar información en tarjetas perforadas al almacenamiento masivo en volúmenes del orden de los terabytes de información. El modelo relacional fue diseñado y creado para soportar cientos o miles de usuarios simultáneos así como el poder manejar grandes cantidades de datos pero debido al avance que existe día a día en las tecnologías de la información junto al incremento de la información recabada a través de medios como el web, el modelo relacional ha comenzado a tener problemas cuando se trata de grandes volúmenes de información. Con la profunda penetración de la red de redes, los usuarios han comenzado a tener una mayor integración con los sistemas lo que ha propiciado que servicios como las redes sociales, blogs, e-comerce, etc, tuvieran cada vez una mayor demanda de almacenamiento de datos lo cual trajo consigo importantes retos en los temas de escalabilidad, rendimiento y velocidad. Especialmente en el tema de escalabilidad las bases de datos relacionales comenzaron a dar muestras de que sus exigencias de modelos relacionales generan tiempos muy altos para poder incrementar la manera en que la información es almacenada sin perder coherencia entre ella. Para darnos una idea de la cantidad de información que la web genera, podemos remitirnos al estudio hecho por la empresa DOMO que analizó la cantidad de información que los internautas (2700 millones de personas) generan por minuto:

  • Envían más de 200 millones de correos electrónicos.
  • Realizan 4 millones de consultas en google.
  • Suben 72 horas de video a YouTube.
  • Escriben más de 277,000 mensajes en twitter.
  • Publican casi 30,000 nuevos artículos en WordPress.
  • Suben 216,000 fotos a Instagram.

En 1998 nace el término NoSQL usado para identificar aquellas bases de datos que no seguían el modelo relacional. En 2009 el término fue aceptado de manera general estableciendo cuatro tipos de bases de datos no relacionales:

  1. Bases de datos de pares Llave-Valor.
  2. Bases de datos documentales.
  3. Bases de datos de almacenamiento por columna.
  4. Bases de datos de Grafos.

Estas bases de datos NoSQL buscan solventar las limitaciones que el modelo relacional se encuentra en entornos de almacenamiento masivo de datos y concretamente en las que tiene en el momento de escalar, donde es necesario disponer de servidores muy potentes y de balanceo de carga. Estos problemas que ha buscado resolver NoSQL tienen una profunda relación con BigData.

Entonces, ¿Qué es NoSQL?

NoSQL es un sistema de gestión de bases de datos que difiere del modelo clásico de gestión relacional. Los datos almacenados no requieren estructuras fijas como tablas, normalmente no soportan las operaciones JOIN, ni garantizan completamente ACID (Atomicidad, coherencia, aislamiento y durabilidad), y habitualmente escalan bien horizontalmente.

Una vez que NoSQL solucionó los problemas de gestión de grandes cantidades de información surgió BigData.

¿Qué es BigData?

BigData agrupa las técnicas de almacenamiento, análisis y manejo de inmensos repositorios de datos, estos son tan inmensos que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales. BigData Centra sus características en tres partes:

  • Volumen. Grandes volúmenes de datos, a partir de TeraBytes o incluso PetaBytes.
  • Variedad. El concepto de BigData también suele venir acompañado de diversos tipos de fuentes de datos, ta sean estructurados o no estructurados.
  • Velocidad. La frecuencia de las actualizaciones de estas grandes bases de datos también es un punto a tener en cuenta. Es por ello por lo que su procesamiento y posterior análisis también ha de realizarse prácticamente en tiempo real para poder mejorar la toma de decisiones en base a la información generada.

BigData, en términos generales puede referirse a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (Estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a una base de datos relacional para su análisis. De tal manera que, el concepto de BigData aplica para toda aquella información que no puede se procesada o analizada utilizando procesos o herramientas tradicionales. Sin embargo, BigData no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos.

  • GigaByte = 1,000,000,000
  • TeraByte = 1,000,000,000,000
  • PetaByte = 1,000,000,000,000,000
  • ExaByte = 1,000,000,000,000,000,000

La información generada a partir de la abundancia de sensores, micrófonos, cámaras, etc, en nuestra vida diaria será dentro de poco el segmento más grande de toda la información disponible. En este punto, BigData será una herramienta indispensable para quienes se dedican a la investigación pues gracias a ella será posible descubrir cosas que sin estas herramientas habría tomado años de investigación y recopilación de información.  La cuestión que afronta el Big Data es, por tanto, el modo en el que esa ingente cantidad de datos (lo que en muchas ocasiones es nombrado como el data deluge, el diluvio universal de datos) que se almacenan y producen diariamente pueda ser gestionado de tal modo que se convierta en conocimiento; y con el conocimiento, en valor.

Para saber más:

Cristian Requena. ¿Qué es NoSQL?.

Ricardo Barranco Fragoso. ¿Qué es Big Data?

Domo. Data Never Sleep.

Sé el primero en comentar

Deja un comentario