Borrar
Dirty Data, el rival del Big Data: ¿cómo combatirlo?

Dirty Data, el rival del Big Data: ¿cómo combatirlo?

Las empresas olvidan comprobar las bases de datos y eliminar duplicidades

J.A.G

Viernes, 23 de junio 2017, 15:26

Necesitas ser suscriptor para acceder a esta funcionalidad.

Compartir

Cada día se generan 2,5 trillones de bytes, datos que albergan información muy valiosa sobre millones de empresas, sus clientes y sus patrones de comportamiento. La consultora Gartner advierte que al 80% de los datos almacenados no se les da ningún uso, e incluso IBM indica que el 60% de la información recolectada pierde valor inmediatamente después de ser recogida.

Sin embargo, las plataformas de Big Data no tienen en cuenta el Dirty Data, es decir, bases de datos con información incorrecta, incompleta, inexacta, desactualizada o con datos duplicados.

Las empresas se enfrentan a un serio problema cuando se lanzan al Big Data, ya que no toda la información que recopilan es veraz. Según nuestros propios estudios más de la mitad de los usuarios aportan al menos un dato falso entre la información que facilitan a las empresas. Además, se calcula que el 25% de la información que poseen las empresas podrían ser datos falsos, asegura Antonio Camacho, fundador de Hocelot.

Hocelot, una startup 100% de capital español especializada en la verificación de información de personas físicas en tiempo real, ayuda a las empresas a verificar esa información a través del Data Standarization & Enhacement gracias al cual podemos corregir, normalizar, organizar y descartar aquellos datos falsos que los usuarios introducen en las bases de datos de las empresas.

El Dirty Data es, por tanto, un nuevo reto que las empresas deben afrontar si quieren reducir los riesgos por pérdidas relacionadas con el fraude de identidad, añade.

La veracidad de los datos se ha convertido en una cuestión de confianza para las propias empresas, que deben conocer los motivos que llevan a los usuarios a falsear sus datos. Estas plataformas focalizaron su atención en analizar y gestionar un mayor volumen y variedad de datos a una velocidad cada vez más alta. Sin embargo, el Dirty Data añade dos nuevas variables: veracidad y valor.

Reporta un error en esta noticia

* Campos obligatorios