Data Science Central

“Hace unos pocos días he asistido a un buen webinar llevado a cabo por Metascale con el tema “Are You Still Moving Data? Is ETL Still Relevant in the Era of Had… Este post se dirige a este webinar”.

“En resumen, este webinar ha explicado muy bien acerca de cómo la empresa puede utilizar Hadoop como un centro de datos junto con el Datawarehouse. “Hadoop funciona como una tecnología que concentra los datos”  esta línea en sí planteo muchas preguntas en mi mente”:

  1. “Cuando proyectamos Hadoop como Data-hub y al mismo tiempo mantenemos el datawarehouse como un repositorio de datos (convencional) para la empresa,  entonces ¿no es necesario crear una plataforma en silos? Y presentar en la transmisión por internet diciendo en repetidas ocasiones que mantener intacta el datawarehouse  existente en el desarrollo de Hadoop como un Data Hub. Es difícil de digerir
  2. La siguiente pregunta que surgiría va sobre los retos en el entorno de Hadoop como Master Data Management y Data governance platform. No creo que el ecosistema de Hadoop sea lo suficientemente maduro como para manejar con rapidez la complejidad MDM. En cuanto a la gobernabilidad de los datos del ecosistema Hadoop carece de las aplicaciones que se requieren en la parte superior de Hadoop para el control de datos de manera sólida.
  3. ¿Por qué dedicar mucha energía a construir la compatibilidad de las herramientas ETL informatica como con HDFS para conectar la infraestructura existente ETL con Big Data? Siento que esto es una idea loca, debido a que estás vendiendo una solución rentable a bajo coste. Obviamente, la informática no le dará el conector Hadoop como “libre”. Hay muchas otras preguntas como el rendimiento, la etapa lógica de negocio, etc.
  4. También hay una gran apuesta en Hadoop para reemplazar  el ETL e impulsar la transformación de Hadoop MapReduce teniendo en cuenta su infraestructura”.

LEER MÁS