Datos, el nuevo oro

PYMES

El Data Mining aporta conocimiento clave para optimizar el negocio. Desde recomendar productos a ciertos consumidores o prever la morosidad de otros, la llamada "ciencia del marketing" puede convertir la información en un activo estratégico de la empresa.

Proveniente del latín, datum significa “lo que se da” o “lo dado”. Y aunque definir “dato” parece obvio, la realidad indica que sólo con trabajo arduo los datos se tornan valiosos. No por azar a tan dura tarea se la llama Data Mining, o minería de datos. Sin socavón ni derrumbes, pero con tesoros muy ocultos.

¿Qué significa Data Mining (DM)? “Es un proceso de exploración y análisis de los datos, de manera automática o semiautomática, para obtener patrones significativos, de modo de transformarlos en conocimiento no trivial, novedoso, desconocido, útil y accionable”, explica Sylvia Testa, directora de la Maestría en Ciencia de Datos en la Universidad CAECE y líder del área en el Banco Patagonia. Y distingue: “La llamada ciencia de datos es un campo interdisciplinario que comprende técnicas, procesos y metodologías con visión y acción empresarial para optimizar los negocios”.

También Fredi Vivas da su definición, esta vez respecto de la aplicación de los datos en el marketing, conocida como Marketing Science: “Es una disciplina que convierte la información en un activo estratégico para la organización”, dice Vivas, quien es el fundador y CEO de RockingData, una consultora que asiste a grandes empresas en el tema. Sobre el aporte de valor, explica: “Permite reaccionar rápido y ser más flexible. Concretamente, el marketing science abre el camino para generar un modelo de recomendación de productos, predecir la posibilidad de abandono o morosidad de un cliente, pronosticar el total de ingresos que generará cada cliente en un tiempo determinado, analizar sus rasgos para definir el precio óptimo de un producto o incluso obtener segmentos automáticos, de modo de ser más precisos a la hora de generar acciones comerciales”. La utilidad, entonces, es clara. Pero dos preguntas nos gobiernan ahora: ¿dónde están los diamantes de la mina? ¿Hay que hurgar mucho para alcanzarlos?

Fredi Vivas fundador y CEO de RockingData.jpg
Fredi Vivas fundador y CEO de RockingData

Fredi Vivas fundador y CEO de RockingData

Dónde y cómo

Los datos, sencillamente, están en la propia empresa. Surgen de los informes de ventas, las visitas al sitio web y la conducta del cliente en e-commerce, como ejemplos más comunes. Y se enriquecen con fuentes externas, como el censo de población, las métricas de redes sociales o Google y los portales de datos abiertos. Por ejemplo, los que ofrece el gobierno nacional (datos.gob.ar) y porteño (data.buenosaires.gob.ar).

Pero atención: cantidad no es calidad. Y ésta suele ser pobre: hay faltantes, duplicados, datos fuera de rango... Todo lo cual no sorprende a los expertos, cuya tarea en un 70% implica la preparación de los datos. Una cuestión crucial, porque inyectar datos erróneos en un modelo de aprendizaje automático (Machine Learning), arrojará descripciones o predicciones también equívocas.

CAF1-22-gen.pdf

Juan Azcurra es especialista en Gestión de la Información, y cuenta cómo procede: “Se parte de un problema, y luego se determina cómo y con qué datos resolverlo, a través del método de caso de negocio. Así, tenemos una pregunta que responde a un objetivo comercial, por caso: vender más, fidelizar, reducir costos, prevenir el fraude, evitar la mora”, explica. Pero a la vez, dice, “el dilema tiene varias aristas: achicar el error del modelo, minimizar la inversión y aumentar el retorno económico. Siempre tiene ecuación económica”, enfatiza. Y ejemplifica: “Quiero mandar 100.000 mails y cada uno cuesta $1. Si algunos destinatarios compran, voy a tener cierta ganancia. Con los números, reviso el grado de error que me permito”.

Juan Azcurra especialista en Gestión de la Información.jpg
Juan Azcurra especialista en Gestión de la Información

Juan Azcurra especialista en Gestión de la Información

En cuanto a la modalidad de trabajo con datos, el fundador de RockingData cuenta que los formatos son varios: existen opciones bajo suscripción mensual (pueden rondar los US$ 1000) o bien por proyectos (uno de gran escala puede llegar a US$ 100.000). Sobre los tiempos, se ajustan a las necesidades de la organización, pero lo estima de entre 30 y 180 días. Si bien sus clientes son gigantes de diversos sectores, la buena noticia para las pymes es que, para hallar los diamantes, muchas de las herramientas son gratuitas y open source (código abierto), como los lenguajes de programación R y Python. Otras opciones accesibles son las difundidas Excel y SQL; y ha ido ganando protagonismo Power BI. “No es necesario disponer de Big Data para que los datos sean la base de modelos de machine learning (ML) con gran impacto en el negocio”, se entusiasma Vivas. Vaya una aclaración sobre la tan meneada expresión Big Data (literalmente, grandes datos): se denomina así a la proliferación de datos bajos las 3 V: volumen, velocidad y variedad.

¿Por qué este cambio? Lo explica el experto Azcurra: “Porque se volvieron selfservice y más amigables, llegaron a la nube y bajaron los costos”. Aunque advierte: “No por ello hay que pensar que basta con un ‘martillo’ y simplemente empezar a ‘golpear’ a los datos como si fuera una línea de montaje. Porque hay diferentes herramientas y modelos para tratarlos. Por eso es clave contar con la persona indicada, que utilice la herramienta adecuada”.

Inteligencia humana

Justamente, sobre los recursos humanos aporta Sylvia Testa, de la Maestría de Datos de CAECE. “Las habilidades más relevantes son el pensamiento analítico, dominio de estadística y matemática, conocimiento del negocio o industria en cuestión, manejo de herramientas tecnológicas, a lo que debe sumarse un hábito de aprendizaje activo y continuo”. Por supuesto, aclara, también se requiere de destrezas emocionales: resiliencia, liderazgo y empatía. “La especialización y nivel de experiencia del perfil requerido depende del modelo a implementar y del riesgo asociado. Uno de los mayores desafíos es seleccionar recursos humanos capacitados para minimizar el sesgo implícito inherente a la toma de decisiones automatizada”, resalta la experta y docente.

CAF1-23-gen.pdf

Desde su lugar de consultor, dice que “un Ingeniero de datos es el perfil más técnico, y su principal tarea es asegurar que los datos estén disponibles. El Científico de datos desarrolla los modelos de ML y tiene que ser capaz de programar. Y el Analista de Datos usa estadística y herramientas de visualización para responder las preguntas de negocio con datos”.

Pero no alcanza con buena tecnología, buena data y mejores profesionales. Testa enfatiza: “para tener éxito en este paradigma de explotación de datos debe existir una cultura digital y de cambio. Sólo las organizaciones data-driven, es decir guiadas por los datos, que conviertan a estos en el centro de su estrategia y sepan usarlos para aprender de cada interacción con el usuario, podrán ofrecer productos y servicios innovadores y personalizados”. Vivas la complementa: “Si bien hay varias opciones hasta que un área de datos esté madura, lo ideal es que sus miembros sepan mucho del negocio, puedan interactuar con especialistas externos, conozcan bien los puntos a resolver así como la potencialidad de estas herramientas. Además, que puedan plantear objetivos claros y sean capaces de construir una estrategia basada en datos”.

El caso envíopack

Nur Malek Pascha es CEO y una de los 3 fundadores de Enviopack, una plataforma tecnológica de soluciones logísticas. Fundada en 2016, aspiran a cerrar 2020 con una facturación de $700 millones. Tienen 600 clientes y 45 empleados. Operan en el país y en Chile.

foto nur en alta.jpg
Nur Malek Pascha, CEO y cofundadora de Enviopack.

Nur Malek Pascha, CEO y cofundadora de Enviopack.

  • “Los datos los disponibilizamos a nuestros clientes para que tomen decisiones más certeras. Al conocer mejor su operación, pueden utilizar su logística como pieza estratégica de marketing para aumentar las ventas
  • Además, con la información que les proporcionamos, pueden acceder a análisis detallados en tiempo real de esa logística y de la preferencia de servicios de sus usuarios; conocer el nivel de cumplimiento de cada operador logístico, destino y servicio; y descargar reportes de costos y facturación
  • La explotación de datos evolucionó con el tiempo. Al principio, teníamos un panel de métricas básico que se fue complejizando: hoy el cliente puede elegir qué tipo de información quiere extraer para ser más inteligentes y eficientes en la logística de su e-commerce
  • Es tal el potencial del Big Data que no descartamos que sea una nueva unidad de negocio dentro de Enviopack en un futuro, siempre que la calidad de los datos sea buena y que podamos hacer uso de ellos sin problemas”.

Dos tendencias que crecen

1) Data Literacy, en la voz de Azcurra, es “la alfabetización digital, entendida como la habilidad de leer, entender, crear y también poder comunicar los datos como información. Se centra en la interpretación humana y las competencias necesarias para darles sentido”.

2) People Analytics, que remite al uso de datos para mejorar la gestión de los empleados. Ante problemáticas como escasez de ciertos perfiles, es clave entender cómo cuidarlos y retenerlos; y cómo atraer nuevos talentos.

Dejá tu comentario