Alejandro Rabasa: “Somos previsibles en nuestros comportamientos, pero la forma de llegar a esa previsión no es el azar, es la minería de datos”
Que los productos de las estanterías de los supermercados no están distribuidos al azar es algo de sobra conocido por la clientela. A pesar de ello, el consumidor continúa cayendo en las “trampas” de los grandes almacenes: comprar las pilas que no se necesitan o los chicles que no buscaban en el último instante. Lo que pocos saben es que una disciplina conocida como Minería de Datos (en inglés, Data Mining) es lo que permite averiguar las tendencias que se esconden tras la cesta de la compra y qué grupos de productos se demandan a la vez. Por ejemplo, quién compra leche y a la vez mantequilla y con qué probabilidad ocurre eso.
El profesor experto en Minería de Datos y miembro del Centro de Investigación Operativa (CIO) en la Universidad Miguel Hernández (UMH), Alejandro Rabasa, define esta disciplina como un conjunto de técnicas entre la estadística y la informática que pretende extraer información inicialmente inmersa y que permanece oculta entre volúmenes muy grandes de datos, a partir de una serie de algoritmos de cara a un objetivo concreto. Existen diferentes metodologías y la Minería de Datos estudia cuándo es conveniente aplicar cada una de éstas, mediante métodos predictivos.
Esta técnica, que se aplica en Estados Unidos desde hace más de diez años, ha comenzado a comercializarse a nivel Estatal y cada vez son más las empresas privadas e instituciones públicas que demandan servicios de estas características. De hecho, desde este ámbito de la investigación el CIO ha presentado su oferta al tejido empresarial de Alicante y algunas empresas ya han demandado sus servicios. Es el caso,por ejemplo, de ciertas compañías de calzado, que solicitan estudios como la planificación de rutas de distribución de una empresa comercial con sede en varios lugares, para que sea lo más efectiva posible; o que se detecten los fallos en una cadena de producción a partir del análisis histórico de sus datos.
Alejandro Rabasa asegura que la demanda de minería de datos se genera en el momento en que las empresas llegan a Internet, donde en un mes se pueden almacenar gigas de información con las preferencias de los clientes: “Los cursos de Internet antes consistían en la búsqueda de información y ahora los problemas vienen por la necesidad de filtrarla. Se ha pasado de la carencia al exceso de información en a penas una década”. Las empresas de calzado, por ejemplo, desean averiguar las tendencias de consumo de la gente que entra a su web y con ello diagnosticar las características comunes en los productos que se demandan más, así como en aquellos que nunca triunfan.
La principal tendencia que se deriva de la aplicación de la Minería de Datos en las empresas en Internet es la oferta cada vez más personalizada de productos, especialmente para usuarios registrados. Según Alejandro Rabasa: “Somos previsibles en nuestros comportamientos, pero la forma de llegar a esa previsión no es el azar, es la Minería de Datos”.
Aunque en sus inicios se trataba de una disciplina sólo a disposición de las grandes multinacionales, actualmente se emplea una tecnología cada vez menos cara porque se va popularizando. De hecho, en el caso de las investigaciones en el campo de la minería de datos realizadas por el CIO en la UMH, se valora más el tiempo de trabajo invertido en el desarrollo del proyecto, que la tecnología aplicada.
Sin inversión pública
El profesor Alejandro Rabasa explica que se ha visto un proceso de abandono de la inversión por parte de las instituciones públicas en este tipo de investigaciones. “Uno de los principales demandantes era el servicio sanitario, a través de la Conselleria, pero para seguir adelante con este tipo de proyectos hay que encontrar subvenciones de las que no disponemos y convocatorias públicas que ya no existen”, se lamenta el investigador.
La principal investigación de carácter público que mantiene en estos momentos la UMH a través del CIO consiste en una demanda del servicio de anestesiología del Hospital de Sant Joan d’Alacant. Mediante un estudio se cruzan el historial clínico del paciente y todos los datos previos a la entrada en quirófano, con lo datos relativos a incidencias en el día de la operación. El objetivo es determinar, de las tres pruebas preoperatorias que se hacen siempre (placa de tórax, electrocardiograma y analítica de sangre), cuáles se podrían haber eliminado sin riesgo para la salud del paciente.
“Si evitas hacer esas pruebas ahorras dinero, agilizas las listas de entrada en quirófano y puedes evitarle al paciente una prueba de carácter invasivo. Una placa de tórax a la seguridad social le cuesta 60 euros y al paciente una irradiación y una o dos semanas de retraso en la entrada al quirófano, asegura Alejandro Rabasa, quien además, añade que se trata “solamente de evitar aquellas pruebas que sean innecesarias y no las que de verdad hacen falta”.
Pero no todas las aplicaciones de la minería de datos son de carácter público. Esta disciplina es también la responsable de las ofertas personalizadas en los portales de comercio electrónico, gracias a algoritmos predictivos sobre las preferencias de los clientes a partir de su navegación en Internet. El profesor Alejandro Rabasa insiste en que no se pueden hacer responsables de la explotación final de sus servicios, que es responsabilidad de la empresa. Lo que sí que garantiza es que en todo momento se cumplen los acuerdos de protección de datos y confidencialidad, que son muy rígidos, especialmente cuando se trata de personas, como pueden ser los pacientes de un hospital.
Borja Garcia