Resumen del proyecto

La medicina personalizada (PM, Personalized Medicine) busca la identificación de terapias personalizadas que hagan seguro y efectivo el tratamiento individualizado de pacientes específicos. Una de las grandes dificultades para llevar a cabo esta práctica clínica de forma efectiva es que en la actualidad no existen sistemas flexibles de información capaces de proporcionar conocimiento preciso, actualizado e interrelacionado basado en el acceso estratificado a múltiples orígenes de datos de tipo heterogéneo. Toda esta información, generada en estudios experimentales, ensayos clínicos y en la práctica clínica diaria, así como recientemente a través de sensores biomédicos y grandes conjuntos de datos de libre acceso y entrelazado (Open y Linked Data) debería convertirse en una fuente extraordinaria de conocimiento para el avance de la PM. Sin embargo, la PM se enfrenta en la actualidad a grandes retos. Es necesario integrar información heterogénea dispersa en múltiples orígenes, de diferentes género, dominio, estructura y escala, donde además juega un papel muy importante la componente textual. Para afrontar estos retos, en este proyecto se propone la aplicación de forma coordinada de técnicas de integración de información para conseguir abarcar fuentes de tipo heterogéneo y de minería de textos y datos para facilitar la extracción de conocimiento asociado.

El objetivo principal del proyecto es diseñar e implementar una plataforma con servicios que permitan un acceso integrado e inteligente a la información relacionada para conseguir la extracción de conocimiento útil en el contexto de la PM. Se proponen tres escenarios de uso: (i) la asistencia a los profesionales sanitarios durante el proceso de toma de decisiones de ámbito clínico, (ii) el acceso a información relevante sobre su estado de salud a pacientes crónicos y dependientes y (iii) el soporte a la formación basada en la evidencia de los nuevos estudiantes de medicina. Se propondrán técnicas más efectivas para operaciones como generación de resúmenes, recuperación de imágenes a partir de texto, recuperación de información, reconocimiento de entidades nombradas, y extracción de información de grandes conjuntos de datos tanto provenientes de sensores como utilizando conjuntos de datos de libre acceso. Se implementarán herramientas que permitan obtener conocimiento biomédico a partir de, principalmente, recursos públicos. Se diseñará una arquitectura y un framework de aplicaciones Web que permita la integración de procesos y técnicas de minería de texto y datos e integración de información de una forma rápida, uniforme y reutilizable (mediante plugins). Finalmente, se desarrollarán herramientas inteligentes para el soporte al usuario en los tres escenarios definidos: toma de decisiones para el diagnóstico y tratamiento, pacientes, y formación. Además, se llevarán a cabo experimentos para la evaluación, tanto de efectividad como de usabilidad, mediante evaluaciones sistemáticas y con usuarios. En el caso de las primeras, se participará en competiciones como TREC-Medical Records, CLEF, TAC, DDIExtraction, i2b2, BioCreative, CoNLL Shared Task o BioNLP Shared Task. En las evaluaciones con usuarios, se considerarán tanto entornos abiertos como controlados.


Proyectos relacionados




MedicalMiner (TIN-2009-14057-C03-01) es un proyecto para la integración de conocimiento explícito en técnicas de minería de texto para el desarrollo de herramientas de medicina traslacional.

FlipIT!–Flipped Classroom in the European Vocational Education (2015-1-HU01-KA202-013555). Poyecto financiado por la Comisión Europea (European ICT Sector Skills Alliance - VET open course for mobile apps creators (AppSkil).Contrato público (554271-EPP- 1-2014-1-UK-EPPKA2-SSA). El objetivo de este proyecto es el análisis y posterior desarrollo de una metodología basada en el modelo pedagógico FLipped Classroom aplicado a VET. Se desarrollará un MOOC para los profesores y se realizarán test pre y post.

BIDAMIR (BIomedical DAta Mining and Information Retrieval, TIC 07629). Proyecto de Investigación de Excelencia de la Junta de Andalucía. El principal objetivo de este proyecto es el desarrolo de un sistema inteligente de información clínica que permita acceder a información textual y extraer conocimiento útil de fuentes de datos estructurados.

VirtualcloudCarer (TSI-020100-2011-83) es un proyecto para el desarrollo de una Plataforma de Servicios altamente personalizados a cada uno de los actores involucrados: dependientes, familiares y los profesionales de atención primaria, hospitales y servicios sociales permitiendo por un lado la sensorización y telemonitorización de la persona dependiente y su entorno, tanto domiciliario como externo, y por otro posibilitando la integración en la Sociedad Digital de aquellas personas con sus capacidades físicas ampliamente merm adas, adaptando los sistemas y el entorno a ellas y no a la inversa.

MAVIR (Mejorando el Acceso y la Visibilidad de la Información Multilingüe en Red para la Comunidad de Madrid, S2009/TIC1542). El Consorcio MAVIR es una red de investigación co-financiada por la Comunidad de Madrid dentro del IV Plan Regional de Investigación Científica e Innovación Tecnológica (IV PRICIT) y formada por un equipo multidisciplinar de científicos, técnicos, lingüistas y documentalistas para desarrollar un esfuerzo integrador en las áreas de investigación, formación y transferencia de tecnología.
NAVIGA (E!4583 / CDTI) es un proyecto europeo financiado por la iniciativa de "Eurostars Eureka". El Proyecto Naviga tiene como objetivo reducir el riesgo de que grupos sociales con vulnerabilidades especiales, como gente mayor o discapacitados, sean víctimas del progreso digital, al poner al alcance de estos grupos los instrumentos para mantenerse activo tanto en ejercicio de la mente como en la vida social.


Participantes

Grupo de Sistemas Inteligentes (GSI) , Universidad Europea de Madrid(Madrid-UEM). Subproyecto 1 (UEM-IPHealth): Integración de métodos de acceso a fuentes de información abiertas y datos de sensores para la formación y toma de decisiones en Salud (TIN-2013-47153-C3-1- R)


Laboratorio de Recuperación de Información y Minería de Textos y Datos (Laberinto), Universidad de Huelva (Huelva-UHU). Subproyecto 2 (UHU-IPHealth):Minería de texto y datos para el soporte a la toma de decisiones y aprendizaje en el ámbito de la salud (TIN2013-47153-C3-2-R)
Grupo de Sistemas Informáticos de Nueva Generación (SING), Universidad de Vigo (Ourense-UVigo). Subproyecto 3 (UVigo-IPHealth): Plataforma de integración de técnicas inteligentes para análisis de información biomédica (TIN2013-47153-C3-3-R)

Investigadores


GSI (UEM)


Manuel de Buenaga Rodríguez
Diego Gachet Paez
Enrique Puertas Sanz
Margarita Rubio Alonso
María Asunción Hernando Jerez
María José Busto Martínez
María Teresa Villalba de Benito
María Cruz Gaya López
Rosa Belén Mohedano del Pozo
Fernando Aparicio Galisteo
Rafael Muñoz Gil
María de la Luz Morales Botello

Laberinto (UHU)


Manuel J.Maña López
Jacinto Mata Vázquez
Miguel Á. Vélez Vélez
Manuel de la Villa Cordero
Noa Patricia Cruz Díaz

SING (UVigo)


Florentino Fernández Riverola
Reyes Pavón Rial
Rosalía Laza Fidalgo
José Ramón Méndez Reboredo
Daniel González Peña
Miguel Reboiro Jato
Fernando Díaz Gómez
Francisco José González Cabrera
Mª del Carmen Rodríguez Otero
Eva María Lorenzo Iglesias
M. Lourdes Borrajo Diz
Adrián Seara Vieira
Rubén Romero González
David Ruano Ordás

Publicaciones


2016


Gómez-Vallejo, H. J., Uriel-Latorre, B., Sande-Meijide, M., Villamarín-Bello, B., Pavón, R., Fdez-Riverola, F., & Glez-Peña, D. (2016). A case-based reasoning system for aiding detection and classification of nosocomial infections. Decision Support Systems, 84, 104–116.
Iglesias, E. L., Vieira, A. S., & Diz, L. B. (2016). An HMM-Based Multi-view Co- training Framework for Single-View Text Corpora. En F. Martínez-Álvarez, A. Troncoso, H. Quintián, & E. Corchado (Eds.), Hybrid Artificial Intelligent Systems (pp. 66-78). Springer International Publishing.
Jácome, A. G., Fdez-Riverola, F., & Lourenço, A. (2016). BIOMedical Search Engine Framework: Lightweight and customized implementation of domain-specific biomedical search engines. Computer Methods and Programs in Biomedicine, 131, 63– 77.
Rodrigues, M. F., Gonçalves, S. M., Santos, R., Fdez-Riverola, F., & Carneiro, D. (2016). Intelligent Tutoring: Active Monitoring and Recommendation. Interdisciplinary Perspectives on Contemporary Conflict Resolution, 205.
A. Seara Vieira, Maria Lourdes Borrajo Diz, Eva Lorenzo Iglesias: Improving the text classification using clustering and a novel HMM to reduce the dimensionality. Computer Methods and Programs in Biomedicine 136: 119-130.
D Gachet Paez, M de Buenaga Rodriguez, E Puertas Sanz, MT Villalba (2016). Healthy and wellbeing activities promotion using a Big Data approach. Health informatics journal, August 4, https://doi.org/10.1177/1460458216660754.
D Gachet, M de la Luz Morales, M de Buenaga, E Puertas, R Munoz (2016) Distributed Big Data Techniques for Health Sensor Information Processing. 10th International Conference on Ubiquitous Computing and Ambient Intelligence (UCAMI.2016).
M Teresa Villalba, M de Buenaga, D Gachet, F Aparicio (2016) Security Analysis of an IoT Architecture for Healthcare .Internet of Things and IoT Infrastructures: Second International Summit.
DG Paez, M de Buenaga Rodriguez, EP Sanz, MT Villalba, RM Gil (2016) Big data processing using wearable devices for wellbeing and healthy activities promotion. International Workshop on Ambient Assisted Living.

2015


Manuel de Buenaga, Diego Gachet, Manuel J. Maña, Jacinto Mata, Lourdes Borrajo, Eva L. Lorenzo (2015).IPHealth: Plataforma inteligente basada en open, linked y big data para la toma de decisiones y aprendizaje en el ámbito de la salud. Procesamiento del Lenguaje Natural, Vol.55 pp.161-164
M.Teresa Villalba, Manuel de Buenaga, Diego Gachet, Fernando Aparicio. (2015). Security analysis of an IoT architecture for Healthcare. In Proceedings of the 2nd EAI International Conference on IoT Technologies for HealthCare. Lecture Notes of ICST 2015.
Diego Gachet. ML. Morales Botello, Manuel de Buenaga, Enrique Puertas. (2015). Health Sensors Information Processing and Analytics using Big Data approaches. In Proceedings of the 2nd EAI International Conference on IoT Technologies for HealthCare. Lecture Notes of ICST 2015.
Gachet Páez, D., Buenaga, M., Puertas Enrique, Villalba M.T. (2015). Big Data Processing of Bio-signal Sensors Information for Self-management of Health and Diseases. In Proceedings of the 2015 seventh international conference on innovative mobile and internet services in ubiquitous computing. IEEE Computer Society
Fernando Aparicio, Ma. Cruz Gaya, Manuel de Buenaga, Diego Gachet. (2015) M- health mobile app usability tested with engineering students. Proceedings of 9th International Technology, Education and Development Conference. Madrid. Spain.
Noa P. Cruz, Maite Taboada, Ruslan Mitkov (2015). A Machine Learning Approach to Negation and Speculation Detection for Sentiment Analysis. Journal of the American Society for Information Science and Technology (JASIST). DOI: 10.1002/asi.23533.
Noa P. Cruz (2015). Negation and Speculation Detection in Clinical and Review Texts. Procesamiento del Lenguaje Natural, vol. 54, pp. 107-110.
R. Romero, E. L. Iglesias, and L. Borrajo(2015) “A Linear-RBF Multikernel SVM to Classify Big Text Corpora”. BioMed Research International, vol. 2015, Article ID 87829, pp: 1-14, 2015. doi:10.1155/2015/878291
Borrajo, L.; Seara Vieira, A.; Iglesias, E.L. (2015). “TCBR-HMM, an HMM-based text classifier with a CBR system”. Applied Soft Computing Journal. Vol. 26, pp. 463-473, DOI: 10.1016/j.asoc.2014.10.019
Diego Gachet, Manuel de Buenaga, Enrique Puertas, María Teresa Villalba and Rafael Muñoz. Big Data Processing Using Wearable Devices for Wellbeing and Healthy Activities Promotion. 7th International conference on Ambient Assisted Living (IWAAL) 2015. Lecture Notes in Computer Science
Diego Gachet Páez, Manuel de Buenaga, Enrique Puertas, María Villalba. Big Data Processing of Bio-signal Sensors. Information for Self-management of Health and Diseases.The Ninth International Conference on Innovative Mobile and Internet Services in Ubiquitous Computing(IMIS-2015). Regional University of Blumenau (FURB), Blumenau, Brazil.
Jacinto Mata, Noa Patricia Cruz, Juan Luis Domínguez, Victoria Pachón, Manuel de la Villa, Alberto Moreno, Alicia Martínez, Carlos Luis Parra. BIDAMIR: BIomedical DAta Mining and Information Retrieval. XVIII Congreso Nacional de Informática de la Salud (InforSalud 2015), Madrid, 2015.
Juan L. Dominguez, Jacinto Mata, Victoria Pachón. Deterministic Extraction of Compact Sets of Rules for Subgroup Discovery. The International Conference on Intelligent Data Engineering and Automated Learning (IDEAL). Special Session on Discovering Knowledge from Data, Wrocklaw (Poland), 2015.Publicación: Lecture Notes in Computer Science (ISSN: 0302-9743).
Noa P. Cruz, Manuel J. Maña. An Analysis of Biomedical Tokenization: Problems and Strategies. Sixth International Workshop on Health Text Mining and Information Analysis (Louhi). Lisboa (Portugal), 2015.
Seara Vieira, E.L. Iglesias and L. Borrajo (2015) “A new dimensionality reduction technique based on HMM for boosting document classification”. Advances in Intelligent and Soft Computing (AISC). 9th International Conference on Practical Applications of Computational Biology and Bioinformatics (PACBB 2015). Vol. 1, pp. 69-78. Salamanca (España). DOI 10.1007/978-3-319-19776-0

2014


Gachet-Páez, D., Aparicio-Galisteo, F., Buenaga-Rodríguez, M., Ascanio, J. R. (2014). Big data and IoT for chronic patients monitoring. In Ubiquitous Computing and Ambient Intelligence: Personalisation and user adapted services. 2014 (pp. 416-423). Springer International Publishing. Lecture Notes in Computer Science.
Dueñas Fuentes, Antonio Jesús; Mochón Doña, Ana; Escribano Dueñas, Ana Milagrosa; Piña Fernández, Juan Antonio; Gachet Páez, Diego (2014). Mathematical probability model for Obstructive Sleep Apnea Syndrome (OSAS). Chest, 145(3 Suppl), 597A-597A.
Rivas, A.R.; Iglesias, E.L.; Borrajo, L. (2104). “Study of query expansion techniques and their application in the biomedical information retrieval”. Scientific World Journal, vol. 2014, pp: 1-10. doi: 10.1155/2014/132158
Enrique Puertas, Manuel de Buenaga, María Lorena Prieto. (2014). BUSCLIMED: Mobile app for searching medical literature. In Proceedings of International Conference on Mobile and Information Technologies in Medicine and Health 2014.
Noa P. Cruz. Negation and Speculation Detection in Medical and Review Texts, ISBN: 978-84-617-0887-1. Edita Sociedad Española para el Procesamiento del Lenguaje Natural. 2014
D. Gachet Paez, F. Aparicio, M. De Buenaga, Juan Ramon Ascanio. Chronic Patients Monitoring Using Wireless Sensors and Big Data Processing. The Eighth International Conference on Innovative Mobile and Internet Services in Ubiquitous Computing (IMIS-2014), Birmingham City University, Birmingham, UK.
Seara Vieira, A.; Iglesias, E.L.; Borrajo, L. (2014). “T-HMM: A Novel Biomedical Text Classifier Based on Hidden Markov Models”. Advances in Intelligent and Soft Computing (AISC). 8th International Conference on Practical Applications of Computational Biology and Bioinformatics (PACBB 2014). Vol. 1, pp. 225-234. Salamanca (España), DOI: 10.1007/978-3-319-07581-5.
Romero, R.; Seara Vieira, A.; Iglesias, E.L.; Borrajo, L. (2014) “BioClass: A Tool for Biomedical Text Classification”. Advances in Intelligent and Soft Computing (AISC). 8th International Conference on Practical Applications of Computational Biology and Bioinformatics (PACBB 2014). Vol. 1, pp. 243 – 251, Salamanca (España)
Prieto, M. L., Puertas, E., & de Buenaga, M. (2014). Learning tool for medicine students based on biomedical named entity recognition and Linked Open Data. Biomedical Engineering and Environmental Engineering, 145, 29.

Software


BioClass

Desde la perspectiva del usuario final, BioClass es una plataforma que se centra en la aplicación de modelos de razonamiento en materia de clasificación de textos. Está diseñado para trabajar con los resultados obtenidos de un proceso de recuperación de información en una base de datos de texto, donde los documentos pueden ser relevantes o no para un tema específico. BioClass toma estos datos como entrada y ofrece múltiples filtros y algoritmos de aprendizaje máquina para manejar el problema de clasificación automática. Desde una perspectiva de desarrollador, BioClass ofrece una capa de abstracción que enfrenta el proceso de clasificación. Gracias a ello, el desarrollador puede utilizar su arquitectura y aplicar nuevos modelos de razonamiento.

Busclimed


Busclimed (Buscador de Información Biomédica para dispositivos móviles) es una aplicación que permite consultar información sobre términos médicos mediante el uso de Datos Enlazados. El paciente o profesional de la salud puede ver términos relacionados con una determinada enfermedad, síntoma, o fármaco, consultar artículos científicos de fuentes como Pubmed o Medline Plus sobre ellos, o ver también información de la National Drug File cuando el término buscado es un medicamento.

Descarga de la app para android de Google Play Store

Analíticas Big Data en cardiología


Las tecnologías de análisis de Big Data están teniendo y tendrán una enorme repercusión en el ámbito de la salud. Entre los beneficios de "Big Data" se encuentran la mejora en la calidad y exactitud en las decisiones clínicas, mejora en la velocidad de procesado de grandes cantidades de datos, detección de enfermedades en un estadio temprano. Aquí nosotros empleamos herramientas compatibles con tecnología Big Data para predecir la mortalidad de pacientes en una unidad de cuidados intensivos, haciendo uso del software R.

ClinLaP


ClinLaP (Clinical Language Analysis Platform) es una aplicación cuyo objetivo es ayudar a los pacientes a entender mejor lo que dice en su historia clínica, mostrando información relevante extraída de diversas fuentes biomédicas. Para ello el sistema cuenta con un módulo de análisis del lenguaje que extrae de forma automática aquellos términos médicos que son relevantes en el texto, y permite que el usuario pueda obtener información sobre lo que es cada uno de ellos con un simple click. Además, se muestra información relacionada interesante como síntomas, tratamientos, medicamentos y artículos científicos en los que se menciona la enfermedad o fármaco, entre otros.
Esta aplicación ha sido galardonada con el premio “Fujitsu Linked Open Data 2015”

jARVEST


jARVEST (Java web harvesting library) es una herramienta simple para web scraping. Está implmementada via un poderoso lenguaje específico de dominio basado en JRuby,facilitando el desarrollo con código mínimo.

DISSUM


DISSUM (DIScharge report generation via automatic SUMmarization) es una herramienta de soporte al proceso de etiquetado de un corpus biomédico de hojas de evolución clínica para la creación semiautomática de informes de alta hospitalaria aplicando técnicas de generación automática de resúmenes. El proceso de anotación de un corpus para resúmenes, imprescindible para poder aplicar técnicas de aprendizaje automático y de evaluación de la calidad, es una tarea compleja que requiere acceso cronológico a documentos, selección de sentencias significativas dentro de unas restricciones de tamaño, así como la diferenciación tipológica de estas sentencias. Se ha desarrollado una herramienta que gestiona todo el proceso facilitando y economizando el trabajo de los anotadores humanos.

Transferencia


Entes Promotores Observadores (EPO)