Integración de bases de datos bioinformáticas a la plataforma Multiomix, para mejorar la interpretación de potenciales biomarcadores oncológicos

Bebczuk, Franco

Integración de bases de datos bioinformáticas a la plataforma Multiomix, para mejorar la interpretación de potenciales biomarcadores oncológicos - 2023 - 1 archivo (1,2 MB) : il. col.

Tesina (Licenciatura en Sistemas) - Universidad Nacional de La Plata. Facultad de Informática, 2023.

1. Introducción -- Objetivo general -- Contexto y motivación -- Objetivo detallado - desarrollo propuesto -- Resultados esperados -- 1.1 Definiciones -- Conceptos de medicina y biología molecular -- Cáncer -- Biomarcador -- Biomarcador pronóstico -- Estudios ómicos -- Genómica -- Transcriptómica -- Proteómica -- Dimensiones de Datos en Multiomix -- Transcriptoma -- miRNA -- CNA (Alteraciones Cromosómicas Numéricas) -- Metilación -- Pathways -- Bio Api -- 2. Marco de trabajo -- Stack de tecnología -- Base de datos -- Lenguaje y framework de desarrollo -- Despliegue -- Proceso de desarrollo -- Weeklies -- Organización de tareas -- Colaboracion bioinformaticos y genetistas -- 3. Descripción general de Gene Ontology (GO) -- Conceptos básicos de gene ontology -- Ontología -- Función biológica -- Función molecular -- Componente celular -- Proceso biológico -- Base de conocimientos de Gene ontology -- Recursos primarios de Gene ontology 21 -- Motivación -- 3.1 Integración de ontología GO a BioAPI -- GO slims -- Formato OBO -- Estructura -- Relaciones jerárquicas -- Relaciones no jerárquicas -- Importación -- Actualización -- Schema -- Endpoint -- Motivación -- Definición -- Algoritmos -- BFS jerárquica hacia la raíz -- BFS jerárquica a hijos -- BFS no jerárquica -- Merging de los resultados de los recorridos -- Request -- Respuesta -- Respuesta exitosa -- Cómo representar el subgrafo -- Ejemplo -- Respuesta con error -- Optimizaciones -- Índices -- Métricas -- 3.2 Integración anotaciones GO -- Formato GAF -- Homo sapiens -- Importación -- Actualización -- Normalización de alias de genes -- Logs -- Schema -- Endpoint -- Motivación -- Unión -- Intersection -- Algoritmos -- Request -- Respuesta -- Respuesta exitosa -- Ejemplo -- Respuesta con error -- Optimizaciones -- Índices -- Métricas -- Problemas -- Problemas de función de alias -- Problema encontrado en los logs -- Problema de evidencia en bd -- 3.3 Integración de librerías para Gene Enrichment -- Cómo funciona -- Motivación -- Conceptos estadisticos -- P-value (valor p) -- Correction method (método de corrección) -- Librería GOATOOLS -- Estructura de datos diferentes -- Falta de documentación -- Gprofiler -- Librería en R y su wrapper para python -- Anotaciones extra -- Solución -- Búsqueda de anotaciones locales -- Endpoint -- Request -- Respuesta -- Respuesta exitosa -- Ejemplo -- Respuesta con error -- Optimizaciones -- 4. Integración de PharmGKB -- Estructura -- Importación -- Actualización -- Schema -- Endpoint -- Request -- Respuesta -- Respuesta exitosa -- Ejemplo -- Respuesta con error -- Optimizaciones -- Métricas -- Índices -- Problemas -- 5. Integración de STRING -- Archivos -- Importación -- Actualización -- Problemas -- Reducción de Ceros Redundantes -- Redundancia de Relaciones Bidireccionales -- Estructura de base de datos en mongodb -- Endpoint -- Request -- Respuesta -- Respuesta exitosa -- Ejemplo -- Respuesta con error -- 6. Integración de Drugbank -- Motivación -- Licencias -- Licencia académica -- Alternativas -- Scraping -- Crear el proceso de importación y el endpoint vacíos -- Generar un link a drugbank -- Endpoint -- Request -- Respuesta -- Respuesta exitosa -- Ejemplo -- 7. Conclusiones -- Trabajos futuros -- Publicación de paper -- Integración a multiomix -- Próximas versiones -- Bibliografía

DIF-M8716


BIOINFORMÁTICA
BASES DE DATOS

ingeniería de datos