Bioinformática
Una Introducción
                       Bioinformática
✓ La Medicina y la Biología no son las mismas desde que
    tuvieron relaciones con la computación.
✓   Existe una medicina virtual que es tan real como la que
    está allá afuera.
✓   Se pueden buscar respuestas, formular hipótesis y hasta
    hacer experimentos sin un laboratorio ni “salir de casa”.
✓   El profesional de la salud necesita ineludiblemente de las
    herramientas bioinformáticas, no como una habilidad
    opcional, sino básica, que mejorará su desempeño clínico.
✓   La epidemiología, la bioinformática y la estadística hacen
    parte de las herramientas de la Medicina Traslacional.
    ¿Por qué surge la bioinformática?
•   Las planillas de MS Excel ya no alcanzan.
•   Globalización de la información y de los
    recursos.
•   Necesidades de cálculo intensivo.
•   Necesidades de modelado intensivo.
•   Contrastar por modelos lo observado en la
    realidad.
•   Tecnologías de alto rendimiento, un nuevo
    paradigma.
•   ….
          ¿Por qué surge la bioinformática?
Los biólogos moleculares comenzaron a comprender que aún
después de que encontraran, mapearan, clonaran y secuenciaran
un gen, sus búsquedas sólo habían comenzado. Todavía no podían
hacer nada con el gen mientras no supieran lo que hacía el gen.
                                                  Jonathan Weiner
La secuenciación del genoma humano y de otras especies
generó una enorme cantidad de información, que ha sido
almacenada en bases de datos.
   ¿Qué es la Bioinformática?
Definición: Campo interdisciplinario que combina
biología, informática y estadística para analizar datos
biológicos.
Objetivo: Organizar, interpretar y aplicar información
genómica, proteómica y clínica .
Importancia en medicina: Revoluciona diagnóstico,
tratamiento y prevención de enfermedades mediante
análisis de big data.
    • Ejemplo: Secuenciación del genoma humano
      (Proyecto Genoma Humano) y su impacto en la
      medicina moderna
                Fundamentos de la Bioinformática
Tipos de datos analizados:
Herramientas clave:
   • Bases de datos públicas (Ej.: GenBank, Protein Data Bank).
   • Algoritmos de IA (Ej.: AlphaFold para predicción de estructuras
     proteicas).
Métodos computacionales:
   •Análisis de secuencias, modelado molecular, minería de datos
   clínicos
     Objetos de Estudio de la Bioinformática
Moléculas                  Células
  • Secuencia                 • Expresión génica
  • Estructura                • Linajes y muerte
  • Modificaciones            • Complejos
  • Interacciones                macromoleculares
Individuos              Poblaciones
   • Genotipo/fenotipo
   • Cambios temporales
Genómica (Manhattan Plot)
Epigenómica
Transcriptómica
Transcriptómica
Proteómica
Metabolómica
Metabolómica
         Aplicaciones a la Práctica Médica
Diagnóstico y prevención:
   • Identificación de biomarcadores genéticos para
     enfermedades como cáncer o diabetes.
   • Predicción de predisposición genética a patologías.
Medicina personalizada:
   • Adaptación de tratamientos según el perfil genético del
     paciente (Ej.: farmacogenómica).
Desarrollo de fármacos:
   • Diseño de moléculas terapéuticas mediante modelado
     computacional.
   • Identificación de dianas terapéuticas (Ej.: proteínas
     virales en COVID-19).
Epidemiología:
   • Predicción de brotes mediante análisis de datos
     poblacionales
                         Ejemplo del Mundo Real
ATGGGAAACAGCTGTTACAACATAGTAGCCACTCTGTTGCTGGTCCTCAACTTTGAGAGGACAAGATCATTGCAGGATCCTTGTAGTAACTGCCCA
GCTGGTACATTCTGTGATAATAACAGGAATCAGATTTGCAGTCCCTGTCCTCCAAATAGTTTCTCCAGCGCAGGTGGACAAAGGACCTGTGACATA
TGCAGGCAGTGTAAAGGTGTTTTCAGGACCAGGAAGGAGTGTTCCTCCACCAGCAATGCAGAGTGTGACTGCACTCCAGGGTTTCACTGCCTGGGG
GCAGGATGCAGCATGTGTGAACAGGATTGTAAACAAGGTCAAGAACTGACAAAAAAAGGTTGTAAAGACTGTTGCTTTGGGACATTTAACGATCAG
AAACGTGGCATCTGTCGACCCTGGACAAACTGTTCTTTGGATGGAAAGTCTGTGCTTGTGAATGGGACGAAGGAGAGGGACGTGGTCTGTGGACCA
TCTCCAGCCGACCTCTCTCCGGGAGCATCCTCTGTGACCCCGCCTGCCCCTGCGAGAGAGCCAGGACACTCTCCGCAGATCATCTCCTTCTTTCTT
GCGCTGACGTCGACTGCGTTGCTCTTCCTGCTGTTCTTCCTCACGCTCCGTTTCTCTGTTGTTAAACGGGGCAGAAAGAAACTCCTGTATATATTC
AAACAACCATTTATGAGACCAGTACAAACTACTCAAGAGGAAGATGGCTGTAGCTGCCGATTTCCAGAAGAAGAAGAAGGAGGATGTGAACTGTGA
  https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGR
  AM=blastn&PAGE_TYPE=BlastSearch&LINK_LO
  C=blasthome
                     Casos de Éxito
COVID-19:
   • Secuenciación rápida del SARS-CoV-2 y diseño de
     vacunas usando herramientas bioinformáticas.
Oncología:
   • Identificación de mutaciones en tumores para terapias
     dirigidas (Ej.: inhibidores de kinasas).
Enfermedades raras:
   • Diagnóstico mediante análisis de exomas completos
             Desafíos y Limitaciones
Complejidad técnica:
   • Requiere colaboración entre médicos y
     bioinformáticos.
Ética y privacidad:
    • Manejo responsable de datos genéticos sensibles.
Acceso desigual:
   • Brecha tecnológica entre países desarrollados y en
     desarrollo.
Futuro de la Bioinformática en Medicina
Tendencias emergentes:
   • IA y aprendizaje automático para predicción de
     enfermedades.
   • Medicina de precisión a gran escala.
Recomendaciones:
   • Formación de médicos en herramientas
     bioinformáticas básicas.
   • Inversión en infraestructuras de datos en sistemas de
     salud.
    Aplicaciones de la Bioinformática
•   Adquisición de datos.
•   Comparación de secuencias.
•   Predicción de estructuras y modelación
    molecular.
•   Evolución molecular.
•   Experimentos in silico.
    Aplicaciones de la Bioinformática
• Identificación de genes
• Herramientas de búsqueda en bases de
  datos
• Expresión de genes
• Clasificación de proteínas
• Farmacogenómica
    Funciones de la Bioinformática
              PRIMARIA
      Organizar y procesar datos.
             SECUNDARIA
 Dar sentido biológico a la información.
               TERCIARIA
Predicciones diagnósticas o terapéuticas.
            Experimentación in silico
El nuevo paradigma es que todos los genes se conocerán y
 el punto de partida para una investigación biológica será
                         TEÓRICO
     Minería de Datos (Data Mining)
Knowledge Discovery
                                               Sistemas de
                                              adquisición y
                            Estadística       Monitorización
       Inteligencia
         Artificial
                                            Reconocimiento de
                                                patrones
                      Tecnologías
                      de Bases de
   Computación                            Visualización
                         datos
     avanzada
Bases de Datos
 Nuevas fuentes de
información para la
   práctica clínica
        Información biológica en Internet
Revisión de la literatura           Bases de datos específicas
    1. Internet biológica
       Herramientas y bases de datos creadas para indexar y
       contener información biológica
    2. Información biológica
        Cualquier información que un investigador adjunta
       Herramientas de búsquedas
• Buscadores generales
  Emplean palabras clave o números de acceso
  queries.
• Buscadores específicos (biológicos)
  Emplean similitud de términos para encontrar
  secuencias relacionadas.
      ¿Cómo hacer una búsqueda adecuada?
1.   ¿Qué información requiero?
2.   Reconocer las diferencias entre los motores de
     búsqueda.
3.   Emplear los dos tipos de buscadores.
4.   Emplear palabras específicas.
5.   Emplear sinónimos/términos homólogos
     promoter prediction tool/promoter prediction server
• Mayor capacidad para
  indexar.
• Categorización de paginas:
  * frecuencia de las
  palabras claves
• Captura las paginas:
  * más visitadas
  * con más vínculos
     Sintaxis de los motores de búsqueda
•   AND = +
•   NOT = -             COMANDOS BOOLEANOS
•   OR
*   NEAR
•   Comillas [“ ”]: búsqueda en el orden especifico de las palabras.
•   Restringir el dominio de internet (URL)
    Incluir [+ site:.edu],
    Excluir [- site:.edu]
                     NCBI
National Center for Biotechnology Information
EMBL-EBI Proporciona datos libremente disponibles a partir
de experimentos de ciencias biológicas, realiza investigación
    básica en biología computacional y ofrece un amplio
    programa de formación a los usuarios, y apoya a los
        investigadores en la academia y la industria.
Base de datos integrada de los genes humanos que provee
información integral, actualizada y de la información accesible
en todos los genes humanos conocidos y previstos.
.- Extrae e integra datos relacionados con genes, incluyendo genómica,
transcriptómica, proteómica, genética, clínica e información funcional. La
extracción se hace de > 100 fuentes de web.
.- Supera las barreras de formato de datos y la heterogeneidad, y utiliza la
nomenclatura estándar y los símbolos de genes aprobados. Presenta un rico
subconjunto de datos para cada gen, y proporciona enlaces a las fuentes
originales para un examen más detallado.
.- Se utiliza ampliamente, y ayuda en la comprensión de los aspectos
relacionados con el gen de la biología y la medicina.
 ¿Dónde encontrar más información y actualizarse
sobre las aplicaciones médicas de la Bioinformática?