Universidad Politécnica de Sinaloa
Est. Osuna Pineda Jesús Eduardo
ED1. EVIDENCIA DE DESEMPEÑO CORTE I
     M.C. Adrián González Castillo
             26/09/2024
Procedimiento para Preparar Secuencias para Análisis
Paso 1. Acceder a la página de NCBI
      Figura 1. Búsqueda de página de NCBI. https://www.ncbi.nlm.nih.gov
Paso 2. Para una mayor selectividad, filtramos el contenido a buscar.
                 Figura 2. Filtración de información – Nucleótidos.
Paso 3. Buscamos el microorganismo de interés, en nuestro caso Streptomyces
coelicolor y Streptomyces lividans.
     Figura 3. Búsqueda de Streptomyces coelicolor y Streptomyces lividans
Paso 4. En la página, bajamos la vista para buscar una secuencia de interés para
nosotros.
                         Figura 4. Bajar la vista en NCBI
Paso 5. Elegir la secuencia de interés, es posible visualizar el formato FASTA, u
otro formato proporcionado, directamente o abrir la secuenciación para ver más
información de esta.
                                                    Toda la información
                                      Formatos
  Figura 5. Elección de secuencias de Streptomyces coelicolor y Streptomyces
                                    lividans
Paso 6. Vista de la información de la secuencia. Al entrar directamente a “toda la
información” como se mencionó anteriormente, nos redirigirá a una pagina en
formato GenBank la cual tendrá más información de la secuencia
                      Figura 6. Información de la secuencia
Paso 7. Descargar secuencia. Para descargar la secuencia seleccionamos arriba
a la derecha el icono que dice “Send to:”, elegimos entre, “Complete Record” o
“Coding Sequences” si es necesario, “Complete Record” será el tamaño completo
de nuestra secuencia, mientras que “Coding Sequences” solo descargara las
partes de la secuencia que codifiquen para algo.
Elegimos como “Choose Destination” la elección “File”, elegimos nuestro formato,
en nuestro caso será formato FASTA y descargamos el archivo en “Create File”.
                        Figura 7. Descargar la secuencia
              Figura 8. Documento al elegir “Complete Record”
              Figura 9. Documento al elegir “Coding Sequences”
Procedimiento para Cambiar el Formato de Nuestro Archivo de Secuencia
Paso 1. Buscar un conversor de archivos, en nuestro caso usaremos EMBOSS
seqret.
                   Figura 10. Búsqueda de EMBOSS seqret.
              https://www.ebi.ac.uk/jdispatcher/sfc/emboss_seqret
            Figura 11. Vista de la pagina principal de EMBOSS seqret
Paso 2. Elegir si nuestra secuencia es una proteína (secuencia de aminoácidos),
DNA (bases nitrogenadas ATCG) o RNA (bases nitrogenadas AUCG). En nuestro
caso es DNA.
                          Figura 12. Tipo de secuencias
Paso 3. Seleccionar el archivo que vamos a convertir.
                          Figura 13. Selección de archivo
Paso 4. Bajar en la pagina y elegir el formato de entrada y el formato de salida del
archivo a convertir, el formato de entrada es aquel con la que cuenta nuestro
formato en este momento y el formato de salida es aquel tipo de formato al que
vamos a convertir el nuestro, en nuestro caso FASTA es nuestro formato de
entrada y queremos convertirlo a EMBL.
            Figura 14. Formato de Entrada y Salida – Sin seleccionar.
             Figura 15. Formato de Entrada y Salida – Seleccionado
Paso 5. Elegir un titulo representativo opcional para el trabajo hecho y darle a
“Submit” para iniciar la conversión.
                        Figura 16. Conversión del formato
Paso 6. Ver el resultado de la conversión.
               Figura 17. Entrar a los resultados de la conversión
Paso 7. Descargar documento convertido. Para ello ir a “Result Files” y descargar
la opción de “Tool Output”.
                  Figura 18. Vista de la conversión del archivo
                   Figura 19. Descarga del archivo convertido
Búsquedas de Secuencias Nucleotídicas o Proteicas
En caso de que contemos con una secuencia nucleotídica o proteica y no
sepamos a que microorganismo pertenece deberemos de seguir los siguientes
pasos.
Paso 1. Buscar la página de BLAST en nuestro buscador de confianza.
     Figura 20. Búsqueda de BLAST. https://blast.ncbi.nlm.nih.gov/Blast.cgi
Paso 2. Bajar hasta el apartado de “Web BLAST” y seleccionar “Nucleotide
BLAST” o “Protein BLAST” según la secuencia que estemos usando. En nuestro
caso es “Nucleotide BLAST”.
                     Figura 21. Página principal de BLAST.
Paso 3. Subir la secuencia nucleotídica que tenemos, puede ser escrita
directamente o se puede subir un archivo. En caso de ser necesario podemos
seleccionar unos limites para que busque la secuencia de “X” numero de
nucleótido hasta “Y” numero de nucleótido, en nuestro caso subiremos un archivo
de la secuencia completa de IS1372 en Streptomyces lividans que ya conocemos,
sin ningún límite de análisis en la secuencia.
     Escribir o pegar la secuencia en caso de no subir el
     archivo                                          Limite de
   >                                                  búsqueda de la
   GAATTCGCTGGGGTGGCGCGGTGGCTCG                       secuencia
   …….
                              Subir archivo
                         Figura 22. Buscar la secuencia.
Paso 4. Iniciar la búsqueda de la secuencia.
                     Figura 23. Inicio del proceso de BLAST
Paso 5. Ver las coincidencias arrojadas por BLAST en la parte de abajo, los
trabajos arrojados están ordenados de tal manera de que la secuencia mas
parecida en el servidor es la primera y este va bajando la similitud mientras mas
baja, debido a filtros de búsqueda da los 100 trabajos con mayor similitud, pero
este rango se puede aumentar o disminuir antes de hacer el BLAST. En nuestro
caso como es una secuencia obtenida de GenBank la primera opción es la misma
secuenciación que la nuestra, aun cuando le quitamos el nombre al archivo para
que no buscara en base a este nombre y buscara solo usando la secuencia de
bases.
      Figura 24. Primera impresión de la búsqueda. Sin nombre del trabajo.
                        Streptomyces
                        lividans
  Figura 25. Secuencias con mayor similitud, donde el primero corresponde a la
                secuencia exacta que buscamos pues ya existía.
Paso extra. Es posible guardar la búsqueda para un uso posterior y hacer otra
búsqueda de otra secuencia sin problemas
                        Figura 26. Guardar la búsqueda
                        Figura 27. Búsqueda guardada
Herramientas para el Análisis de Genomas Usando Bases de Datos
Ensembl es el principal centro de integración de información genómica de
organismos, y hasta hace relativamente poco estaba principalmente centrado en
mamíferos. Desde entonces se ha ido generalizando a otros tipos de vertebrados
u organismos eucariotas, albergando hoy en día información detallada de más de
50 organismos. (Fernández J., 2009)
El Centro Nacional para la Información Biotecnológica (NCBI) es una fuente
invaluable de información para comprender los sistemas biológicos. Ofrece una
amplia gama de herramientas computacionales y alberga un tesoro de datos,
incluyendo secuencias genéticas y proteicas, así como resúmenes y citas de
investigaciones científicas en las áreas de las ciencias naturales y la salud.
(Guzmán-López et al., 2023)
La Kyoto Encyclopedia of Genes and Genomes (KEGG) es una base de datos que
se enfoca en la comparación de genomas, especialmente en su capacidad para
codificar diferentes rutas metabólicas. Con KEGG se puede explorar mapas
metabólicos        y     descubrir      qué enzimas probablemente        codifica
un genoma específico. Además, KEGG permite identificar grupos de genes que se
mantienen similares entre dos especies, lo que se conoce como clústers de genes.
(Gómez and Alonso-Allende, 2002)
MBGD es una base de datos para el análisis comparativo de genomas
microbianos completamente secuenciados, cuyo número está creciendo
rápidamente. El objetivo de MBGD es facilitar la genómica comparativa desde
varios puntos de vista, como la identificación de ortólogos, la agrupación de
parálogos, el análisis de motivos y la comparación del orden de los genes.
(Uchiyama et al., 2019)
Comprehensive Microbial Resource (CMR) es una base de datos web que permite
visualizar,      buscar     y       analizar   secuencias        y     anotaciones
de genomas bacterianos y arqueales completos. Además de la anotación original
de GenBank,                      el                 CMR                      ofrece
anotaciones estructurales y funcionales automatizadas para facilitar la extracción
de datos genómicos. CMR ofrece más de 50 herramientas para trabajar con los
datos     de secuencia y anotación de 571 genomas.     Es      posible    visualizar
la anotación genética,        información       a        nivel         del genoma,
como mapas de rutas bioquímicas,                                                   y
realizar análisis comparativos entre genomas. (Davidsen et al., 2010)
Ortólogos y Parálogos
Ortólogos: Genes que comparten el último ancestro común y cuya divergencia se
debe a la especiación. (Tress, 2005)
Parálogos: Genes que, debido a una duplicación, ya no comparten el último
ancestro. Frecuentemente tienen funciones distintas. Copias que tiene la
posibilidad de evolucionar. (Tress, 2005)
                  Figura 28. Homólogos, Ortólogos y Parálogos.
         https://bioinformaticaupf.crg.eu/2005/projectes05/3.8/intro.html
Uso Preferencial de Codones
 Los patrones de uso de codones varían mucho entre las especies, y el uso
preferencial de un codón en un gen está relacionado con la cantidad
de proteína que se traduce. Esto se debe a que el uso preferencial
de codones está ligado a la exactitud del proceso de traducción. Cada organismo
utiliza solo un conjunto de los 61 codones disponibles para la producción
de mRNA. Esto significa que algunos organismos usan codones preferenciales en
las proteínas que expresan en gran cantidad, mientras que utilizan codones de
uso menor en las proteínas que casi no expresan. (Universidad Abierta y a
Distancia de México, n.d.)
Visión a nivel genómico de la ubicación de un gen y Desplazamiento a lo
largo del genoma
         Figura 29. El gen lpp visualizado a nivel genómico en ENSEMBL.
    https://reader.digitalbooks.pro/content/preview/books/34894/book/OEBPS/
                                      ch01.html
    Figura 30. Explorando las regiones humanas anotadas en la fase piloto de
                                     ENCODE.
    https://reader.digitalbooks.pro/content/preview/books/34894/book/OEBPS/
                                      ch01.html
El perfil de ocupación de cada marca a lo largo del genoma presenta un patrón
característico de picos asociable a distintos genes. (Genómica computacional,
n.d.)
Bibliografía
Fernández, J.M., 2009. Ensembl se «extiende» por el árbol taxonómico.
      Madrimasd.org.                         Disponible                  en:
      <https://www.madrimasd.org/blogs/bioinformatica/2009/04/23/116985>
      [Accedido el 26 de Septiembre, 2024].1
Guzmán-López, O., Ricaño-Rodríguez, C., Luis-Yong, D. and Ricaño-Rodríguez,
     J., 2023. NCBI: generalidades del repositorio y breve descripción de
     recursos aplicables al estudio de la fitogenética. Revista fitotecnia
     mexicana, 46(1). Disponible en: <https://www.scielo.org.mx/scielo.php?
     script=sci_arttext&pid=S0187-73802023000100063> [Accedido el 26 de
     Septiembre, 2024].2
Gómez, M.J. and Alonso-Allende, R., 2002. Análisis y anotación de genomas.
    Bases de datos y comparación. Protein Design Group, Centro Nacional de
    Biotecnología,             CSIC.              Disponible           en:
    <http://www.pdg.cnb.uam.es/cursos/Leon2002/pages/Genomas_Anal_Anot
    _BBDD/2_3_BBDD_Comp.html> [Accedido el 26 de Septiembre, 2024].3
Uchiyama, I., Mihara, M., Nishide, H., Chiba, H. and Kato, M., 2019. MBGD update
      2018: microbial genome database based on hierarchical orthology relations
      covering closely related and distantly related comparisons. Nucleic Acids
      Research,          47(D1),        pp.D382–D389.          Disponible    en:
      <https://doi.org/10.1093/nar/gky1054> [Accedido el 26 de Septiembre,
      2024].4
Davidsen, T., Beck, E., Ganapathy, A., Montgomery, R., Zafar, N., Yang, Q.,
      Madupu, R., Goetz, P., Galinsky, K., White, O. and Sutton, G., 2010. The
      comprehensive microbial resource. Nucleic Acids Research, 38(Database
      issue),             pp.D340-D345.              Disponible             en:
      <https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2808947/> [Accedido el 26
      de Septiembre, 2024].5
Tress, M., 2005. Análisis de Secuencias, Familias de Proteínas. Masters en
      Bioinformática, Madrid: Protein Design Group. Disponible en:
      <http://www.pdg.cnb.uam.es/cursos/Master2005/Fam_theory/familias.pdf>
      [Accedido el 26 de Septiembre, 2024].6
Universidad Abierta y a Distancia de México, n.d. Genética molecular bacteriana:
      Obtención de BGM, uso preferencial de codones. Disponible en:
      <https://dmd.unadmexico.mx/contenidos/DCSBA/BLOQUE2/BI/06/BGMB/u
      nidad_02/descargables/BGMB_U2_Contenido.pdf> [Accedido el 26 de
      Septiembre, 2024].7
Genómica computacional, n.d. Capítulo I: Navegadores genómicos. Disponible en:
     <https://reader.digitalbooks.pro/content/preview/books/34894/book/
     OEBPS/ch01.html> [Accedido el 26 de Septiembre, 2024].8