¿Qué es una feature en QIIME2 para estudiar microbioma?
Una feature, es una unidad de observación, como una unidad taxonómica operacional del inglés Operational Taxonomic Unit (OTU), una secuencia variante del inglés amplicon sequence variants (ASV), un gen, un metabolito, etc. Es un término genérico usado en QIIME 2, debido a que ésta pipeline puede tener distintos tipos de features.
Para comprenderlo un poco mejor, hagamos una analogía. Supongamos que tienes un conjunto de 153,807 hilos de 770 colores distintos; las features equivaldrían a los 770 colores diferentes. Ahora veamos un ejemplo de cómo vemos las features en QIIME2.
Cuando hacemos un análisis de secuenciación de amplicones del 16S rRNA (16S rRNA Amplicon Sequencing) para identificar bacterias, después de realizar el control de calidad de las secuencias y la construcción de la tabla de features (qiime feature table) con el plugin de dada2 o deblur, se obtienen 3 archivos: el de estadísticas (stats-dada2.qza), la tabla de frecuencias (table-dada2.qza) y el que contiene a las secuencias representativas (rep-seqs-dada2.qza), estos artefactos los puedes transformar al formato de visualización (.qzv) y abrirlos en Qiime2 View.
En el archivo de estadísticas, en la columna de secuencias no quiméricas, encontramos las secuencias que pasaron todos los filtros de calidad, es decir, son las lecturas finales de trabajo. Si hiciéramos una sumatoria de los valores de esa columna, obtendremos el valor que vemos en la tabla de frecuencias, el de 153,807.
Por lo tanto en esas 153,807 lecturas totales existen 770 features diferentes, que para el caso de dada2 son ASVs; sin embargo, si utilizas otro método de agrupación pueden tratarse de OTUs
Si descendemos a la sección que dice frecuencia de cada feature, vemos que la mínima es de 2 y la máxima es de 11,373, si quieres saber cómo se obtienen estos archivos en Qiime2 da click aquí.
Regresando a la analogía de los hilos, cuando hablamos de frecuencias, un valor de 2 significa que un color de los 770 totales (puede ser el 1) está en una frecuencia de dos hilos de los 153,807 totales y otro color de los 770 totales (puede ser el número 770) tiene un total de 11,373 hilos.
Finalmente, si revisamos el archivo de la secuencia representativa, vemos que, continuando con la analogía, los 770 colores tienen una longitud de hilo de 120 cm y en la sección de feature ID, vemos la clave con la que identificamos los 770 colores diferentes, así por ejemplo podría ser que el primero que vemos, es la clave asignada a la feature del color 1 o el 770 que mencionamos anteriormente, el cuál retomando los términos bioinformáticos equivaldría a una ASV para resultados de dada2.
Para saber qué frecuencia tiene cada ASV, se usan otros plugins de qiime, para lo que te recomendamos revises el tutorial de moving pictures. En el siguiente video puedes visualizar lo que te acabamos de explicar.
Cursos de bioinformática disponibles





¿Qué es la desreplicación de las secuencias en QIIME 2? Análisis bioinformático de microbioma
La desreplicación de las secuencias es uno de los pasos que se llevan a cabo durante el procesamiento de datos provenientes de secuenciación masiva de amplicones y consiste en comparar todas las secuencias entre sí mismas, agrupando las que son similares o idénticas con criterios definidos y obteniendo una secuencia representativa de cada grupo de secuencias, es decir una secuencia única. Es importante mencionar que el paso previo a la desreplicación es la identificación y corrección de posibles errores durante la secuenciación (eliminación de ruido).
Así por ejemplo, si se tienen 100 secuencias idénticas del tipo A, se selecciona una de ellas para los siguientes análisis y posteriormente se le asigna la frecuencia de 100, de ésta forma se remueven lecturas idénticas temporalmente facilitando el procesamiento bioinformático. Lo mismo se hace con las secuencias tipo B, tipo C, etc. En el siguiente video puedes revisar lo que explicamos en estos párrafos.
Si estás comenzando en bioinformática, te invitamos a revisar nuestra lista de reproducción de comandos básicos de Linux de you tube, y si éstas comenzando a utilizar QIIME 2, revisa la lista de reproducción de moving pictures, donde verás los distintos plugins utilizados para trabajar con secuencias single end del 16S rRNA para microbioma.
¿Qué es un archivo de metadatos en QIIME2? Análisis bioinformático del 16S rRNA de microbioma
Un archivo de metadatos (sample-metadata.tsv) tiene la extensión .tsv, es decir, de “valores separados por tabulaciones”, que contiene toda la información relevante de tus muestras, como el nombre que le asignaste, la secuencia del barcode y otros datos que posteriormente utilizarás para tus análisis estadísticos y que identifiquen el origen de tu muestra, entre otros.
Por ejemplo, si se trata de muestras de materia fecal de humanos puedes incluir sexo, edad, ubicación geográfica, hábitos alimenticios, consumo de medicamentos, enfermedades, fecha de muestreo, entre otros datos que tengas de tus muestras.
Si son muestras de agua, como de algún lago puedes incluir profundidad, fecha, ubicación geográfica, parámetros fisicoquímicos como conductividad electrolítica, pH, concentración de nitratos, amonio, entre otros.
Por lo que el contenido del archivo de metadatos dependerá del tipo de muestra de estudio y los objetivos del experimento. Sin embargo, hay algunos datos que debe contener y que son indispensables como la clave de la muestra, que debe ser la misma que estás trabajando experimentalmente y la secuencia del barcode asignado.
Este archivo de metadatos lo puedes elaborar en excel o en una hoja de cálculo, toma en cuenta que es importante que la primer columna contenga el nombre de las muestras y la segunda columna la secuencia del barcode.
Una vez que llenaste tu documento con los datos de tus muestras y sus parámetros, para guardarlo con la extensión .tsv, en excel vas a dar click en archivo, guardar como, y escoges la opción delimitado por tabulaciones, damos click y listo, ya tienes tu archivo de metadatos para usar en Qiime2. Revisa el siguiente video para ver los detalles.
¿Qué es la rarificación de las secuencias en QIIME2? Bioinformática del microbioma
Cuando se hace un análisis del microbioma a través de una secuencia barcode como puede ser el 16S rRNA se generan unas tablas de frecuencias que pueden ser de OTUs o ASVs.
Pensemos en un ejemplo de una tabla de OTUs de los resultados de la secuenciación de amplicones de heces de caballo. Ésta tabla contiene los datos de la frecuencia de las OTUs por muestra, suponiendo que nuestro experimento es de 30 heces de caballos diferentes, podríamos tener que en una muestra hay 1000 secuencias, en otra 15,000 e incluso alguna con 150, pero, ¿A qué se debe esto? Esta diferencia en el número de secuencias puede suceder, entre otras cosas a variaciones en la metodología durante la construcción de la biblioteca para la secuenciación.
Si quieres profundizar en este tema, te invitamos a revisar los cursos virtuales que ofrecemos en este sitio web
La variabilidad en la frecuencia de las secuencias por muestra puede afectar en la interpretación de los resultados de diversidad alpha y beta cuando se considera la riqueza de especies y la ausencia, estas pueden tener un gran peso sobre los cálculos de las métricas de diversidad, esto porque la comunidad microbiana en cada muestra está representada por diferentes números de secuencias, la cual puede deberse más a la metodología que a una variación biológica real.
Una opción sugerida por algunos investigadores es la normalización de los datos para tratar de hacer comparaciones entre las muestras, llamada rarificación (rarefying), la cuál consiste en hacer un corte en el número de secuencias por muestra, por ejemplo, se puede hacer la rarificación a 1000 secuencias, de ésta forma todas las muestras tendrán el mismo número de frecuencia, pero si te das cuenta, al hacerlo, perderíamos la muestra que contiene menos de 1000 secuencias, por otra parte, si escogemos rarificar a 102 secuencias, puede ser que ese número de secuencias no represente la diversidad de las muestra, entonces ¿qué profundidad debemos escoger? y ¿con base en qué lo podemos hacer? ¿Existen otras estrategias para eliminar el sesgo de las diferencias del número de secuencias entre las muestras para los cálculos de diversidad alpha y beta?.
Te invitamos a que revises nuestro curso online en nuestro sitio web donde encontrarás la respuesta a esta pregunta y profundizar en el análisis bioinformático de amplicones para el estudio del microbioma
Revisa el siguiente video para repasar lo que te acabamos de describir.
Cursos de bioinformática disponibles





¿Para qué sirve un plugin en Qiime2? Análisis de secuencias NGS
Un plugin es una instrucción desarrollada por los creadores o colaboradores de Qiime2, es una especie de comando o función que le indica al programa cuál es el paso a seguir.
En la página web de Qiime2, existe una lista de todos los plugins que han sido desarrollados para ésta pipeline, aquí vemos los plugins para: 1)alinear secuencias, 2)hacer análisis composicional, 3)hacer el demultiplexing, 4)hacer la asignación taxonómica, etc.
Así por ejemplo, si damos click en el plugin demux vemos su descripción; éste plugin es utilizado para el demultiplexing y visualización de la calidad de las secuencias ya sea paired-end o single-end, también vemos la versión actual, así como el sitio web en GitHub. Vemos que existen diferentes métodos para trabajar con éste plugin, así como el plugin para visualizar los datos. En la opción emp-single vemos la que página contiene las referencias con base en las cuáles se desarrolló este plugin, una descripción breve de para qué sirve y cómo se usa, por ejemplo, el archivo de entrada que se requiere, los argumentos, es decir, los parámetros que se pueden mover y el archivo de salida. Para ver un ejemplo de cómo se usa este plugin, te recomendamos ver el video del demultiplexing del tutorial de moving pictures.
Finalmente, también puedes ver ésta misma información desde tu terminal, para ello abre tu terminal y activa Qiime 2. Posteriormente escribe el plugin de qiime demux emp-single y agrega la opción
– – help
Da enter
Y ve que se despliega la misma información del sitio web.
En el siguiente video te mostramos para que sirve un plugin.
¿Qué es QIIME2 view? Usado en bioinformática del 16S rRNA
Qiime 2 view es una interface online donde podemos visualizar los archivos .qzv generados con los plugins de Qiime2
Sólo tienes que arrastrar el archivo que quieras visualizar y soltarlo en la caja que dice Drag and Drop or click here. Por ejemplo, puedes visualizar el archivo que contiene el bar plot de la asignación taxonómica generado en el tutorial de moving pictures. Lo arrastramos y nos muestra los datos de la asignación taxonómica realizada a nuestras muestras con los datos de frecuencia de cada feature.
En Qiime2 view podemos visualizar el barplot de la frecuencia relativa a distintos niveles taxonómicos, por ejemplo si queremos ver los géneros de las muestras, escogemos el nivel 6. También podemos cambiar la paleta de colores, el ancho de las barras, ordenarlos con base a los datos registrados en el archivo de metadatos. Lo mismo podemos hacer con otros archivos de visualización, por ejemplo, con la curva de rarefacción.
Adicionalmente si tienes tus archivos .qzv en tu git hub o Dropbox, puedes introducir el link y automáticamente cargará los archivos para visualizarlos, también podrás compartir el link con tus colaboradores. Checa el siguiente video para ver los detalles de como usar Qiime 2 view.
¿Cuál es la diferencia entre formato .qza y .qzv en QIIME2?
Durante los análisis de microbioma que se realizan a las secuencias de un marcador molecular como el 16S rRNA en QIIME2, se producen archivos con un tipo de compresión especial llamados artefactos (artifacts) y tienen una extensión .qza.
Éstos archivos se generan en pasos intermedios durante el análisis de datos en QIIME2, ya sea por alguna acción realizada con alguno de los plugins o cuando se importan archivos para ser analizados en éste programa.
Así los artefactos son archivos de salida de algunos plugins pero también son archivos de entrada de otros, que son como carpetas comprimidas que contienen los archivos necesarios para cada paso. Además, contienen información de la instrucción que le dio origen al archivo, y otros metadatos.
Los archivos .qzv son aquellos que muestran los datos como tablas o gráficos a través de la herramienta llamada QIIME2 View generados por algunos plugins, también son una especie de carpetas comprimidas, ya que contienen varios archivos, entre ellos las gráficas o tablas de datos, veámoslo más claro con un ejemplo:
En la carpeta de Qiime2 del tutorial moving pictures tenemos dos archivos, uno llamado demux.qza y otro demux.qzv; nota que ambos archivos se llaman igual, pero uno tiene la extensión .qza y el otro .qzv, vamos a ver su contenido con ayuda de un plugin de Qiime2 llamado qiime tools export, en la terminal, activamos Qiime 2.
Escribimos qiime tools export, la opción –input-path para el archivo de entrada que será demux.qza y para el archivo de salida —output-path le pondremos demux_de_QZA
Nota que se genera una carpeta, si vemos su contenido notamos que ésta contiene todas las secuencias usadas en el análisis, más dos archivos con información relevante del tipo de secuencias y de la calidad phred. Ahora vamos hacer lo mismo con el archivo .qzv que es el de visualización
Escribimos en la terminal qiime tools export, la opción –input-path para el archivo de entrada que será demux.qzv y para el archivo de salida —output-path escribimos demux_de_QZV.
Se genera una carpeta que contiene el archivo html de la gráfica de calidad de las secuencias, así como algunas gráficas en formato png o pdf, archivos .tsv, entre otros más.
En resumen, el formato .qza es para archivos intermediarios en los análisis de qiime2 y el formato .qzv es para archivos de visualización.
Cursos de bioinformática disponibles





¿Cuál es la diferencia entre una OTU y una ASV para estudios de microbioma?
Con el auge de las técnicas basadas en la secuenciación del DNA, la forma en que detectamos y medimos la biodiversidad está experimentando un cambio radical. En primer lugar, debemos definir la unidad que engloba a las entidades biológicamente similares que se utilizarán para medir la diversidad. Actualmente, existen dos aproximaciones muy ampliamente usadas en análisis de microbioma: las OTUs (unidades taxonómicas operativas por sus siglas en inglés) y las ASVs (variantes únicas de amplicón).
OTU es una definición operativa que se basa en agrupar secuencias de acuerdo a un umbral de similitud.
El umbral de similitud está definido por el marcador molecular (o barcode) y por el nivel taxonómico al que busquemos aproximarnos. Por ejemplo, usamos un umbral de similitud al 97% para aproximarnos al nivel de especie usando el gen 16S rRNA, y del 95% para el nivel de género. Para otros marcadores moleculares es posible que se usen otros umbrales de similitud.
Las ASVs representan variantes genéticas únicas, es decir, definidas incluso por cambios en un solo nucleótido.
Por lo que con ASVs nos aproximamos al nivel de cepas o tipos por debajo del nivel de especie. Usar ASVs para medir la diversidad de microbiomas puede tener mayor resolución pues consideramos tipos genéticos, sin embargo, se requieren secuencias de muy alta calidad para no sobreestimar la diversidad en una muestra de microbioma.
Otra finalidad práctica de las OTUs y ASVs es que los avances en las tecnologías de secuenciación masiva para estudiar el microbioma en diferentes ambientes, se generan gigas de información en secuencias de DNA y para analizarlas se puede hacer a través de OTUs o ASVs, veámoslo con un ejemplo:
Supongamos que tenemos una serie de muestras de suelo n=30 y de cada una se extrae DNA metagenómico.
A partir de ese DNA se amplifica una región del 16S rRNA y se secuencia en la plataforma que más se adapte a los objetivos de tu estudio
Como resultado de la secuenciación, obtenemos archivos con cientos de miles de secuencias que en total podrían sumar, por ejemplo 20 millones de lecturas
Esas lecturas pueden equivaler a 300 géneros o 120 géneros, en este momento aún no lo sabemos, es por ello que para comenzar el análisis es necesario separarlas en OTUs o en ASVs.
Las OTUs se forman agrupando esas secuencias contemplando un % de disimilitud, generalmente del 3%, es decir, las secuencias son 97% similares entre sí, dependiendo del software utilizado se puede agrupar a través de diferentes metodologías:
Closed-reference
De novo clustering
Open reference
Por lo tanto, al final del análisis de los 20 millones de lecturas podríamos obtener por ejemplo, 1000 o 10,000 OTUs, dependiendo de la diversidad de la muestra, el método utilizado, la base de datos de referencia, la región del 16S rRNA secuenciado.
En cambio las ASV, no son agrupadas con base en un % de similitud, más bien se obtienen a partir de un modelo que considera que es más probable que una secuencia biológica se observe repetidamente que una secuencia con errores de la secuenciación, así las lecturas pueden diferenciarse desde un nucleótido.
Por lo tanto, en resumen:
Una OTU se obtiene a partir de secuencias que son diferentes en un 3% mientras que una ASV se obtiene a partir de secuencias que son diferentes desde un nucleótido.
¿Qué es un barcode en análisis de secuenciación masiva de amplicones? NGS
En la literatura, encontrarás dos definiciones para barcode, por una parte aquella aplicada en el DNA barcoding y la utilizada en secuenciación masiva.
El DNA barcoding es una herramienta para la fácil identificación de especies, basada en secuencias de DNA estándar, generalmente de 400 a 1000 pb, que es universal para la identificación de diversas especies y que es fácilmente amplificada, y el término barcode en este contexto se refiere a este fragmento de DNA, por ejemplo:
Un fragmento de 600 pb de la subunidad 1 de la citocromo c oxidasa es utilizada como barcode para la identificación de animales, da click aquí o aquí para ver un artículo donde puedes profundizar en los criterios utilizados para seleccionar una secuencia barcode para identificación de especies.
Por otro lado, el término barcode en secuenciación masiva (también son conocidos como índex o tags) se refiere a un identificador molecular único, es decir, es una secuencia específica de DNA de 8 a 12 nucleótidos, utilizada para que con ayuda de programas bioinformáticos, en un paso denominado demultiplexing, se puedan separar muestras después de la secuenciación.
Por ejemplo, cuando se construye una biblioteca de secuenciación de amplicones, los barcodes se introducen durante la preparación de la biblioteca, así cada muestra contiene amplicones con un barcode específico, es como si cada muestra fuera una biblioteca individual etiquetada con un barcode, que posteriormente se mezcla con otras muestras que contienen su barcode específico para la secuenciación, de ésta forma podemos secuenciar 150 muestras a la vez.
De tal forma que con ayuda de programas bioinformáticos como QIIME2 se pueden separar las muestras en los archivos que recibimos del secuenciador a través del demultiplexing. Revisa el siguiente video para más detalles.
Si quieres saber ¿Cómo se introduce este barcode en las secuencias de tus muestras? revisa nuestro curso online de generalidades de microbioma.
Cursos de bioinformática disponibles





¿Qué es el Phred quality score? análisis de calidad de las secuencias NGS
Cuando hacemos un análisis de secuenciación, es importante considerar un parámetro que nos proporciona información importante sobre la calidad de la secuenciación, es decir, para evaluar la precisión con la que el secuenciador asigna un nucleótido a la lectura, en un paso llamado “base-calling”.
Éste parámetro es el Phred quality score (Qscore), y es el criterio más comúnmente utilizado para evaluar la precisión de una plataforma de secuenciación. El valor Qscore indica la probabilidad de que un nucleótido sea asignado incorrectamente por el secuenciador.
Así por ejemplo, un valor de Qscore de 30 (Q30) asignado a una base nucleotídica equivale a una probabilidad de 1 en 1000 de que esa base sea incorrecta, esto significa que la precisión en el llamado a ese nucleótido por el secuenciador, equivalente a la probabilidad de que esa base sea llamada correctamente, es del 99.9%
Un valor Qscore menor, por ejemplo de 20, tiene una probabilidad de 1 en 100 de que ese nucleótido sea incorrecto.
La calidad de tus secuencias va a afectar tus análisis posteriores por lo que es crucial aplicar criterios que eliminen secuencias o nucleótidos de mala calidad de tus bases de datos. Además, cada plataforma y química de secuenciación maneja un intervalo de calidad, y algunas de ellas su principal desventaja son los bajos valores de Qscore que pueden ofrecer, lo que puede resultar en lecturas que no son útiles para algunos análisis bioinformáticos.
Si te interesa aprender qué valor de quality score ofrecen las diferentes plataformas de secuenciación y seleccionar la más adecuada para tu análisis, o si quieres saber dónde y cómo interpretar este valor en tus datos de secuenciación de microbioma, te invitamos a revisar nuestro sitio web donde ofrecemos cursos teóricos o prácticos para comenzar en el estudio bioinformático del microbioma.
¿Por qué los archivos fasta y fastq no son iguales? Bioinformática
Los archivos fasta y fastq son documentos en formato de texto que contienen secuencias de nucleótidos o de proteínas y son utilizados en muchos programas bioinformáticos. Sin embargo, tienen algunas diferencias:
El archivo fasta cuya extensión es .fasta o .fa (o sus variantes .fna que significa fasta nucleic acid o .faa fasta amino acid), comienza con un signo de mayor qué, seguido del identificador de la secuencia, es decir, el nombre de la secuencia que puede contener caracteres alfanuméricos, espacios y caracteres especiales, por ejemplo, los identificadores de las secuencias en el NCBI se ven así:
>DQ268529.1 Homo sapiens syntaxin 16 isoform C-like protein (STX16) mRNA, 3′ UTR
En la siguiente línea, es decir, seguido de un enter, aparecerá la secuencia completa.
En cambio el archivo fastq, tiene la extensión .fastq y comienza con un símbolo de arroba, seguido del identificador de la secuencia y otros parámetros relacionados con el secuenciador, la corrida de secuenciación y hasta las coordenadas de esa lectura en la línea de secuenciación. Después de un enter comienza la secuencia, después el símbolo de +, que es un separador, y después de un enter, el código del quality score en código ASCII.
Se usa código ASCII para que el mismo número de caracteres representando a los nucleótidos, coincida con el número de caracteres representando números de hasta 2 dígitos.
En resumen, ambos archivos contienen secuencias de nucleótidos o proteínas, pero el archivo fastq contiene, además, los valores de la calidad de la secuenciación en código ASCII.
¿Qué es una secuencia single end? en secuenciación de nueva generación
Cuando se hace la secuenciación del DNA, dependiendo de la plataforma utilizada, se pueden secuenciar fragmentos de diferente tamaño,
Por ejemplo, supongamos que amplificamos fragmentos de DNA del 16S rDNA de un tamaño de 400 pb de una comunidad de bacterias del permafrost y elegimos a la la plataforma de Illumina para la secuenciación. A estos fragmentos les unimos un adaptador específico para esta plataforma de secuenciación en cada extremo de la cadena, por un lado el adaptador A y en el otro extremo el B.
En la flowcell están las secuencias complementarias al adaptador A y al B, entonces cuando el fragmento de DNA se secuencia a partir de solo un extremo de la cadena, generando solo una lectura, hablamos de una lectura o secuencia single-end.
Así si la secuencia original es de 400 pb y utilizamos el aparato MiniSeq de Illumina que proporciona lecturas de 150 pb, únicamente obtendremos ese tamaño de fragmento
Por otro lado, la secuenciación paired-end proporciona lecturas de ambos sentidos de la cadena, es decir comienza desde un extremo secuenciando en esa dirección hasta la longitud específica de la plataforma utilizada y después comienza otra ronda leyendo desde el otro extremo de la cadena, sin embargo eso nos dejaría un fragmento de DNA sin secuenciar, de aquí la relevancia en la selección de la plataforma de secuenciación y el marcador molecular a estudiar.
Si quieres profundizar en este tema, te invitamos a seguirnos en nuestras redes sociales, Facebook e Instagram donde encontrarás información de éste tema así como cursos especializados para profundizar en el estudio del microbioma.
Cursos de bioinformática disponibles





¿Qué es una región de homopolímeros en el DNA?
En genómica, una región homopolimérica se refiere a una secuencia de DNA que contiene bases idénticas consecutivas, por ejemplo:
Se podrían tener una región homopolimérica de guaninas o adeninas
Estas regiones están presentes en todos los genomas, aunque algunos eucariotes las contienen en altas frecuencias.
Las regiones homoliméricas pueden ser de diferente longitud, encontrando regiones de 4 pb, de 6 pb o de 8 pb y su frecuencia en el genoma dependerá de la especie.
¿Qué es una quimera en biología molecular? PCR
Las quimeras son secuencias de DNA formadas por dos o más secuencias biológicas que se unieron incorrectamente durante la PCR.
Al extraer el DNA metagenómico de una muestra ambiental, éste contiene DNA de diferentes organismos, entre ellos la secuencias del 16S rRNA, por ejemplo, de distintos géneros de bacterias. Cuando se amplifica ésta región del DNA por PCR, durante la etapa de elongación, a veces quedan fragmentos del amplicón incompletos, que en el siguiente ciclo de PCR pueden actuar como primer uniéndose incorrectamente a otra región de DNA que sea diferente a la original, creando la secuencia quimérica que contendrá la secuencia de DNA de dos regiones de organismos distintos.
Posteriormente con los siguientes ciclos de PCR éstas secuencias quiméricas se amplificarán varias veces, creando amplicones de secuencias que no existen tal cual en la naturaleza, por ejemplo pueden tener fragmentos de secuencias de Streptococcus pneumoniae, Streptococcus mutants y Staphylococcus aureus.
Estos artefactos son particularmente frecuentes en la amplificación del 16S rRNA pues regiones regiones variables flanqueadas por regiones altamente conservadas son las que permiten la estructura secundaria particular del ribosoma.
Cursos de bioinformática disponibles




