La secuenciación de alta fidelidad HiFi de  fragmentos largos producida por PacBio ha contribuido enormemente a muchas áreas de la genómica en los últimos años, incluyendo el ensamblaje de novo, la resolución de todas las variantes, la secuenciación completa del genoma y del ARN o la metagenómica de alta resolución entre otras. Todo ello, ha sido posible gracias a la secuenciación precisa de moléculas nativas de ADN de gran longitud. Durante la última década, se han realizado intentos para reconstruir de forma sintética secuencias de moléculas más largas a partir de otras  de lectura corta, lo que generalmente implica copiar la molécula original mediante PCR. Las lecturas de Moleculo o 10X tenían el inconveniente de una preparación y análisis bastante tediosas por lo que posteriormente se abandonaron. Recientemente, Illumina incorporó lecturas 'Infinity' y Element Biosciences adquirió Loop Genomics como la última versión de este concepto de lecturas largas sintéticas.

Figura 1. Diapositiva presentada por Illumina en la conferencia FoG 2022 que compara las lecturas de Illumina Infinity, etiquetadas como "Longas", con las lecturas cortas de Illumina y las lecturas de PacBio HiFi, etiquetadas como "CCS".

A pesar de que aún hay pocos datos disponibles con respecto a los nuevos enfoques de lectura larga sintéticos, Illumina mostró una comparación a principios de este año en la conferencia Festival of Genomics & Biodata (FoG 2022), donde se presentaban las lecturas sintéticas de Infinity, etiquetadas como "Longas", en la parte superior, seguidas de las lecturas cortas estándar de Illumina y las lecturas PacBio HiFi etiquetadas como "CCS" representadas en la parte inferior:

Sin embargo, una comparación más detallada destaca importantes ventajas de las lecturas PacBio HiFi de alta fidelidad, que incluyen:

a) Precisión de resolución de variante. Una variante (una inserción repetida en tándem), claramente resuelta como homocigota con lecturas PacBio HiFi, solo se detecta parcialmente con Infinity, lo que hace que la variante aparezca falsamente como heterocigota.

b) Confianza de resolución de variantes. Una región de dos SNV homocigotas y heterocigotas adyacentes, que se resuelven claramente con lecturas de PacBio HiFi, pero no están respaldadas por la lecturas del panel Illumina Infinity.

Figura 2. Tres secciones de la misma imagen que se muestra en la Figura 1.

c) Fases de largo alcance. La región IGV representada contiene variantes heterocigotas separadas por ~10 kb, claramente escalonadas a través de varias lecturas de PacBio HiFi que abarcan completamente esta distancia, lo que permite la fase directa (como cis de las dos variantes en relación con la referencia). Sin embargo, en el caso de Illumina Infinity las lecturas no son lo suficientemente largas para abarcar la distancia entre las dos variantes.

d) Además, las lecturas largas verdaderas detectan directamente la metilación de CpG, lo cual no es es posible en el caso de lecturas cortas ni con la PCR utilizada para los enfoques de lectura sintética.

El mes pasado, Element Biosciences describió lecturas largas sintéticas utilizando la tecnología Loop Genomics. En este gráfico de comparación de tecnologías para la secuenciación de amplicones metagenómicos queda demostrado cómo la precisión superior de la secuenciación HiFi (99,9993 % (Q51,5)) da como resultado un mejor rendimiento de la aplicación.

Element Biosciences describió lecturas largas sintéticas utilizando la tecnología Loop Genomics y mostró un gráfico de comparación de tecnologías para la secuenciación de amplicones metagenómicos (Figura 3 de Callahan et al. (2021)):

Estos ejemplos muestran que las lecturas largas sintéticas no se pueden comparar con los beneficios de las lecturas largas verdaderas producidas por la secuenciación PacBio HiFi, e incluso dichas secuencias sintéticas corren el riesgo de confundir los estudios con artefactos que pueden proporcionar información potencialmente inexacta.

La secuenciación PacBio HiFi proporciona la información genómica y epigenómica más precisa, contigua y completa con aplicaciones cada vez mayores para hacer posible la promesa de la genómica para mejorar la salud humana.