Quy trình công nghệ giải trình tự hệ gen virus SARS-CoV-2 bằng hệ máy giải trình tự thế hệ mới PacBio là kết quả của đề tài khoa học được Viện Hàn lâm Khoa học và Công nghệ Việt Nam giao Viện Công nghệ sinh học (CNSH) thực hiện, nhằm đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh Covid-19 tại Việt Nam.
Với việc làm chủ công nghệ này, cho phép các nhà khoa học Việt Nam có thể giải trình tự hệ gen những đối tượng virus gây bệnh mới trong tương lai một cách nhanh chóng và chính xác, mà không cần hệ gen tham chiếu.
Cây phát sinh chủng loại gồm các chủng SARS-CoV-2 được thu thập tại Việt Nam cho đến ngày 1/4. Tham chiếu MN908947.3 của NCBI cũng được đưa vào sử dụng làm so sánh (màu đen), trong khi đó các hệ gen SARS-CoV-2 do Viện CNSH giải và cung cấp được đưa vào so sánh (đóng khung đỏ). Các trình tự được tô màu theo phân loại GISAID. Cây phân loại cho thấy sự tiến hóa của SARS-CoV-2 cũng như thời điểm các chủng lần lượt xâm nhập vào Việt Nam. (Nguồn: VOV.VN) |
GS.TS. Trương Nam Hải - Chủ nhiệm đề tài cho biết, Viện CNSH đã phối hợp với Viện Pasteur TP. Hồ Chí Minh và Viện Vệ sinh Dịch tễ Trung ương (NIHE) xây dựng quy trình kỹ thuật giải trình tự toàn bộ hệ gen virus SARS-CoV-2 bằng công nghệ giải trình tự đoạn dài của PacBio, gồm 6 bước:
(1) Nuôi cấy và tách chiết ARN virus. (2) Tổng hợp cDNA sợi đôi từ ARN virus. Hai bước này được thực hiện tại Viện Pasteur TP. Hồ Chí Minh và NIHE trong điều kiện phòng sạch an toàn sinh học cấp III. (3) Chuẩn bị thư viện DNA để giải trình tự gen. (4) Giải trình tự toàn bộ hệ gen virus SARS-CoV-2. (5) Lắp ráp de novo hệ gen virus. (6) Chú giải và phân tích hệ gen virus. Bốn bước sau thực hiện tại Viện CNSH trong khoảng 48h.
Cũng theo GS.TS. Trương Nam Hải, tại Việt Nam, để giải trình tự hệ gen virus SARS-CoV-2, các đơn vị trong nước sử dụng công nghệ giải trình tự đoạn ngắn. Sau đó lắp ráp và tham chiếu với hệ gen trước đó. Công nghệ này mất nhiều thời gian để đọc được trọn vẹn hệ gen (3-4 ngày) và vẫn có sai sót trong khi đọc.
"Một số đơn vị khác có thể giải trình tự bằng thiết bị thế hệ mới dựa trên nguyên lý giải trình tự các đoạn ngắn. Tức là họ giải trình tự các đoạn ngắn, sau đó lắp ráp các đoạn này với nhau thành đoạn dài để giải trình tự của một hệ gen.
Và để giải trình tự đó thì hiện nay các đơn vị phải sử dụng trình tự tham chiếu mà đã giải trước đó (như trước đó Trung Quốc là quốc gia đã giải trình tự thành công chủng ở Vũ Hán). Sau khi giải các đoạn ngắn xong thì dùng trình tự tham chiếu để lắp lên thành hệ gen của chủng mà mình đang đi giải trình tự.
Cách làm này thường lâu, giải trình tự đoạn ngắn thường rất khó để đọc được trọn vẹn hệ gen một cách đầy đủ, nên nhiều khi phải sử dụng thêm một trình tự nữa là giải trình tự sanger để đọc đầy đủ nhất hệ gen mà mình quan tâm. Bên cạnh đó, phương pháp này cũng có các lỗi đọc, nên việc chỉnh sửa nó cũng mất thêm thời gian"- GS Trương Nam Hải cho biết thêm.
Đề tài này đã giải trình tự toàn bộ hệ gen của bốn chủng virus SARS-CoV-2, với chiều dài trên 29500 nucleotide/hệ gen. Kết quả lắp ráp hệ gen cho thấy, không có lỗi đọc hay đoạn trống, kết quả giải trình tự đạt độ chính xác 99,99%.
Đây là thiết bị duy nhất ở Việt Nam hiện nay, nó không phải đọc đoạn ngắn, mà đọc đoạn dài. Đọc đoạn ngắn thì chỉ đọc 100-200 nucleotide/đoạn, sau đó phải lắp ráp thành hệ gen đầy đủ. Nhưng giải đoạn dài thì có thể đọc hàng nghìn, hàng chục nghìn nucleotide/đoạn và việc đọc đoạn dài thì khi lắp ráp để ra một hệ gen đơn giản và chính xác hơn. Độ chính xác tương đương 99,99%- tức là lỗi đọc hầu như không có, lắp ráp rất nhanh. Thời gian để giải trình tự, lắp ráp, phân tích thì mất khoảng 2 ngày là có thể xong hệ gen của một virus.
Với việc xây dựng và làm chủ kỹ thuật giải trình tự hệ gen đoạn dài của PacBio đối với virus SARS-CoV-2, cho phép các nhà khoa học Việt Nam có thể giải trình tự những đối tượng virus gây bệnh mới trong tương lai mà không cần hệ gen tham chiếu.
Dữ liệu giải trình tự hệ gen góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.
PGS.TS. Hà Quý Quỳnh- Trưởng ban Ứng dụng và triển khai công nghệ, Viện Hàn lâm Khoa học và công nghệ Việt Nam nhấn mạnh: "Việc nghiên cứu thành công quy trình công nghệ giải mã gen virus SARS-CoV-2 thì đã góp phần cùng với phác đồ điều trị để mà chúng ta có thể dập được dịch.
Cụ thể, việc giải mã trình tự gen cùng với truy vết cho phép chúng ta xác định nguồn gốc lây lan của virus – các F0, từ đó có cơ sở khoa học để chúng ta khoanh vùng, cách ly số người liên quan và có cơ sở khoa học để triển khai các phác đồ điều trị tối ưu".
Với việc làm chủ quy trình công nghệ, năng lực và điều kiện hiện có, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cũng cho biết, sẵn sàng tham gia hợp tác với các đơn vị ngành y tế trong việc giải trình tự hệ gen của virus SARS-CoV-2 với quy mô lớn trong các trường hợp cấp bách, nhằm phục vụ hiệu quả công tác phòng chống dịch Covid-19.