Tin khoa học

Microsoft đã có thể lưu trữ được một tỉ tỉ byte dữ liệu trong một milimet khối DNA

18/08/2017 13:50:04

Gã khổng lồ công nghệ Microsoft nghĩ rằng sinh học có thể giải quyết vấn đề đang lớn dần về lưu trữ dữ liệu.

Dựa trên những nghiên cứu mới đây liên quan đến lưu trữ phim ảnh và tài liệu trong ADN, Microsoft đang phát triển một thiết bị có thể sử dụng sinh học nhằm thay thế cho bộ lưu trữ băng từ.

Các đời băng từ, dù có khác nhau về hình dáng và chức năng, nhưng đều có chung một nguyên lý cốt lõi.
Các đời băng từ, dù có khác nhau về hình dáng và chức năng, nhưng đều có chung một nguyên lý cốt lõi.

Các kiến trúc sư máy tính của Microsoft Research nói rằng công ty đang quy chuẩn hóa mục tiêu xây dựng hệ thống lưu trữ điều hành, dựa trên nguyên tắc cốt lõi là cấu trúc ADN làm việc ngay bên trong trung tâm dữ liệu. Dự án dự kiến sẽ là một trong những hướng đi chủ đạo của Microsoft cho đến cuối thập kỉ này.

"Trong ba năm chúng tôi sẽ hướng đến một hệ thống (nguyên bản là để thương mại hóa - PV) giúp lưu trữ một lượng dữ liệu trong ADN trên một trong số những trung tâm dữ liệu của chúng tôi, ít nhất là ứng dụng trong các ngách hẹp và chuyên biệt của thị trường đã", Doug Carmean, kĩ sư của Microsoft Research cho biết. Ông còn giúp những người quan tâm hình dung thêm về thiết bị này, miêu tả nó phải có kích cỡ ngang ngửa với máy photocopy của Xerox những năm... 70.

Là to từng này đây...
Là to từng này đây...

Đằng sau những tuyên bố trên, Microsoft thậm chí còn ấp ủ một hoài bão còn lớn khi muốn thay thế các thiết bị lưu trữ băng từ, công nghệ dữ liệu rất thông dụng trong thời đại chúng ta. "Chúng tôi hy vọng có thể gắn cho nó một thương hiệu kiểu như "Lưu trữ với ADN"", Carmean cho biết thêm.

Kế hoạch này báo hiệu mức độ mãnh liệt mà các công ty công nghệ muốn theo đuổi ý tưởng cực kì ngược đời nếu nhìn bề ngoài - lưu trữ video, hình ảnh, và các tài liệu quý vào cùng một phân tử mà hệ gene của chúng ta được tạo nên từ đó. Lý do theo Victor Zhirnov, nhà khoa học đứng đầu Hiệp hội Nghiên cứu Bán dẫn (SRC) có trụ sở ở North Carolina, Hoa Kỳ - là bởi nỗ lực thu nhỏ thể tích bộ nhớ máy tính đã hầu như đạt tới giới hạn vật lý của nó, tuy nhiên ADN có thể lưu trữ dữ liệu với một mật độ đậm đặc phi thường.

Nếu được format bằng DNA, thì tất cả các bộ phim từng được làm sẽ chứa vừa vặn trong một thể tích nhỏ hơn một viên đường.

Với công nghệ DNA, từng này thể tích là đủ chứa... ba lần lịch sử hơn một trăm năm của ngành điện ảnh rồi.
Với công nghệ DNA, từng này thể tích là đủ chứa... ba lần lịch sử hơn một trăm năm của ngành điện ảnh rồi.

"ADN là môi trường lưu trữ đậm đặc nhất vũ trụ, nếu chúng ta đơn giản chỉ nhìn vào các quy tắc vật lý. Đây là lý do tại sao người ta đang dành sự chú tâm lớn cho nó",Zhirnov nói. "Và vấn đề mà chúng ta đang giải quyết là tôc độ phát triển theo cấp lũy thừa của thông tin".

Vào tháng Bảy, Microsoft tuyên bố công khai về việc lưu trữ 200 megabytes dữ liệu trong các chuỗi ADN, bao gồm một video nhạc, và một bản thu âm. Dự án này được mô tả trong một bài luận văn xuất bản vào tháng Ba cho Biorxiv, được phụ trách bởi Carmean và Karin Strauss, đều là các thành viên của Microsoft Research, cùng với Luis Cezze, nhà khoa học máy tính đến từ viện nghiên cứu trực thuộc đại học Washington.

Carmean (áo xanh) và Strauss đang tiến hành các thí nghiệm về ADN.
Carmean (áo xanh) và Strauss đang tiến hành các thí nghiệm về ADN.

Những chướng ngại lớn tuy nhiên vẫn còn đó. Chuyển đổi các bit số sang mã ADN (được tạo nên chuỗi các nucleotit mang nhãn A,G,C và T) vẫn còn rất đắt và rất mất công, bởi quy trình hóa học cần dùng để sản xuất ra các chuỗi ADN. Trong dự án trình diện này của mình, Microsoft đã sử dụng 13.448.372 mảnh ADN độc nhất. Các chuyên gia cho rằng mua từng đó nguyên liệu phải mất ít nhất 800,000 USD theo giá thị trường.

"Vấn đề chính đối với lưu trữ ADN đó là giá cả", Yaniv Erlich, giáo sư ở đại học Columbia, người vào đầu năm nay đã công bố kế hoạch viết một cuốn tiểu thuyết về đề tài này, cho biết. "Vậy nên câu hỏi trọng tâm được đặt ra ở đây là liệu Microsoft có giải quyết được vấn đề này?". Dựa trên nhng gì họ đã công bố, Erlich nói, "Tôi chưa nhìn thấy bất cứ tiến bộ nào đối với mục tiêu này, nhưng biết đâu đó họ lại có những bí mật của riêng mình".

Theo Microsoft, giá của việc lưu trữ dữ liệu ADN cần xuống dưới mức 10.000 trước khi có thể áp dụng rộng rãi. Trong khi rất nhiều chuyên gia cho rằng điều đó là không thể, Microsoft tin rằng những tiến bộ như vậy có thể xảy ra nếu ngành công nghiệp máy tính và thị trường có nhu cầu đủ lớn.

Việc tự động hóa quá trình viết dữ liệu số cho ADN là một bước quan trọng. Dựa theo những thí nghiệm kéo dài hàng tuần của mình, Carmean ước tính rằng tỉ lệ biến đổi dữ liệu thành ADN hiện nay chỉ là 400 byte mỗi giây. Microsoft cho rằng chúng ta phải nâng con số đó lên 100.000, tức là 100 megabyte.

Đọc dữ liệu thì dễ hơn rất nhiều. Điều này có thể thực hiện được nhờ các máy sắp chuỗi tốc độ cao, bao gồm việc nhắc lại một phần cụ thể của tệp tin, tương tự như quá trình truy cập-ngẫu nhiên bộ nhớ máy tính. Thậm chí còn có thể diễn ra một sự cải thiện gấp đôi khả năng đọc ADN, điều này được Microsoft hy vọng khiến cho quy trình này đủ hữu dụng để thương mại hóa.

Bởi quá trình thao tác bao gồm viết và đọc dữ liệu với ADN là rất chậm, nên tất cả những ý định áp dụng sớm công nghệ này đều sẽ phải giới hạn trong những trường hợp cụ thể. Điều đó có thể bao gồm dữ liệu cần được thu thập cho các mục đích pháp luật và tố tụng, như các video từ carema kín của cảnh sát, hay các hồ sơ y tế.

Microsoft gần đây đang làm việc với Twist Bioscience, một nhà sản xuất ADN có trụ sở tại San Francisco. Twist là một trong những công ty mới thành lập đang cố gắng cải thiện quy trình sản xuất ADN, một danh sách bao gồm hàng loạt những cái tên khác như DNAScript, Evonetix, Catalog DNA, Helixworks..., đủ để cho thấy sự"rôm rả" của ngành công nghiệp mới nổi đang ăn nên làm ra này.

Một trong những khả năng đầy kích thích mà đang được theo đuổi bởi rất nhiều start-up đó là thay thế quy trình hóa học... 40 năm tuổi tổng hợp ADN thông qua enzyme, mô phỏng cơ thể của chính chúng ta vậy. Jean Bolot, giám đốc khoa học thuộc viện nghiên cứu Technicolor ở Los Altos nói rằng Đại học Harvard đang đổ tiền vào dự án này, trong phòng thí nghiệm ở nhà thờ George, một nơi chuyên nghiên cứu về hệ Gene.

Quá trình tổng hợp DNA.
Quá trình tổng hợp DNA.

"Tôi rất tự tin rằng chúng ta sẽ có kết quả để mà bàn thảo về ngay trong năm nay",Bolot nói, đồng thời thêm rằng công ty của anh đang thảo luận với các studio phim về việc họ có thể sử dụng lưu trữ ADN. Họ nói rằng một nửa số phim làm trước năm 1951 đã bị thất lạc bởi công nghệ lưu trữ bằng celluloid. Không những thế giờ đây những format mới như video độ phân giải cao hay thực tế áo quả thực đặt một gánh nặng lớn lên các studio trong việc bảo quản thành quả lao động của mình.

Zhirnov nói rằng các nhà sản xuất chip máy tính đang rất chú tâm vào ADN bởi họ, hơn ai hết, hiểu rõ những giới hạn vật lý của những phương tiện truyền thống như băng từ ổ cứng. Tổ chức của Zhirnov, vốn được tài trợ bởi Microsoft, Intel và các nơi khác để tiến hành các nghiên cứu ứng dụng, bắt đầu cho thấy những góc nhìn sâu sắc hơn về lưu trữ ADN kể từ năm 2013. Ông nói rằng các chuyên gia bán dẫn vốn tin rằng các ADN quá "mềm" sẽ ngạc nhiên khi biết rằng nó bền hơn từ hàng trăm đến cả ngàn lần so với các thiết bị silicon. nên nhớ các phân tử ADN phải cực kì ổn định thì mới có thể phục hồi dễ dàng trong xương hóa thạch của động vật và cả chính người cổ đại như vậy.

Xương voi ma mút
ADN trong xương voi ma mút được khôi phục dễ dàng giúp các nhà khoa học biết chính xác hầu như mọi thứ về loài động vật đã tuyệt chủng này.

Tuy nhiên đặc tính quan trọng nhất của ADN chính là mật độ. ADN có thể lưu giữ 1.000.000.000.000.000.000 (hay 1 tỉ tỉ) byte dữ liệu trong 1 milimet khối. "Mật độ là khởi nguồn của tất cả", Zhirnov nói.

Phát ngôn viên của Microsoft Research nói rằng công ty này chưa thể khẳng định "kế hoạch sản phẩm chi tiết" vào lúc này. Trong nội bộ công ty, ý tưởng về lưu trữ ADN có vẻ như đang dần chiếm lấy tâm trí của mọi người, nhưng không có nghĩa là đã được chấp nhận phổ biến.

Thêm vào việc có mật độ và độ bền cao, ADN còn có thêm một lợi thế mà có vẻ ít ai nhắc đến, nó cực kì thân thuộc với loài người. Hãy nghĩ đến những cái đĩa mềm cổ lỗ sĩ mà bạn chẳng thể đọc được gì trên đó nữa, hoặc xa hơn đi, những phiến đất sét của người Babylon cổ với... chữ tượng hình trên đó. Không giống như mọi phương tiện khác, ADN có lẽ sẽ không bao giờ lỗi mốt.

"Chúng ta sẽ luôn phải đọc ADN, chừng nào chúng ta còn là con người", Carmean nói.

ADN có thể lưu giữ 1.000.000.000.000.000.000 (hay 1 tỉ tỉ) byte dữ liệu trong 1 milimet khối.
ADN có thể lưu giữ 1.000.000.000.000.000.000 (hay 1 tỉ tỉ) byte dữ liệu trong 1 milimet khối.

Article Other