일러스트=챗GPT 달리3

생명체의 유전정보를 담은 디옥시리보핵산(DNA)이 새로운 데이터 저장 매체로 개발됐다. 이전에도 고용량 데이터를 저장할 수 있다고 알려졌지만 합성 비용 문제로 상용화가 더뎠다. 미국 연구진은 데이터 저장 비용을 획기적으로 줄인 새로운 방식을 도입해 이 같은 문제를 해결했다.

하오 얀 미국 애리조나 주립대 교수 연구진은 24일 국제 학술지 ‘네이처’에 “2진법 DNA 저장장치로 약 25만비트 크기의 판다 사진을 정확하게 저장하고 출력하는 데 성공했다”고 밝혔다.

DNA는 염기 4가지가 배열된 순서로 유전정보를 보관한다. DNA는 컴퓨터로 따지면 염기 4가지를 이용한 4진법 하드디스크이다. 4진법의 DNA를 이용하면 0과 1의 2진법을 쓰는 컴퓨터보다 더 많은 양의 데이터를 저장할 수 있다.

하버드대 비스연구소에 따르면 DNA 1g에 저장할 수 있는 데이터 용량은 215PB(페타바이트·1PB는 1000조 바이트)에 달한다. 영화 ‘어벤져스: 엔드게임’ 파일을 약 3600만 편 저장할 수 있다. 최근 100만년도 더 된 매머드에서 DNA를 추출해 해독했을 만큼, DNA는 장기간 안정적으로 구조를 유지한다.

하지만 한계도 있다. 얀 교수는 “DNA는 우수한 데이터 저장 능력과 내구성으로 미래가 유망한 데이터 저장 물질”이라며 “다만 현재 연구 중인 DNA 데이터 저장장치는 비용이 많이 들고 오류 발생 확률이 높아 새로운 기술 연구가 필요하다”고 말했다.

하드디스크는 미량의 전류를 흘려 데이터를 기록하지만, DNA에 데이터를 저장하려면 염기를 조합해 합성해야 한다. 그만큼 비용이 든다. DNA 합성 과정에서 염기가 잘못 들어가는 오류가 생길 수도 있다. 연구진은 후성유전학을 이용해 원래 4진법 원리의 DNA를 2진법 DNA 저장장치로 바꿔 이 같은 단점을 해결했다.

후성유전학은 DNA 염기서열은 그대로 두고 구조를 바꿔 유전자의 발현을 조절하는 현상을 말한다. 메틸이라는 화학물질이 DNA에 붙으면 유전자 발현을 억제하고, 떨어지면서 발현을 증가시킨다. 연구진은 DNA에 메틸이 붙으면 1, 붙지 않으면 0으로 구분하는 2진법 체계를 이용해 데이터를 저장했다.

메틸로 기록한 정보는 DNA 분석 장치인 ‘나노 포어’로 읽어 다시 출력할 수 있다. 이번에 개발한 DNA 데이터 저장장치는 메틸화가 가능한 염기 350개를 연결해 350비트 용량의 DNA를 700개 연결했다. 총 27만5000비트의 데이터 저장이 가능한 규모다. 즉 자연 DNA 조각에 메틸을 붙여 안정적인 데이터 저장 장치를 만든 것이다.

미국 애리조나주립대 연구진이 DNA 저장장치의 성능을 확인하기 위해 사용한 판다 이미지. 원본 이미지(왼쪽)를 DNA 저장장치에 저장한 후 다시 불러왔다. 출력 이미지(오른쪽)는 원본과 큰 차이가 없다./네이처

실제로 데이터를 저장하고 출력할 수 있는지 확인하기 위해 중국풍 문양과 판다 이미지를 저장한 후 다시 출력해 확인했다. 중국풍 문양은 1만6833비트, 판다는 25만2504비트 용량을 갖고 있다. 컴퓨터가 데이터를 처리하는 단위인 바이트는 1개가 8비트이다. 이번에 저장한 데이터를 바이트로 환산하면 각각 2.1KB(킬로바이트), 31.56KB 크기다. 초기 출력 정확도는 97.47%로 다소 불완전했으나, 오류 정정 알고리즘을 적용해 저장한 그대로의 이미지를 불러오는 데 성공했다.

연구진은 DNA 염기를 이용해 4진법 저장 체계를 만들지 않더라도 대량의 데이터를 저장할 수 있다고 주장했다. 얀 교수는 “DNA는 그 자체로도 데이터 저장 밀도가 매우 높고, 수백 만 년 동안 유지될 정도로 구조도 안정적”이라며 “데이터 저장 용량 한계를 극복하는 데 도움될 것으로 보인다”고 말했다.

참고 자료

Nature(2024), DOI: https://doi.org/10.1038/s41586-024-08040-5