고객센터

  • 공지사항
  • 보도자료
  • 문의게시판
HOME > SERVICE > 보도자료
제목 유전체 DB 분석으로 바이러스 10만개 새로 발견 등록일 2022.02.02 13:58
글쓴이 에디스젠 조회 442
단 한 종의 바이러스가 수 백만명의 목숨을 앗아가고 세계경제를 마비시켰다. 비슷한 일을 저지를지 모를 바이러스가 도대체 얼마나 될까? 먼저 지구상에 존재하는 바이러스의 정체부터 파악해야 한다. 하지만 인류가 모르는 바이러스의 숫자가 수조 단위는 될 것으로 과학자들은 추정한다.

이를 해결하기 위해 컴퓨터 프로그램으로 지금까지 인류가 확보한 생물체의 게놈 데이터베이스를 분석한 결과 10만 개 이상 새로운 바이러스의 신원이 밝혀졌다. 26일(현지시간) 《네이처》에 게재된 논문을 토대로 과학전문지 《사이언스》가 보도한 내용이다.

이번 연구를 주도한 캐나다의 컴퓨터생물학자 아르템 바바이안 박사는 코로나19 팬데믹이 시작된 2020년 초 얼마나 많은 코로나바이러스가 기존 유전체 데이터에서 발견될 수 있는지 궁금했다. 그래서 슈퍼컴퓨터 전문가인 제프 테일러와 함께 인류가 발견한 생명체의 유전자 정보를 모아둔 세계 유전자 서열 데이터베이스를 검색해보기로 했다.

현재 이 데이터베이스에는 지구상의 다양한 생명체의 유전자정보가 16페타바이트(1페타바이트=1024테라바이트)나 수집돼 있다. 여기에는 다른 유기체를 감염시키는 바이러스의 유전자 염기서열도 포함돼 있기는 하지만 별도로 분류돼 있지 않았다.

지금은 영국 케임브리지 소속 연구원이 된 바바이안 박사는 테일러와 함께 이 방대한 데이터베이스 분석을 위해 클라우드 기반 데이터를 검색하는 데 특화된 컴퓨터 프로그램을 개발했다. 여러 생물정보학자들의 도움을 받아가며 이 소프트웨어를 보완했다. 그리고 코로나바이러스뿐 아니라 전체 바이러스 사냥에 나섰다. 이를 위해 모든 RNA 바이러스의 복제의 핵심인 RNA 의존성 RNA 중합효소와 관련된 핵심 유전정보와 일치하는 유전체 탐색을 수행했다. 여기에는 코로나바이러스뿐 아니라 독감, 소아마비, 홍역, 간염을 일으키는 바이러스도 포함된다.

바바이안 연구진이 개발한 프로그램을 통한 검색은 데이터 세트당 1센트 미만의 컴퓨팅 비용으로 하루 100만 개의 데이터 세트를 처리할 수 있을 만큼 빨랐다. 그 결과 모두 9종의 코로나바이러스와 D형간염바이러스 관련 300종의 바이러스를 포함한 13만2000개의 바이러스를 발견했다. 이번 연구는 종전엔 헤아릴 수 없었던 어마어마한 DNA와 RNA를 분석할 수 있는 ‘페타바이트 유전체학(Petabyte Genomics)’의 출범을 알리는 것이기도 했다.

논문을 검토한 미국 캘리포니아대 데이비스 캠퍼스(UC 데이비스)의 C 타이터스 브라운 교수(생물정보학)은 “놀라운 엔지니어링 업적”이라고 찬사를 보냈다. 미국국립정보센터(NCBI)의 생물정보학자인 J 로드니 브리스터 박사는 “다른 연구에 초석을 놓는 대단한 연구”라고 평가했다. 미국의 비영리 환경보건연구기관인 ‘에코헬스 얼라이언스’의 피터 다스작 대표는 “바이러스에 대해 우리가 얼마나 지식이 부족한지를 보여주는 결과물”이라고 말했다.

연구진이 이번 발견을 토대로 구축한 데이터베이스는 바이러스의 완전한 유전자 서열이 담기지 않았다. 대부분 RNA 중합효소에 대한 유전정보만이 담겼을 뿐이다. 하지만 이는 바이러스들이 서로 어떻게 연결되고 분기했는지를 보여주는 가계도 작성에 도움을 줄 수 있다. 또한 특정 바이러스가 발견된 위치 및 해당 호스트의 위치를 확인할 수 있게 해준다.

(출처 :브릭)