DGIST 연구팀이 빅데이터 기술을 적용한 올리고뉴클레오티드 설계 기술을 개발했다. 23일 DGIST에 따르면 이 대학 정보통신융합공학전공 김민수(좌) 교수와 뇌·인지과학전공의 구재형(우) 교수 융합연구팀이 구글 검색 방식의 빅데이터 기술을 적용해 정밀하고 빠른 성능을 나타내는 올리고뉴클레오티드 설계 기술(MRPrimerW)을 개발했다. MRPrimerW 기술은 사람이나 동식물의 전체 유전자 데이터베이스에 존재하는 모든 후보 올리고뉴클레오티드들에 맵리듀스 기반 복잡 알고리즘을 적용해 특이성을 갖는 올리고뉴클레오티드들만을 선별 및 1차 결과로 저장한다. 선별한 올리고뉴클레오티드들을 다시 색인 구조로 변환해 2차 결과를 서버에 저장함으로써 검색엔진 구글에서 원하는 정보를 검색하는 것처럼 사용자가 입력한 설계 조건과 목표 유전자에 부합하는 최적의 올리고뉴클레오티드를 정확하고 초고속으로 설계하는 기술이다. 특이성을 완벽하게 만족하는 올리고뉴클레오티드를 찾기 위해서는 이론적으로 하나의 목표 유전자에 대해 약 30억번, 유전체 데이터베이스의 모든 유전자들에 대해서는 약 900경 번의 비교연산이 필요하기 때문에 특이성을 완벽하게 만족하는 올리고뉴클레오티드를 설계하는 일은 난해한 문제로 알려져 있다. 연구팀은 지난해 맵리듀스 기반의 복잡 알고리즘을 통해 종(種) 전체 유전자 데이터베이스에 존재하는 특이성을 만족하는 모든 올리고뉴클레오티드들을 효율적으로 찾아내는 MRPrimer 기술을 세계 최초로 개발했다. MRPrimer는 사용자가 설계 조건을 변경할 때마다 수십 시간이 걸리는 대규모 분산 컴퓨팅을 수행해야 하는 단점이 있었다. 하지만, 연구팀이 이번에 개발한 MRPrimerW 기술은 임의의 설계 조건에서도 수분 이내에 최적의 올리고 뉴클레오티드를 설계할 수 있도록 특이성 알고리즘 연산 결과를 색인 구조화하는 방법을 적용해 이전 기술의 단점을 해결했다. 또 MRPrimerW 기술은 웹 기반 인터페이스를 바탕으로 사용자가 목표 유전자 수백 개를 입력하더라도 동일한 설계 조건을 만족하는 최적의 프라이머와 프로브 세트를 설계해 검색 결과로 보여주고, 검색 결과가 구해지지 않은 목표 유전자들은 어떻게 설계 조건을 변경해야 검색 결과가 도출되는지 알려준다. 이 기술을 적용하면 유전자 기반의 암 진단, 유전자 변형 농산물(GMO) 탐지, 신종 바이러스 탐지 등 유전자 진단에 광범위하게 사용되는 올리고뉴클레오티드를 정밀하게 설계할 수 있으며 올리고뉴클레오티드 기반의 바이오 신약 개발에도 사용할 수 있을 것으로 전망된다. 전 세계 올리고뉴클레오티드 합성시장의 규모가 매년 10%씩 성장하고 있으며, 2020년에는 약 1조원 규모로 성장할 것으로 전망돼 MRPrimerW 기술은 경제적, 산업적 부가가치를 창출할 것으로 기대를 모으고 있다. 김민수 교수는 "MRPrimerW 기술은 빅데이터 분석 기술을 유전자 데이터에 가장 효과적으로 적용한 사례 가운데 하나로 평가받고 있다"며 "앞으로 전 세계 생명정보 소프트웨어 시장에서 우리나라가 해당 기술 분야를 선도하기 위해 지속적으로 노력하겠다"고 밝혔다. 이번 연구 성과는 생물과학 분야 세계적 권위의 국제학술지 '뉴클레익 액시드 리서치' 온라인판 6일자에 게재됐으며 정보통신융합공학전공 김혜린 박사과정 학생과 뇌인지과학전공 강나나 박사가 제1공동저자로 참여했다.  연구팀은 관련 기술을 웹사이트(http://MRPrimerW.com)를 통해 무료로 전 세계에 공개했다.  류상현 기자
주메뉴 바로가기 본문 바로가기