수행 연구과제

유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축

작성자
admbioinfo
작성일
2024-12-09
조회
70

총괄과제명 : 유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축

 


  • 1세부과제명 : 멀티오믹스 분석 알고리즘 및 플랫폼 개발
  • 2세부과제명 : 드노보 유전체 어셈블리를 위한 참조 유전체기반 하이브리드 시스템 개발

   2001년 인간 유전체 해독에 관한 첫 논문이 발표되고, 2000년대 중반 차세대 시퀀싱기술이 개발되면서, 유전체 관련 연구의 급격한 발전과 관련 산업의 대두 및 성장을 가져왔다. 생산 기술의 발달로 유전체에 그치지 않고, 전사체, 후성유전체 데이터 등의 기하급수적 증가는 이를 분석하는 소프트웨어 및 기술에 대한 수요를 증대시켰고, 생명현상 연구의 패러다임을 바꾸어 왔다. 이 근본적 변화(paradigm shift)는 단순 기술개발에 그치지 않고, 질병의 인자 발굴, 개체 간 유사성, 신약 개발, 작물 및 동물 형질개발과 개량 등으로 활용되어 인류의 생명에 대한 지식의 탐구, 삶의 질 향상 및 생명연장의 갈망을 충족시키고 있다.

하지만, 유전체 정보분석기술의 진일보는 데이터의 폭발적 증가 속도에 발맞추지 못하고 있다. 이 뿐만 아니라 세계 유수 연구 기관에서 개발한 대부분의‘분석 소프트웨어/시스템/플랫폼’들은 자체적 연구에 기반을 둔 것들이 대부분이어서, 유전체 데이터를 포함한 멀티 오믹스 데이터를 통합 및 분석하는 표준화된 기술 개발을 통해 범용성 및 효용성을 증대시킬 필요성이 대두되고 있다.

이에 본 연구진은 멀티 오믹스를 큰 주제로 하여, 여러 분석 알고리즘의 개발부터 문헌 정보의 활용과 어셈블리에 이르기까지, 유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축을 통한 글로벌 경쟁력 확보를 목표로 연구를 수행하고자 한다. 다양한 분야의 기술이 통합되고 국제 경쟁력이 확보된 유전체 분석 기술을 개발하기 위해, 각 소프트웨어들의 input과 output의 표준화를 통한 호환성 및 효용성을 극대화 한다. 또한 분석기술의 문서화 및 사용자 친화적 API를 제공하여 수요자 중심의 연구 개발을 진행한다. 이에 제 1세부 연구팀은 멀티 오믹스 분석 알고리즘 및 플랫폼 개발, 제 2세부 연구팀은 문헌 및 실험 빅데이터 통합분석 및 탐색 시스템 개발, 그리고 제 3세부 연구팀은 드노보 유전체 어셈블리를 위한 참조유전체 기반 하이브리드 시스템 개발에 초점을 맞추어, 각각의 전문성을 높임과 동시에 국내 기술의 역량을 제고하고자 한다.


<연구목표>

□ 연구목표

  유전체 시장의 급속한 팽창으로 분석도구들이 상용화되고 있는 추세이다. 본 연구는 이러한 변화에 대비하여 국내 기술에 기반 한 41개의 알고리즘과 파이프라인을 개발하여 국내 연구자와 기업에 제공하고, 국내 유전체 기반 국가 산업 경쟁력을 높이고자 다음과 같은 연구를 수행한다.

1단계 연구를 통해 유전체 정보분석, 문헌 정보분석, 드노보 어셈블리 기술 등 기초기반 기술을 확립하고 분석 표준화 방안 제시
2단계 연구로서 멀티 오믹스 분석기술을 기반으로 하는 암 및 희귀질환관련 유전체 분석기술연구와 문헌 정보분석 기술, 드노보 어셈블리 기술을 통합하여 생물/의학 분야와 연계된 유전체 정보 분석의 실용적인 활용방안을 제시
오믹스 데이터 통합분석기술, 멀티 오믹스 정보의 통합분석을 위한 기계학습 기반기술, 사용자 위주의 웹/클라우드 기반 시스템 등 빅데이터 통합분석 IT기반 기술 개발

□ 연구내용

  ■ 1단계 (1~4차년도): 유전체 분석 기반 기술, 웹/클라우드 기반 멀티 오믹스 분석을 수행할 수 있는 기반 기술을 개발하고 분석 표준화 방안 제시

(1세부): 개별 유전체, 후성유전체 인자를 효율적으로 분석하는 알고리즘/파이프라인 개발에 중점을 둠. 유전자발현을 네트워크로 분석하는 기법, 전사체의 발현 어셈블리 관련 기술, non-coding RNA 분석 기법, 변이체는 베이지안 기법을 이용한 변이 추정 기법, 다중 샘플 후성유전체 분석 기법, 유전체 암호화 및 압축 기법, 메타유전체는 메타유전체 내 co-occurrence 네트워크 구성 및 해석 기법, 메타전사체 분석 기법 등 개발, 객체 관계정보를 자동 추출하여 지식데이터 베이스 구축, 여러 데이터베이스를 통합 해석하는 기법 개발
(2세부): 유전체 어셈블리의 고속화에 필요한 참조유전체 기반 근접도 계산, 컨티그/스캐폴드 생성 알고리즘 개발

■ 2단계 (5~8차년도): 2단계 연구는 1단계의 개발을 계속하여 새로운 알고리즘/파이프라인들을 산업체와 협력을 통해 아래의 분야별로 개발하고, 클라우드/웹 기반 사용자 친화적 개방형 분석 플랫폼 구축. 개발된 도구의 신뢰도와 인지도 제고를 위해 생물/의학자들과 개발한 도구들을 이용한 심도 있는 연구를 수행하여 최상위 학술지에 연구 결과 발표

(1세부): 1단계 개발한 도구들을 발전시켜 멀티 오믹스 통합 분석을 가능하게 만드는 도구들을 개발, 바이오 메디컬 객체-관계 네트워크 분석, 약물조합 탐색 알고리즘들을 개발하여 연구자가 새로운 가설을 제안할 수 있는 도구 개발
(2세부): 1단계에서 개발한 도구들을 이용하여 참조유전체에 대한 다중 정렬 매퍼, 슈퍼 스캐폴드 생성 알고리즘, 참조유전체 어셈블리 도구들을 개발하여 완성된 초고성능 어셈블리 도구 개발

□ 기대효과

사회적 측면 : 암 및 희귀질환 관련 맞춤 의학 실현 가능성 제고 및 먹거리 안전성 제고를 통한 새로운 의료·보건 복지의 패러다임 제시

수요자 중심의 유전체 기반 서비스 제공을 통해 빅데이터 기반 미래형 맞춤의학의 실현 가능성 제고
형질전환작물의 안전성 검사 능력을 향상시켜 국민의 먹거리 안정성을 제고
학술적 측면 : 국내 연구자 중심의 미래 연구 환경 조성

국내 연구자들의 분석 수요가 많은 대규모의 유전체 데이터의 효율적 저장 및 효과적 검색 도구 개발, 개방형 시스템 기반 기술을 개발하여 공동 연구기반 구축
산업적 측면 : 맞춤형 의학·먹거리 산업 패러다임 제시

해외 분석도구를 대체할 국내 도구의 개발로 국내 유수의 BIT 기업의 생물정보분석 관련 비용의 획기적 절감
생물정보분석도구 개발을 통해 작물형질 개발 산업화 시장 마련
BT와 IT가 융합된 연구개발 참여를 통해 국제적으로 경쟁력 있는 연구 인력을 양성하여 산업계에 우수 인력을 제공

● 국문표기 

이 논문은 0000년도 정부(과학기술정보통신부)의 재원으로 한국연구재단 포스트게놈다부처유전체사업의 지원을 받아 수행된 연구임(No. NRF-2014M3C9A3063541). 

● 영문표기   

This research was supported by the Collaborative Genome Program for Fostering New Post-Genome Industry of the National Research Foundation (NRF) funded by the Ministry of Science and ICT (MSIT) (No.NRF-2014M3C9A3063541).



<참여연구원>


분 야 직 위
(직명)
성 명 소속부서 전공 및 학위
학위 년도 전공 학교
Bioinformatics 총괄(1세부)책임자 김선 서울대학교 박사 1997 컴퓨터학 Univ. of Iowa
  2세부연구책임자 김재범 건국대학교 박사   컴퓨터학