수행 연구과제
유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축
총괄과제명 : 유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축
1세부과제명 : 멀티오믹스 분석 알고리즘 및 플랫폼 개발
2세부과제명 : 문헌 및 실험 빅데이터 통합분석 및 탐색 시스템 개발
3세부과제명 : 드노보 유전체 어셈블리를 위한 참조 유전체기반 하이브리드 시스템 개발
2001년 인간 유전체 해독에 관한 첫 논문이 발표되고, 2000년대 중반 차세대 시퀀싱기술이 개발되면서, 유전체 관련 연구의 급격한 발전과 관련 산업의 대두 및 성장을 가져왔다. 생산 기술의 발달로 유전체에 그치지 않고, 전사체, 후성유전체 데이터 등의 기하급수적 증가는 이를 분석하는 소프트웨어 및 기술에 대한 수요를 증대시켰고, 생명현상 연구의 패러다임을 바꾸어 왔다. 이 근본적 변화(paradigm shift)는 단순 기술개발에 그치지 않고, 질병의 인자 발굴, 개체 간 유사성, 신약 개발, 작물 및 동물 형질개발과 개량 등으로 활용되어 인류의 생명에 대한 지식의 탐구, 삶의 질 향상 및 생명연장의 갈망을 충족시키고 있다.
하지만, 유전체 정보분석기술의 진일보는 데이터의 폭발적 증가 속도에 발맞추지 못하고 있다. 이 뿐만 아니라 세계 유수 연구 기관에서 개발한 대부분의‘분석 소프트웨어/시스템/플랫폼’들은 자체적 연구에 기반을 둔 것들이 대부분이어서, 유전체 데이터를 포함한 멀티 오믹스 데이터를 통합 및 분석하는 표준화된 기술 개발을 통해 범용성 및 효용성을 증대시킬 필요성이 대두되고 있다.
이에 본 연구진은 멀티 오믹스를 큰 주제로 하여, 여러 분석 알고리즘의 개발부터 문헌 정보의 활용과 어셈블리에 이르기까지, 유전체 정보 복합분석을 위한 초고성능 핵심기술 개발 및 개방형 플랫폼 구축을 통한 글로벌 경쟁력 확보를 목표로 연구를 수행하고자 한다. 다양한 분야의 기술이 통합되고 국제 경쟁력이 확보된 유전체 분석 기술을 개발하기 위해, 각 소프트웨어들의 input과 output의 표준화를 통한 호환성 및 효용성을 극대화 한다. 또한 분석기술의 문서화 및 사용자 친화적 API를 제공하여 수요자 중심의 연구 개발을 진행한다. 이에 제 1세부 연구팀은 멀티 오믹스 분석 알고리즘 및 플랫폼 개발, 제 2세부 연구팀은 문헌 및 실험 빅데이터 통합분석 및 탐색 시스템 개발, 그리고 제 3세부 연구팀은 드노보 유전체 어셈블리를 위한 참조유전체 기반 하이브리드 시스템 개발에 초점을 맞추어, 각각의 전문성을 높임과 동시에 국내 기술의 역량을 제고하고자 한다.
□ 연구목표
유전체 시장의 급속한 팽창으로 분석도구들이 상용화되고 있는 추세이다. 본 연구는 이러한 변화에 대비하여 국내 기술에 기반 한 41개의 알고리즘과 파이프라인을 개발하여 국내 연구자와 기업에 제공하고, 국내 유전체 기반 국가 산업 경쟁력을 높이고자 다음과 같은 연구를 수행한다.
-
1단계 연구를 통해 유전체 정보분석, 문헌 정보분석, 드노보 어셈블리 기술 등 기초기반 기술을 확립하고 분석 표준화 방안 제시
-
2단계 연구로서 멀티 오믹스 분석기술을 기반으로 하는 암 및 희귀질환관련 유전체 분석기술연구와 문헌 정보분석 기술, 드노보 어셈블리 기술을 통합하여 생물/의학 분야와 연계된 유전체 정보 분석의 실용적인 활용방안을 제시
-
오믹스 데이터 통합분석기술, 멀티 오믹스 정보의 통합분석을 위한 기계학습 기반기술, 사용자 위주의 웹/클라우드 기반 시스템 등 빅데이터 통합분석 IT기반 기술 개발
□ 연구내용
■ 1단계 (1~4차년도): 유전체 분석 기반 기술, 웹/클라우드 기반 멀티 오믹스 분석을 수행할 수 있는 기반 기술을 개발하고 분석 표준화 방안 제시
-
(1세부): 개별 유전체, 후성유전체 인자를 효율적으로 분석하는 알고리즘/파이프라인 개발에 중점을 둠. 유전자발현을 네트워크로 분석하는 기법, 전사체의 발현 어셈블리 관련 기술, non-coding RNA 분석 기법, 변이체는 베이지안 기법을 이용한 변이 추정 기법, 다중 샘플 후성유전체 분석 기법, 유전체 암호화 및 압축 기법, 메타유전체는 메타유전체 내 co-occurrence 네트워크 구성 및 해석 기법, 메타전사체 분석 기법 등 개발
-
(2세부): 객체 관계정보를 자동 추출하여 지식데이터 베이스 구축, 여러 데이터베이스를 통합 해석하는 기법 개발
-
(3세부): 유전체 어셈블리의 고속화에 필요한 참조유전체 기반 근접도 계산, 컨티그/스캐폴드 생성 알고리즘 개발
■ 2단계 (5~8차년도): 2단계 연구는 1단계의 개발을 계속하여 새로운 알고리즘/파이프라인들을 산업체와 협력을 통해 아래의 분야별로 개발하고, 클라우드/웹 기반 사용자 친화적 개방형 분석 플랫폼 구축. 개발된 도구의 신뢰도와 인지도 제고를 위해 생물/의학자들과 개발한 도구들을 이용한 심도 있는 연구를 수행하여 최상위 학술지에 연구 결과 발표
-
(1세부): 1단계 개발한 도구들을 발전시켜 멀티 오믹스 통합 분석을 가능하게 만드는 도구들을 개발
-
(2세부): 바이오 메디컬 객체-관계 네트워크 분석, 약물조합 탐색 알고리즘들을 개발하여 연구자가 새로운 가설을 제안할 수 있는 도구 개발
-
(3세부): 1단계에서 개발한 도구들을 이용하여 참조유전체에 대한 다중 정렬 매퍼, 슈퍼 스캐폴드 생성 알고리즘, 참조유전체 어셈블리 도구들을 개발하여 완성된 초고성능 어셈블리 도구 개발
□ 기대효과
사회적 측면 : 암 및 희귀질환 관련 맞춤 의학 실현 가능성 제고 및 먹거리 안전성 제고를 통한 새로운 의료·보건 복지의 패러다임 제시
-
수요자 중심의 유전체 기반 서비스 제공을 통해 빅데이터 기반 미래형 맞춤의학의 실현 가능성 제고
-
형질전환작물의 안전성 검사 능력을 향상시켜 국민의 먹거리 안정성을 제고
학술적 측면 : 국내 연구자 중심의 미래 연구 환경 조성
-
국내 연구자들의 분석 수요가 많은 대규모의 유전체 데이터의 효율적 저장 및 효과적 검색 도구 개발, 개방형 시스템 기반 기술을 개발하여 공동 연구기반 구축
산업적 측면 : 맞춤형 의학·먹거리 산업 패러다임 제시
-
해외 분석도구를 대체할 국내 도구의 개발로 국내 유수의 BIT 기업의 생물정보분석 관련 비용의 획기적 절감
-
생물정보분석도구 개발을 통해 작물형질 개발 산업화 시장 마련
-
BT와 IT가 융합된 연구개발 참여를 통해 국제적으로 경쟁력 있는 연구 인력을 양성하여 산업계에 우수 인력을 제공
<국문>
이 논문은 0000년도 미래창조과학부의 재원으로 한국연구재단 바이오의료기술개발사업의 지원을 받아 수행된 연구임(과제번호: NRF-2014M3C9A3063541 )
This research was supported by the Bio & Medical Technology Development Program of the NRF funded by the Korean government, MSIP(과제번호 : NRF-2014M3C9A3063541)
<참여연구원>
분 야 | 직 위 (직명) |
성 명 | 소속부서 | 전공 및 학위 | |||
학위 | 년도 | 전공 | 학교 | ||||
Bioinformatics | 부교수/연구소장 | 김 선 | 서울대 컴퓨터공학부/생물정보연구소 | 박사 | 1997 | Computer Science | University of Iowa |
Bioinformatics | 연구원 | 채희준 | 서울대 컴퓨터연구소 | 석사 | 2007 | Computer Science | Indiana University |
Bioinformatics | 연구원 | 정인욱 | 서울대 생물정보연구소 | 석사 | 2007 | Computer Science | 연세대학교 |
Bioinformatics | 연구원 | 장현숙 | 서울대 생물정보연구소 | 학사 | 2006 | 생명정보공학 | 상명대학교 |
- 다음 생물정보 데이터 베이스 활용을 위한 인프라 구축 및 서비스
- 이전 이전글이 없습니다.