수행 연구과제

자연과학(바이오) 빅 데이터 마이닝 소프트웨어 원천 기술 개발

작성자
admbioinfo
작성일
2024-12-09
조회
63

자연과학(바이오빅 데이터 마이닝 소프트웨어 원천 기술 개발

 

본 과제의 최종 목표는 다중 소스로부터 수집된 생명정보학 빅데이터 분석도구 및 지식베이스를 포함하는 생명정보학의학 연구 지원 시스템을 구축하는 데 있으며이러한 최종 목표를 달성하기위해 다음과 같은 세부 목표를 포함한다.


  • 초대용량 유전체후성유전체 차세대 시퀀스 정보 결합 분석 기술 개발
  • 페타바이트 급의 초대용량 학술 논문 말뭉치에서의 콘텍스트-객체-관계 정보 추출 기술 개발
  • 이원화 접근 방법을 통해 파악한 대용량 생명정보 네트워크의 점진적 통합 기술 개발
  • 통합 생명정보 네트워크에 근거한 사용자 선택적 데이터 추출 및 활용 기술 개발
  • 생명정보학 실험데이터를 포함하는 고활용성 연구지원 시스템 구축

위 세부목표를 통해 생명과학의학 데이터의 종합적 분석도구 및 지식 베이스를 포함하는 통합 연구지원 시스템을 구축하여 관련 연구 성과제고에 기여하도록 한다.

<연구목표>

본 연구팀은 생명과학의학 데이터의 종합적 분석도구 및 지식베이스를 포함하는 통함 연구지원 시스템을 개발하기 위해 다음의 연구를 5년간, 2단계에 걸쳐 수행한다.

 

1단계 (13차년도)

1단계 연구를 통해 본 연구팀은 다중소스 유전체 정보 분석 연구와 초대용량 연구논문 텍스트 마이닝 연구를 통해 생명정보학적 콘텍스트-객체-관계 정보 추출 기술차세대 시퀀스 분석 기술을 개발하고이를 통해 통합 생명정보 네트워크를 구축한다.

(1) 바이오메디컬 객체 검색엔진 및 시퀀스 정보 분석 기반 시스템 개발

A. 초대용량 유전체 정보 분석을 위한 차세대 시퀀스 분석기반 시스템 개발

B. 초대용량 학술논문을 대상으로 하는 바이오메디컬 객체 검색엔진 개발

(2) 바이오메디컬 객체 네트워크 구축 및 유전체-후성유전체 정보 결합 분석 기술 개발

A. 다중소스 후성유전체학적 정보와 유전자 발현정보의 결합 분석 기법 및 시스템 개발

B. 학술논문 및 공개 데이터베이스 등의 다중소스 데이터로부터 바이오메디컬 객체-관계 정보를 추출하는 점진적 데이터 마이닝 기술 개발

(3) 바이오메디컬 콘텍스트 분석 및 대용량 유전체 서열 분석 기술 개발

A. 대용량 시퀀스 정보를 이용한 세포특이 전사 네트워크 추론 기법 개발

B. 초대용량 바이오메디컬 문서의 콘텍스트 파악 기술 개발

C. 이원화 접근 방법을 통해 파악한 생명정보 객체-관계 네트워크의 점진적 통합 기술 개발

 

2단계 (45차년도)

1단계 연구를 통해 얻은 통합 생명정보 네트워크 및 분석 도구를 포함하는 생명정보학 연구지원 시스템을 구축이를 통한 연구지원 서비스를 제공한다.

(4) 통합된 생명정보 네트워크 분석 시스템 개발

A. 페타급의 시퀀스 정보 분석을 위한 MapReduce 기반의 차세대 시퀀스 정보 분석 알고리즘 개발

B. 통합 생명정보 네트워크의 효과적 관리를 위한 인덱싱 기술 연구

C. 통합 생명정보 네트워크에 근거한 사용자 선택적 데이터 추출 및 활용기술 개발

(5) 생명정보학 연구지원 시스템 구축 및 서비스 개시

A. 강화된 보안 수준의 MapReduce 기반 고속 차세대 시퀀스 매핑 기술 개발

B. 통합 생명정보 네트워크 및 관련 분석도구의 효율적 관리 및 모니터링 시스템 개발

C. 생명정보학 실험데이터를 포함하는 고활용성 연구지원 종합 분석 시스템 구축

 

[Acknowledgement]

이 논문은 0000년도 정부 (미래창조과학부)의 재원으로 한국연구재단-차세대정보컴퓨팅기술개발사업의 지원을 받아 수행된 연구임(No.NRF-2012M3C4A7033341).

This research was supported by Next-Generation Information Computing Development Program through the National Research Foundation of Korea(NRF) funded by the Ministry of Science, ICT & Future Planning (No.NRF-2012M3C4A7033341).


<참여연구원>
분 야 직 위
(직명)
성 명 소속부서 전공 및 학위
학위 년도 전공 학교
Bioinformatics 부교수/연구소장 김선 컴퓨터공학부/생물정보연구소 박사 1997 Computer Science University of Iowa
Bioinformatics 연구원 채희준 생물정보연구소 석사 2007 Computer Science Indiana University
Bioinformatics 연구원 김광수 공대 BK21 정보기술사업단 박사 2011 산업공학 고려대학교
Bioinformatics 연구원 정인욱 생물정보협동과정 석사 2007 컴퓨터과학과 연세대학교
Bioinformatics 연구원 장현숙 생물정보연구소 학사 2006 생명정보공학 상명대학교
Bioinformatics 연구원 문지환 생물정보연구소 석사 2011 정보공학 인하대학교
Bioinformatics 연구원 안재현 컴퓨터공학부 학사 2012 컴퓨터공학 서울대학교
Bioinformatics 연구원 안홍렬 생물정보연구소 학사 2012 컴퓨터공학 서울대학교
Bioinformatics 연구원 박진우 컴퓨터공학부 학사 2012 컴퓨터공학 서울대학교
Bioinformatics 연구원 이성민 컴퓨터공학부 학사 2012 컴퓨터공학 서울대학교