Nextflow for Genomicscourse¶
-
과정 요약
AI 지원 번역 - 자세히 알아보기 및 개선 제안
실제 유전체학 사용 사례에 Nextflow를 적용하는 실습 과정: GATK를 사용한 변이 호출.
이 과정은 Hello Nextflow 초급 교육을 기반으로 하며, 유전체학 도메인의 특정 맥락에서 Nextflow를 사용하는 방법을 보여줍니다. 고처리량 시퀀싱 데이터를 분석하는 데 널리 사용되는 소프트웨어 패키지인 GATK (Genome Analysis Toolkit)를 사용하여 변이 호출 파이프라인을 구현합니다.
-
추가 정보
기술 요구사항
GitHub 계정 또는 Nextflow 로컬 설치가 필요합니다. 자세한 내용은 환경 옵션을 참조하세요.
학습 목표
- 단일 샘플에 변이 호출을 적용하는 선형 워크플로우 작성하기
- 인덱스 파일 및 참조 게놈 리소스와 같은 보조 파일을 적절하게 처리하기
- Nextflow의 데이터플로우 패러다임을 활용하여 샘플별 변이 호출을 병렬화하기
- 관련 채널 연산자를 사용하여 다중 샘플 공동 호출 구현하기
대상 및 선수조건
- 대상: 이 과정은 데이터 분석 파이프라인을 개발하거나 맞춤화하려는 유전체학 및 관련 분야의 연구자를 위해 설계되었습니다.
- 기술: 명령줄, 기본 스크립팅 개념, 일반적인 유전체학 파일 형식에 대한 어느 정도의 친숙함을 가정합니다.
- 전제 조건: Hello Nextflow에서 다루는 기초적인 Nextflow 개념 및 도구에 대한 이해가 필요합니다.
과정 개요¶
이 과정은 실습 중심이며, 정보를 단계적으로 학습할 수 있도록 목표 지향적인 연습으로 구성되어 있습니다.
먼저 터미널에서 변이 호출 도구를 수동으로 실행하여 방법론을 이해한 다음, 분석을 자동화하고 확장하는 Nextflow 파이프라인을 점진적으로 구축합니다.
학습 계획¶
이 과정은 유전체학 사용 사례에 Nextflow를 적용하는 특정 측면에 초점을 맞춘 세 부분으로 나뉩니다.
| 과정 챕터 | 요약 | 예상 소요 시간 |
|---|---|---|
| Part 1: Method overview | 변이 호출 방법론 이해 및 도구를 수동으로 실행하기 | 30분 |
| Part 2: Per-sample variant calling | BAM 파일을 인덱싱하고 변이를 호출하는 파이프라인 구축, 그리고 여러 샘플로 확장하기 | 60분 |
| Part 3: Joint calling on a cohort | 채널 연산자를 사용하여 샘플별 출력을 집계하는 다중 샘플 공동 유전자형 분석 추가 | 45분 |
이 과정을 마치면 기초적인 Nextflow 개념과 도구를 일반적인 유전체학 사용 사례에 적용할 수 있습니다.
과정을 시작할 준비가 되셨나요?