2023. 8. 23. 21:50ㆍ카테고리 없음
오늘은 사전적 의미인 은하수, 은하계의 뜻을 가진 웹 사이트 갤럭시(Galaxy)에서
bam 파일을 fastq 파일로 전환하는 간단한 단계를 살펴보고자 한다.
Galaxy는 데이터 집약적인 생물 의학 연구에 사용할 수 있는 오픈 소스 웹 기반 플랫폼으로 알려져 있다.
1. bam 파일이 뭔가?
사전적 의미로 bam은 멍청이 등등으로 불리지만, 일루미나 사에서 설명하는 bam 파일의 정의는 아래와 같다.
BAM 파일(*.bam)은 최대 128Mb의 정렬된 시퀀스를 나타내는 데 사용되는 SAM 파일의 압축된 바이너리 버전으로 알려져 있다.
BAM 파일은 시료명_S#.bam의 파일 명명 형식을 사용한다. 여기서 #은 실행을 위해 샘플이 나열되는 순서에 따라 결정되는 샘플 번호다. 다중 노드 모드에서는 샘플 순서에 관계없이 S#이 S1로 설정된다.
BAM 파일에는 헤더 섹션과 정렬 섹션이 포함되어 있다.
▶ 헤더 - 샘플 이름, 샘플 길이, 정렬 방법 등 전체 파일에 대한 정보가 포함되어 있다. 정렬 섹션의 정렬은 헤더 섹션의 특정 정보와 연결된다.
▶ 정렬 - 판독 이름, 판독 순서, 판독 품질, 정렬 정보 및 사용자 정의 태그가 포함되어 있다. read 이름에는 염색체, 시작 좌표, 정렬 품질 및 일치 설명자 문자열이 포함된다고 알려져 있다.
2. Galaxy에서 bam 파일을 fastq 파일로 전환하는 간략한 단계는 아래와 같다.
1. Galaxy 웹사이트에 로그인하자.
2. 상단 메뉴에서 Tools를 클릭하자.
3. “Convert Formats” 카테고리에서 “BAM-to-fastq” 도구를 찾아보자.
4. 해당 도구를 클릭하여 실행하자.
5. “BAM file” 옵션에서 xxx.bam 파일을 선택하자.
6. “Execute” 버튼을 클릭하여 변환 작업을 시작하자.
7. 파일 크기에 따라 시간이 필요하다.
8. 변환 작업이 완료되면 결과 fastq 파일이 Galaxy의 “History” 패널에 나타난다.
9. 이 파일을 다운로드하여 사용하면 된다.
(위 단계 설명은 사이트 업데이트에 따라 변경 될 수 있음에 유의하기 바란다)
Galaxy
usegalaxy.org
이전 글
2023.08.23 - [분류 전체보기] - [궁금사전] Metagenomics binning이란?
[궁금사전] Metagenomics binning이란?
가끔 바이오인포매틱스(bioinformatics) 관련 논문에서 binning이란 단어를 만난다. 사전적 용어로 'bin'을 찾아 보면, 쓰레기통, (흔히 뚜껑이 달린 저장용) 통을 말하는데, 통 감이 잡히질 않는데, 위키
nv2ngn.tistory.com