bioinformatics(3)
-
[궁금사용설명서] 갤럭시로 bam to fastq 전환하기
오늘은 사전적 의미인 은하수, 은하계의 뜻을 가진 웹 사이트 갤럭시(Galaxy)에서 bam 파일을 fastq 파일로 전환하는 간단한 단계를 살펴보고자 한다. Galaxy는 데이터 집약적인 생물 의학 연구에 사용할 수 있는 오픈 소스 웹 기반 플랫폼으로 알려져 있다. 1. bam 파일이 뭔가? 사전적 의미로 bam은 멍청이 등등으로 불리지만, 일루미나 사에서 설명하는 bam 파일의 정의는 아래와 같다. BAM 파일(*.bam)은 최대 128Mb의 정렬된 시퀀스를 나타내는 데 사용되는 SAM 파일의 압축된 바이너리 버전으로 알려져 있다. BAM 파일은 시료명_S#.bam의 파일 명명 형식을 사용한다. 여기서 #은 실행을 위해 샘플이 나열되는 순서에 따라 결정되는 샘플 번호다. 다중 노드 모드에서는 샘플 순..
2023.08.23 -
[궁금사전] 유전자 세트 농축 분석 (Gene Set Enrichment Analysis, GSEA)
Gene Set Enrichment Analysis (GSEA)은 생물정보학에서 사용되는 계산 방법으로, 특정 유전자 집합이 두 생물 조건 또는 형질 간에 통계적으로 유의한 차이를 보이는지 여부를 확인하는 데 사용된다. GSEA에서는 먼저, 알려진 경로, 유전자 온톨로지 (GO) 범주 또는 문헌 기반 주석과 같은 생물학적 지식에 따라 유전자가 집합으로 그룹화된다. 그런 다음, 주어진 샘플의 모든 유전자의 발현 수준을 통계적 방법을 사용하여 기준 집합과 비교한다. 이 비교를 통해 특정 유전자 집합에 속한 유전자가 특정 생물학적 조건에서 유의하게 풍부하거나 감소하는지 여부를 확인할 수 있다. GSEA는 공동 규제 유전자나 특정 생물학적 과정에서 중요할 수 있는 전체 경로를 식별하는 등 전통적인 유전자 수준 ..
2023.04.16 -
[궁금사전] 승산비 (Odds ratio)
[과학체험] 현미경 체험 캠프 현미경 체험 캠프에 대해 공유하고자 한다. 이 캠프에서는 중고등학생을 대상으로 현미경의 작동 원리와 사용법을 배우고, 다양한 시료를 관찰하고 생각하는 시간을 갖게 된다 참가 신청서 링 nv2ngn.tistory.com Odds ratio: 두 사건 A와 B 사이의 연관 강도를 정량화하는 통계 Odds ratio(승산비): 승산비(OR)는 두 사건 A와 B 사이의 연관 강도를 정량화하는 통계다. 승산비는 B가 있을 때 A의 승산과 부재 시 A의 승산의 비율로 정의된다. 또는 동등하게(대칭으로 인해) A가 있을 때 B의 승산과 A가 없을 때 B의 승산의 비율이다. 두 사건은 OR이 1인 경우에만 독립적이다. 한 이벤트의 배당률은 다른 이벤트가 있든 없든 동일하다. OR이 1보다..
2023.01.27