는 버로우즈 - 휠러 얼 라이너 (BWA)는 예컨대 인간 게놈으로 긴 레퍼런스 시퀀스에 대해 상대적으로 짧은 뉴클레오티드 서열 정렬 효율적인 프로그램이다.
이 소프트웨어는 두 알고리즘, BWA-짧고 BWA-SW를 구현합니다. 쿼리에 대한 이전의 작품은 200bp보다 짧은 주위 100kbp까지 긴 시퀀스에 대한 후자의 시퀀스.
두 알고리즘 모두는 갭 첨부 정렬을한다. 그들은 일반적으로보다 정확하고 빠른 낮은 오류율 쿼리에 있습니다. 자세한 내용은 BWA 매뉴얼 페이지를 참조하십시오.
BWA는 454 읽 정렬합니까?
& NBSP; 그렇기도하고 아니기도합니다. BWA의 BWA-SW 구성 요소는 약 200bp 이상을 잘 반영 (454)에 작동합니다. 훨씬 더 빨리하면서 SSAHA2 유사한 배향의 정확도를 달성한다. 짧은 읽기 위해 BWA-SW는 또한 작동하지만, 감도가 낮다. 또한, BWA-SW는 한 쌍의 엔드 정렬을 지원하지 않는다.
정렬 최대 질의 시퀀스의 길이는 무엇입니까?
& NBSP;이 200bp보다 짧은 읽기에만 BWA 짧은을 사용하는 것이 좋습니다. 원칙적으로 몇 KBP 쿼리까지에 대한 BWA 짧은 작품이지만, 그 성능이 저하됩니다. 긴 읽기를 들어, BWA-SW가 더 좋다.
& NBSP; BWA-SW 구성 요소에 대해 인간 게놈 서열 BAC (약 150kbp)을 맞출 수있다. 단위 시간 당 정렬 염기 환산 속도 1kbp 판독 배향의 속도에 필적한다. 원칙적으로, BWA-SW 비슷한 속도로 몇 MBP 질의 순서를 정렬 할 수 있어야한다, 그러나 나는 시도하지 않았습니다.
시퀀싱 오류의 허용 오차는 무엇인가?
& NBSP; 광대역 무선 접속 짧은는 주로 2 % 아래 순서 오류율을 위해 설계되었습니다. 사용자가 조정 명령 줄 옵션 더 많은 오류를 허용하도록 요청할 수 있지만, 그 기능이 빠르게 저하된다. 일루미나 읽기 위해, BWA 짧은 선택적 따라서 정렬하기 전에 3'- 말단에서 낮은 품질의 기지를 트리밍 수 참고 더 Illumina의 데이터에 전형적인 꼬리 높은 오류율, 함께 읽고 정렬 할 수 있습니다.
& NBSP는, BWA-SW는 더 이상 정렬 주어진 이상의 오류를 허용합니다. 시뮬레이션 BWA-SW가 1000BP 이상 정렬은 100bp 정렬, 3 % 오류 200bp를 들어, 500bp 5 %와 10 %를 잘 주어진 2 % 오차를 작동 할 수 있음을 시사한다.
BWA는 키메라 읽기를 찾을 수 있습니까?
& NBSP; 네, BWA-SW 성분은 키메라를 구하는 것이 가능하다. BWA는 일반적으로 각 읽기에 대해 하나의 정렬을보고 있지만, 출력 할 수있다 두 개 이상의 정렬 읽기 / 인접는 키메라 경우.
BWA는 MaQ 상기와 같은 SNP를 호출합니까?
& NBSP; 아니, BWA는 정렬을 수행합니다. 그럼에도 불구하고, 이러한 samtools 및 GATK 같은 몇 가지 일반적인 SNP 발신자가 지원하는 SAM 형식으로 정렬을 출력합니다.
나는 한 쌍에 하나의 판독이 높은 매핑 품질을 볼 수 있지만, 다른 읽기가 0. 이 맞아?
& NBSP;이 올바른 것입니다. 매핑 품질은하지 읽기 쌍에 대한 개별 읽기 할당됩니다. 그것은 하나의 판독 명백하게 맵핑 될 수 있다는 것을 가능하지만, 그 친구는 백색광 조명이 개시 반복에 내리는 따라서 그 정확한 위치가 결정될 수 없다.
내가 읽기는 염색체의 끝을 의미하고 매핑되지 않은 (플래그를 0x4)로 플래그가 참조하십시오. 여기에 무슨 일?
& NBSP는, 내부적으로 BWA는 하나의 긴 순서로 모든 참조 시퀀스를 연결합니다. 리드는 두 개의 인접한 레퍼런스 시퀀스의 접합부에 매핑 될 수있다. 이 경우, BWA는 매핑되지 않은으로 플래그 읽을 수 있지만, 위치, 시가되어 모든 태그를 볼 수 있습니다. 더 나은 솔루션은 다른 위치를 선택하거나 끝에서 정렬을 손질하는 것입니다, 그러나 이것은 프로그래밍에서 매우 복잡하고 순간에 구현되지 않습니다.
BWA는 전체가 4GB보다 레퍼런스 시퀀스에 더 이상 사용할 수 있습니까?
& NBSP는, 아니, 이건 불가능하며 참여로 인해 기술적 복잡성을 가까운 장래에 지원되지 않습니다.
정오표
빈 문자열의 접미사 배열 간격해야 [0, N-1] n은 데이터베이스 문자열의 길이가 아니라 [1, N-1] 리튬과 더빈 (2009 년과 2010)에 명시된대로입니다. 이에 대응하여, 우리는 O를 정의 (가 -1) = 0과 리와 더빈 (2009)에서 그림 3의 의사 코드를 수정해야합니다. BWA 구현은 실제로 올바른 것입니다. 실수는 용지에 발생합니다. 우리는 혼란을 드려 죄송이 지적에 대해 닐스 호머과 아벨 안토니오 썩은 고기 Collado은 감사합니다
이 릴리스의 새로운 기능입니다.
버그 수정 : XA 태그에 중복 대안 안타.
버그 수정 : 활성화 트리밍이 때, BWA-AlN을 손질이 덜 1BP.
색 공간 정렬을 사용 안 함. 고체 현재 읽고으로 된 0.6.x가 작동하지 않습니다.
버그 수정 : segfault의 과도한 모호한 기지로 인해.
버그 수정 : SE 모드에서 잘못된 메이트 위치.
버그 수정 : PE 모드에서 드문 세그먼트 폴트
매크로 _NO_SSE2를 사용할 때, 표준 스미스 - 워터맨 폴백
대신 SSE2-SW의.
선택적 마크 분할 보조로 낮은 정렬 점수 안타.
버그 수정 : 모호한 기지로 인한 무한 루프.
선택적으로 출력 질의 시퀀스.
댓글을 찾을 수 없습니다