티스토리 뷰
Data-dependent acquisition (DDA) vs Data-independent acquisition (DIA)
pharma_info 2025. 11. 21. 20:18
LC-MS/MS 기반 metabolomics·proteomics에서의 스펙트럼 수집 전략 비교와 국내 제약사 실험 환경에서의 활용 기준
LC-MS/MS 데이터를 다루다 보면, 분석자가 처음 맞닥뜨리는 의문 중 하나가 바로 “DDA를 쓸지, DIA를 쓸지”다.
처음에는 단순히 targeted vs untargeted로 구분하는 것처럼 보이지만, 실제로는 이 둘의 차이가 훨씬 복잡하고, 분석 workflow 전체―즉 데이터 품질, 재현성, quantification precision, identification confidence, downstream 통계, 심지어 임상 적용성까지―에 아주 깊게 관여한다.
내가 분석팀에서 일하면서 느낀 DDA vs DIA의 차이를 정리해보면 이렇다.
- DDA는 샘플이 가진 정보 중 ‘눈에 띄는 피크’만 골라내는 방식이다.
- DIA는 샘플이 가진 모든 신호를 “선택 없이” 다 스캔하는 방식이다.
둘 다 장단점이 명확하고, 국내 제약사 분석팀 환경에서 어떤 접근이 맞는지는 분석 목적·샘플 수·소요 시간·데이터 처리 가능 인력 등 여러 요소가 얽혀 있다.
아래에서는 이 구조를 최대한 실제 현장에서 쓰는 언어로 서술해본다.
1. DDA(Data-dependent acquisition)의 원리와 특성
DDA는 말 그대로 데이터가 acquisition 흐름을 결정한다.
즉, MS1(Full scan)에서 intensity가 높은 이온들을 우선적으로 선택해 MS2 fragmentation을 수행하는 방식이다.
1-1. 작동 개념
- MS1에서 ion intensity ranking
- 상위 n개(보통 top 5, top 10, top 20 등)를 선택
- 선택된 precursor만 fragmentation
- 나머지 피크들은 정보가 없음 (→ missing MS2)
즉, “강한 피크만 본다.”
여기서 DDA의 가장 근본적인 문제―missing MS2―가 발생한다.
1-2. 장점
- MS/MS 스펙트럼이 선명하고 high-quality
- spectral matching이 정확해 구조 추정이 쉬움
- 속도 빠름 (특히 metabolomics profiling에서)
- 데이터 파일 크기가 작아 downstream 분석 부담 적음
1-3. 단점
- low-abundance metabolite는 거의 MS2를 얻기 어려움
- 샘플 간 variability 때문에 feature-level 비교가 불안정
- 재현성 낮음: 같은 물질이라도 다른 run에서 MS2가 없을 수 있음
- 복잡한 시료에서는 high-abundance lipid가 MS2를 독점하는 문제 발생
따라서 DDA는 “보이는 분석(identification-heavy)”에 적합하고
정량 중심의 안정적 분석에는 한계가 있다.
1-4. 현업 실무에서의 DDA 활용 사례
- 새로운 unknown metabolite 구조 추정
- metabolite library 구축
- biomarker candidate 초기 스크리닝 단계
- small molecule profiling 시 MS/MS 참조 데이터 확보
- ADC payload, small-molecule impurity 구조 해석
국내 제약사 분석팀 입장에서 보면 DDA는
“새로운 화합물 구조를 잡아내야 할 때” 가장 강력하다.
2. DIA(Data-independent acquisition)의 원리와 특성
DIA는 완전히 다르다.
“선택 없이 전 구간 MS2를 스캔하는 방식”이다.
즉, intensity ranking 같은 기준이 없다.
모든 신호를 window별로 잘라서 전부 fragmentation해 저장한다.
2-1. 작동 개념
- MS1 full scan
- m/z 구간을 일정 window로 나눔(예: 400–410, 410–420, 420–430 …)
- 각 window 내의 모든 이온을 동시에 fragmentation
- 전 범위 MS2 데이터 생성
이 방식은 정보 손실이 없다는 게 핵심이다.
2-2. 장점
- low-intensity metabolite도 MS2 확보 가능
- 매우 높은 재현성(run-to-run consistency)
- quantitation precision이 DDA보다 높음
- peptide/protein이나 metabolite 시간축 alignment가 안정적
- clinical sample과 같이 일관성 필요한 분석에 최적화
2-3. 단점
- fragment가 섞여 있어 해석 난이도가 매우 높음
- deconvolution 알고리즘 의존도 큼
- raw data 파일 크기가 매우 큼
- library 의존성이 높아 reference가 없으면 identification이 어려움
관점 자체가 DDA와 완전히 다르다.
DIA는 “가능한 한 모든 피크에 대해 MS2를 확보해 재현성 있는 정량을 수행하겠다”는 철학이다.
3. DDA vs DIA 핵심 비교
| 항목 | DDA | DIA |
| Acquisition | intensity 기반 선택적 MS2 | 전구간 비선택적 MS2 |
| MS2 coverage | 낮음 | 매우 높음 |
| MS2 quality | 매우 선명 | 혼합된 스펙트럼(해석 난이도 높음) |
| Reproducibility | 낮음 | 높음 |
| Quantitation precision | 중간 | 매우 높음 |
| Library 의존성 | 낮음 | 높음 |
| Unknown 구조 해석 | 매우 우수 | 중간 |
| High-complexity sample | 불리 | 유리 |
| 파일 크기 | 작음 | 큼 |
| 분석 목적 | 구조 추정 | 안정적 정량 / 임상 분석 |
요약하면,
- DDA = 구조 기반 탐색에 강함
- DIA = 정량·재현성에 강함
4. Metabolomics·Proteomics 각각에서의 차이
4-1. Metabolomics
메타볼로믹스는 물질 구조가 다양하고 이성질체가 많기 때문에
식별 측면에서 DDA가 여전히 필요하다.
하지만 large-cohort(수백~수천 샘플) 분석에서는 반드시 DIA가 들어온다.
- Untargeted metabolomics 초반: DDA
- 통계 기반 biomarker 검증 단계: DIA
- clinical metabolomics: 완전히 DIA 중심
국내 제약사에서 특히 중요한 포인트
GLP 분석, TDM, pharmacometabolomics, large-scale clinical study에서는
DDA는 사실상 사용할 수 없고 DIA 기반 quantification이 표준 구조가 된다.
4-2. Proteomics
Proteomics에서는 이미 DIA가 표준화되어 있다.
특히 SWATH acquisition 방식 도입 이후 완전히 판도가 바뀌었다.
- Reproducibility → DIA 압승
- Multi-sample comparison → DIA
- High dynamic range sample → DIA
protein-level 연구에선 DDA는 거의 library 구축용으로만 사용된다.
5. 국내 제약사 분석팀 기준: 어떤 상황에서 무엇을 선택해야 하나?
아래는 실제 분석실 workflow 기준으로 던지는 실전 조언이다.
5-1. DDA를 써야 하는 경우
- 신약 후보의 대사체 구조를 새로 밝혀야 할 때
- unknown impurity 구조 확인 (특히 LC-MS/MS fragmentation 패턴 분석)
- target metabolite의 isomer 분리가 필요한 경우
- 신약 대사체 profiling (in vitro/in vivo) 초기 단계
- lipidomics에서 novel lipid species를 찾을 때
즉, 구조 중심·식별 중심 분석에 최적.
5-2. DIA를 써야 하는 경우
- large cohort metabolomics
- biomarker validation
- TDM 기반 clinical quantification
- low-abundance metabolite 추적
- reproducibility가 가장 중요한 LC-MS 기반 정량 분석
- multi-omics 연계(PK-PD modeling + metabolomic response)
즉, “데이터 비교”가 필요하고
정량 오차가 조금이라도 허용되지 않으면 DIA가 답이다.
6. 실제 분석 실무에서 자주 겪는 문제와 해결 팁
6-1. DDA missing MS2 문제
alt-fragmentation 방식(topN+inclusion list)을 섞어 해결 가능.
6-2. DIA fragment overlap 문제
- overlapped fragment를 분리하는 deconvolution 알고리즘 필수
- 최근 AI-assisted deconvolution과 결합하면 DIA performance가 비약적으로 증가
- 실제로 국내 제약사 워크플로우에서도 이 조합이 매우 빠르게 퍼지고 있음
6-3. library 부족 문제
특히 metabolomics에서는 spectral library가 제한적이므로
DDA로 자체 library(“in-house MS/MS DB”)를 만들어 DIA에 연결하는 방식이 정석이다.
7. 최종 정리
DDA와 DIA는 경쟁 관계라기보다 서로 보완하는 전략이다.
딱 한 문장으로 요약하면 이렇다.
- DDA = 구조 기반 식별 (Identification power)
- DIA = 재현성·정량 기반 대규모 분석 (Quantification power)
국내 제약사의 실제 분석 환경에서 본다면
초기 구조 해석 → DDA
이후 대규모 정량 검증 → DIA
라는 투트랙이 가장 이상적이다.
두 방식의 공존이 이미 글로벌 제약사에서도 표준화된 만큼,
국내 분석팀에서도 적절한 조합을 선택하는 게 중요하다.
'제약산업' 카테고리의 다른 글
| AI-assisted peak deconvolution – 복잡한 metabolomics 데이터의 자동화 해석 (0) | 2025.11.20 |
|---|---|
| LC-MS/MS 기반 Lipidomics 분석으로 항암제 내성 메커니즘 탐색 (0) | 2025.11.19 |
| Isotope Tracing 기반 Metabolic Flux 분석 – 종양 대사 재프로그래밍 연구 응용 (0) | 2025.11.18 |
| Proteomics + Metabolomics 통합 분석을 통한 약물 독성 메커니즘 규명 (0) | 2025.11.17 |
| Targeted metabolomics를 이용한 약물 대사 경로 규명 (0) | 2025.11.16 |
| Pharmacometabolomics로 개인 간 약물 반응성 예측 모델 구축하기 (0) | 2025.11.15 |
| Extract stability 및 bench-top stability 검증에서 흔히 발생하는 오류 사례 (0) | 2025.11.14 |
| ICH M10 Bioanalytical Method Validation 대응 – 국내 제약 분석팀 실무 전략 (0) | 2025.11.13 |
- Total
- Today
- Yesterday
- 머신러닝
- 제약산업
- 대사체분석
- LC-MS
- 바이오의약품
- metabolomics
- 대사체 분석
- 제약
- Multi-omics
- 세포치료제
- 면역항암제
- 정밀의료
- 미래산업
- 치료제
- 디지털헬스케어
- lc-ms/ms
- 약물개발
- 정량분석
- 항암제
- 공급망
- 유전체분석
- 약물분석
- 바이오마커
- AI
- Drug Repositioning
- 신약개발
- 임상시험
- 팬데믹
- Targeted Metabolomics
- 약물 반응 예측
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
