티스토리 뷰

728x90

― LC-MS/MS 분석 품질을 개선하는 차세대 통합 접근법

AI 기반 Chromatographic Peak Integration 자동화 – Human Bias 최소화 전략
AI 기반 Chromatographic Peak Integration 자동화 – Human Bias 최소화 전략

LC-MS/MS 분석의 성패를 가르는 요소 중 하나는 바로 peak integration이다.
피크의 시작점과 끝점을 어디에 두느냐, baseline을 어떻게 설정하느냐, shoulder peak 또는 co-eluting peak을 어떻게 처리하느냐는 정량 결과에 직접적인 영향을 끼친다.

놀랍게도 오늘날 많은 제약사와 CRO에서도 peak integration은 여전히 분석자(analyst)의 경험과 판단에 의존하는 영역이다.
분석자가 다르면 피크가 다르게 integration되고, 같은 분석자라도 날짜·피로도·업무량에 따라 결과가 달라지기도 한다. 이러한 human bias는 bioanalysis의 최대 변동 원인이 되며, method validation·study sample 분석·multi-site harmonization 등 다양한 과정에서 문제를 발생시킨다.

이 내용을 해결하기 위한 가장 효과적인 접근법이 바로 AI 기반 chromatographic peak integration 자동화이다.
본 글에서는 LC-MS/MS 분석 실무자를 위해, AI integration이 실제 분석 workflow에서 어떤 역할을 수행하고, 어떻게 human bias를 줄이며, 어떤 구조로 도입해야 가장 효과적인지 단계별로 정리해본다.

1. Peak Integration에서 human bias는 왜 발생하는가?

1) 경험 기반 판단의 비일관성

피크 형태는 이상적 “가우시안 모양”일 때보다 비대칭일 때가 훨씬 많다.
특히 아래 상황에서는 사람마다 integration 결과가 달라진다.

  • shoulder peak 또는 co-eluting peak
  • noisy baseline
  • 낮은 농도(LLOQ 인근)
  • 방문자 matrix 특성 차이로 인한 RT fluctuation
  • tailing 또는 fronting 증가
  • sample prep 조건 차이로 생기는 minor peak

결국 경험은 중요하지만, 경험만으로 모든 case를 일관되게 처리하기는 어렵다.

2) 소프트웨어 자동 integration의 한계

Sciex Analyst, MassHunter, Sciex OS 등 주요 소프트웨어는
auto-integration 기능이 존재하지만 완벽하지 않다.

  • baseline이 흔들리면 integration 실패
  • low S/N peak은 자동 reject
  • multi-analyte run에서 dwell time 차이로 noise 증가
  • RT shift가 있으면 boundary 설정 오류

이 때문에 현업에서는 자동 integration을 해도 대부분 manual correction이 필요해진다.

3) 분석자의 피로도, 업무량, 시간 압박

Bioanalysis는 일정이 촉박하고 batch 단위로 계속 데이터를 생산해야 한다.
이때 분석자는 종종 “빠르게 처리하기 위해”
peak boundary를 정확히 보지 못하는 경우도 생긴다.

결국 human bias는 분석 workflow의 구조적 문제이며,
이를 최소화하기 위한 해결책이 AI 기반 자동화 integration이다.

2. AI 기반 peak integration의 핵심 개념

AI 기반 peak integration은 단순한 자동화 알고리즘이 아니다.
오히려 다음 4가지 기능을 수행하는 “지능형 분석 보조 시스템”에 가깝다.

① Peak Recognition (피크 존재 여부 판단)

AI는 raw data의 전체 크로마토그램을 분석해
"무엇이 피크인지"부터 먼저 판단한다.

  • noise threshold 자동 계산
  • RT window 기반 후보 peak 탐색
  • multi-analyte panel에서 peak prioritization
  • overlapping peak 분리

특히 LC gradient 변동, column aging 같은 현상도 반영해 계속 RT prediction을 업데이트한다.

② Baseline Modeling (베이스라인 예측)

AI의 가장 큰 장점 중 하나는 baseline을 단순 “직선”으로 보지 않는다는 점이다.

AI baseline 모델은 다음도 반영한다.

  • background drift
  • gradient-induced baseline slope
  • column 온도 변화
  • pump 압력 변동

즉, baseline noise가 불규칙한 상황에서도 AI는 “가장 합리적인 baseline”을 찾는다.

③ Boundary Detection (peak 시작·끝점 설정)

AI는 아래 요소를 조합하여 boundary를 설정한다.

  • slope change
  • local maxima/minima
  • RT index
  • analyte-specific expected peak width
  • peak purity

특히 RT shift가 있는 상황에서도
이전 batch의 RT histogram을 기반으로 자동 보정한다.

④ Peak Quality Scoring (정량 가능성 평가)

AI는 분석된 피크마다 “정량 적합성 점수”를 부여한다.

  • signal-to-noise ratio
  • symmetry
  • tailing factor
  • interference detection score
  • baseline fluctuation score
  • IS 정상 여부

즉, 단순히 integration만이 아니라
“이 peak을 정량에 사용할 수 있는가?”까지 자동 판단한다.

3. AI integration이 human bias를 줄이는 핵심 전략

AI integration이 인간과 결정적으로 다른 점은
“반복성과 일관성”이다.

동일한 피크가 주어졌을 때
AI는 언제나 동일한 기준으로 integration한다.
이 점이 인간 분석자와의 가장 큰 차이다.

아래는 AI가 human bias를 특정 영역에서 어떻게 줄이는지 비교한 표이다.

 

Human Bias 발생 지점 AI 해결 전략
Analyst마다 피크 boundary 기준 다름 feature-based boundary detection 알고리즘
noisy baseline 시 판단 오류 baseline 모델링 + signal cluster 분석
low-level peak에서 피로도에 따른 인식 차이 S/N 기반 자동 scoring
co-eluting peak 오판 peak deconvolution model
동일 분석법에서도 RT drift 인해 integration 다른 경우 RT index + dynamic windowing
IS peak 문제로 인한 analyst 판단 오류 IS drift recognition 모델

4. AI 기반 integration의 장점 – 실무 관점에서

1) Batch-to-batch variation 감소

AI는 동일한 기준으로 integration하기 때문에
장기 프로젝트에서 QC 변동성이 줄어든다.

2) multi-site harmonization 가능

AI로 integration 규칙을 통일하면
해외 CRO들과도 동일 기준으로 데이터를 비교할 수 있다.

3) 리뷰 시간 단축

manual integration 시간이 batch당 20~40% 절감된다.

4) QC 재분석 감소

AI는 이상 신호 발생 패턴을 자동 감지하므로
불필요한 재분석(re-run)이 줄어든다.

5) 신규 분석자 onboarding 간소화

분석 경험이 적어도 AI가 integration 기준을 정해주므로
교육 기간이 단축된다.

5. AI Integration Workflow – LC-MS/MS 분석팀 적용 모델

AI integration은 단일 엔진이 아니라
여러 분석 모듈이 함께 동작하는 구조이다.

아래는 실제 제약사의 LC-MS/MS workflow에 적용 가능한 단계별 구조이다.

1단계: Raw Data Intake

∙ LC-MS/MS raw file 수집
∙ method metadata 자동 인식
∙ mobile phase, column 정보 로딩
∙ QC·calibration 정보 매핑

2단계: Peak Candidate Detection

∙ RT window 기반 사전 탐색
∙ noise cluster 제거
∙ MS precursor/product ion 조합 mapping

3단계: Baseline Modeling

∙ polynomial fitting
∙ noise band estimation
∙ gradient-dependent correction
∙ RT shift 검출 및 보정

4단계: Peak Integration

∙ left/right boundary detection
∙ smoothing (adaptive)
∙ deconvolution
∙ co-eluting peak 구분

5단계: AI Scoring & Classification

∙ quantifiable / questionable / reject 3가지 그룹화
∙ score 기반 reviewer 우선순위 정렬
∙ anomaly detection (IS drift, RT shift, peak width 변화)

6단계: Analyst Review (Human Oversight)

∙ score < 80의 피크만 사람이 검토
∙ boundary 조정
∙ AI 모델 업데이트 피드백 제공

6. AI 기반 integration 도입 시 반드시 고려해야 할 요소

1) 모델 검증(Validation)이 필수

특히 GLP 환경에서는
AI 기반 integration 모델도 다른 소프트웨어처럼
validation이 필요하다.

∙ accuracy
∙ precision
∙ reproducibility
∙ robustness
∙ audit trail

2) 규제기관 대응

FDA/EMA는 AI의 사용 자체는 허용하지만
다음 두 가지를 매우 중요하게 본다.

  • AI가 최종 결정을 하지 않아야 한다.
  • 인간 검토 단계가 반드시 있어야 한다.

3) Multi-analyte 패널에서는 dwell time 이슈 고려

dwell time이 짧은 analyte는 noise가 증가해
AI integration 난이도가 올라갈 수 있다.

4) Column aging 관리

AI가 RT shift를 감지할 수 있으나
column 교체 기준은 인간이 최종 결정해야 한다.

5) IS peak 이상 감지 기능 필수

AI integration의 정확도는
결국 IS peak를 얼마나 잘 추적하느냐에 크게 좌우된다.

7. 분석팀 실무자용 AI integration 체크리스트

아래는 분석팀이 실제 batch 분석 시 바로 활용할 수 있는 실전 체크리스트다.

[A] Batch 시작 전

□ column lot 기록
□ mobile phase 제조 시간 기록
□ gradient table mismatch 여부 확인
□ AI integration 모델 버전 확인
□ RT reference 업데이트

[B] Calibration / QC 단계

□ AI가 제시한 boundary가 과학적으로 타당한가
□ LLOQ peak score ≥ 60 확인
□ QC bias 패턴 변화 없는지
□ IS peak stability 확인

[C] Sample Integration 단계

□ peak quality score가 급격히 감소하는 section 있는지
□ carry-over 발생 시 blank peak score 확인
□ hemolyzed/lipemic sample에서 AI boundary 정확한지 검토
□ co-eluting peak이 있는 경우 deconvolution 정확도 평가

[D] Batch 종료 후

□ AI flag 목록 검토
□ calibration curve 비선형 구간 재확인
□ RT shift > ±0.2 분 이상 구간 확인
□ manual override한 peak의 사유 기록
□ IS drift trend 업데이트

8. 결론 – AI integration은 분석자의 손을 대체하는 것이 아니라 ‘기준을 통합’하는 기술이다

AI 기반 chromatographic peak integration의 핵심은
“사람이 하던 일을 기계가 대신한다”가 아니다.
그보다는 다음 의미가 훨씬 크다.

“분석 기준을 통합하고 일관성을 확보한다.”

AI는 경험의 편차를 없애고,
분석자가 놓칠 수 있는 신호를 잡아주며,
장기 프로젝트에서 데이터 품질을 안정적으로 유지해 준다.

결국 AI integration의 목표는
∙ 분석 편차를 줄이고
∙ 리뷰 시간을 단축하며
∙ batch fail 위험을 줄이고
∙ multi-site harmonization을 강화하고
∙ 분석팀 전체의 효율성을 높이는 것이다.

향후에는 integration뿐만 아니라
method development, stability evaluation, matrix effect 예측 등으로
AI의 적용 범위는 계속 확장될 것이다.

728x90