MS-based methods for protein identification & phosphorylation site analysis 생명과학부 구용의 Mass Spectrometer(MS) • 분자가 MS 내로 들어가면 분자는 이온화됨과 동시에 더 작은 이온들(fragments)로 쪼개진 다. 쪼개진 이온들은 그들의 질량/하전(m/z) 비에 따라 선택적으로 분리되어 이온수에 비 례하게 signal을 만든다. • 이온들의 질량/하전비는 이온들의 생성된 양 (Abundance)의 함수로 표시되어 mass spectrum이 그려지며, 이 mass spectrum을 이용하여 미지성분의 정성확인을 할 수 있다. • 이온은 양이온과 음이온 모두 사용 MS Component MS component • Sample inlet 시료도입장치로 시료를 MS내로 효율적으로 보내주는 역할을 한다 • Ion source 시료분자를 이온화시키고 더 작은 이온으로 쪼갠다. 생성된 이온들을 MS analyzer 쪽으로 이동시킨다 • Mass analyzer 이온들을 m/z ratio에 따라 선택적으로 분리시킨다 • Ion detector 이온 흐름을 그 양에 비례하게 전기적인 흐름으로 전환, 증폭시켜 signal을 생성한다 • Vacuum system MS 내 진공상태를 10-4 ~ 10-9 Torr 로 만들어 주어 최적의 상태로 분석이 진행될 수 있도록 한다 • Data System MS 내 각 구성성분들의 조절이 가능하며 시료분석과 동시에 데이터 해석을 할 수 있는 곳이다 Ion source • Gaseous sample introduction - EI(electron ionization) - CI(chemical Ionization) • Liquid sample introduction - FAB(fast atom bombardment) - ESI(electrospray ionization)(soft ionization) • Solid sample introduction - MALDI(soft ionization) (matrix-assisted laser desorption/ionization) EI(electron ionization) • 전자를 발생시키기 위한 filament가 가 열되고 (+) 극판에 전압이 걸리면 가속 된 전자들이 흐르고 그 속을 지나던 기 체화된 sample은 전자와 충돌하여 에너 지를 얻고 전자 하나를 잃어 분자이온 M+가 된다 • 이 방법은 큰 에너지를 사용하기 때문에 복잡한 spectrum을 이루며 분자 이온을 얻기 힘들다 • M + e- ⇒ M+ + 2e- CI(chemical Ionization) • 가열된 filament에서 발생, 가속된 전자는 106 정도로 많은 reagent gas와 충돌하여 이들을 이온화시키고 이 reagent gas ion은 sample gas와 충돌 • 이 sample gas는 fragmentation 되기도 하고 때로는 reagent gas ion 과 complex를 이루 기도 한다. • 매우 낮은 에너지로 충돌하기 때문에 EI 보다 수백배 이상 많은 수의 분자 이온을 만들어 내 기 때문에 분자량 확인에 많이 쓰인다. • R(CH4) + e- ⇒ R+ + 2 eR+ + M ⇒ M1+ + N1 M1+ ⇒ M2+ + N2 MALDI MALDI process 1. matrix와 sample을 각 1000~10,000 : 1의 농도 비율로 적당한 용매(acidic organic solvent- TFA+MeCN)에 혼합한다 2. 이 혼합물을 시료용 probe 에 올려 놓고 진 공조건을 만들어 주면 유기용매는 기화되고 시료는 matrix 와 함께 균질하게 결정화 된다 3. 이 때 펄스 레이져(UV at 337nm, IR at 2.94um) 를 sample-matrix 결정에 쏘아주 면 에너지가 matrix를 통해 sample로 전달 되어 약한 이온화가 일어난다. 4. 이온화는 protonation/deprotonation, cation attachment/cation detachment, oxidation/reduction으로 일어난다. Matrix in MALDI • Sinapinic acid : peptide, protein>2kDa • 2,5-Dihydroxybenzoic acid : glycoprotein, glycolipids, carbohydrate • A-Cyano-4-hydroxycinnamic acid : low MW peptides, peptide • 2-Benzoic acid : sulfonated dyes • Nicotinic acid/Anthranilic acid(1;1) : oligonucleotide, sialylated glycopeptides • 3-Hydroxypicolinic acid : oligonucleotide adducts, oligonucleotide • 2,4(6) Trihydroxyacetophenone : oligonucleotide, proteins 1-30kDa ESI ESI(electrospray ionization) • 시료용액이 고전압이 걸려 있는 capillary를 통과하면서 분무되어 전하를 많이 띤 droplet 이 생성됨 • drpolet이 capillary에서 orifice를 지나면서 inert gas(or heat)에 의해 desolvation 됨 • Desolvation 과정에서 ion의 charge는 더 증 가하고 “Coulombic expolsion”에 의해 droplet의 ion이 gas phase로 된다. • smaple에 가해지는 충격이 약하며, multiple charge를 가진 peptide이온이 생긴다. ESI Mass analyzer and Detector MALDI – MS(Linear) TOF(time of flight) • Ion source에서 생성된 이온을 높은 전 압으로 가속화시켜 tube(field-free drift tube)를 통과시켜 검출기에 도달하게 한 다. • 모든 이온들이 ion source에서 같이 떠 난다면 m/z가 작을수록 더 빨리 검출기 에 도착한다. • TOF는 이온들의 이동시간을 측정하여 m/z를 계산한다 TOF Mass resolution Resolution = m/△m MALDI-TOF MS resolution • Reflectron(ion mirror) - 비행관 끝에 위치한 일련의 정전기장과 자기 장으로 이루어 있음 - m/z 값은 같으나 약간씩 다른 운동에너지 를 가지고 있는 이온들은 reflectron 에 가까 이 도달할수록 속도가 늦어져 정지하여 이온 들의 속도차가 줄어들고 reflectron에서 반사 되어 detector 쪽으로 비행한다 • Time-lag focusing(delayed extraction) - 이온의 생성과 가속사이에 약간의 시간차를 주어 이온들의 초기운동 속도 분포차를 줄여 주는 방법 MALDI – MS(Reflectron) Quadruple analyzer(mass filter) • 4개의 molybdenum 막대로 이루어져 있으며, 한쌍(1,2)은 dc voltage가 또다른 한쌍(3,4) 은 radio frequency voltage가 가해진다. • Dc voltage가 0이고 RF voltage만 있으면 모 든 이온이 통과할 수 있다 • 가해지는 전압의 진폭은 선택된 m/z의 비에 해당되는 ion만 ion source에서 detector까지 통과하도록 한다 • 이 quadropole의 전압을 바꾸면서 주어진 mass범위의 이온을 scanning 하여 mass spectrum을 얻는다. PSD(postsource decay) • The metastable fragmentation of ions after full acceleration that occurs in the field free region of TOF-MS • If peptides are subjected to PSD they will fragment predominantly along th polypeptide backbone, thus generating series of fragment ions which, in principle, contain the amino acid sequence information of the peptide • To obtain primary structural information MALDI – MS(Reflectron) MS/MS ESI –TQ-MS ESI – TQ - MS • CID(collision-induced dissociation) The term used to describe fragmentation in MS/MS experiment. The precursor ion is isolated and allowed to collide with neutral gas molecules in a collision cell. The translational energy of the precursor ion is converted to internal energy after the collisions resulting in fragmentation of the precursor ion. • quadruple을 사용하는 방법에 따라 여러가지 mode로 사용할 수 있음 - MS mode - MS/MS mode - Neutral loss scan mode - Precusor(or parent) ion scanning - In-source CID : fragmentation occurs in the high-pressure region of an ESI source as a result of collision with atmospheric gases. Ring electrode와 end-cap electrode로 구성되어 있으며, quadruple처럼 dc voltage와 RF voltage가 흐른다. RF only인 경우 모든 이온들이 trap에 갇히 게됨 ESI –IT-MS ESI – IT -MS • Tandem mass spectrometer in which ions can be accumulated and stored prior to analysis • The ion trap is both a mass analyzer and collision cell • “Resonance ejection” refers to ions becoming unstable in the trap and being ejected axially through th end-cap electrodes where they are detected • Through this process of trapping and selective ejection of ions, ions of specific m/z can be isolated in the trap Mass spectrum of CO2 EI-MS spectrum of propionic acid Total ion chromatogram PA M+ Experimental data Data base Propionic acid MALDI-MS spectrum of protein MS/MS spectrum of peptide Peptide mass searching 1. 2. 3. 4. Peptides are generated by digestion of the protein of interest using specific cleavage reagents(usually enzymes) The masses of these peptides are accurately determined experimentally using MALDI-MS(or ESI-MS) Theoretical peptide masses are calculated for each sequence entry in the database using the same cleavage specificity as the reagent employed experimentally. A score(or ranking) is then calculated to provide a measure of fit between the experimentally derived and calculated peptide masses. Measured peptide mass 와 sequence가 맞지 않는 경우 • The additional masses are due to posttranslational or artifactual modifications or post-translational processing • Unspecific proteolysis had occurred or contaminating protease was present • Protein was part of a mixture of ‘contaminating’ proteins Critical experimental parameter in peptide mass searching • The accuracy of the peptide-mass measurement - time-lag focusing/delayed extraction - internal standard with isotope • The specificity of the enzyme(or chemical reagent) employed - ‘missed cleavage’, ‘ragged termini’를 control할 수 있도록 program화 Orthogonal method in peptide mass searching • Site-specific chemical modification • Determination of partial amino acid composition of the peptide • Identification of the N-terminal amino acid residue • Identification of different cleavage sites within the peptides • Identification of the C-terminal residue(s) Fragment ion • “b ion” - the fragment with c-terminal deletions and intact N-terminal • “y ion” - the fragment with N-terminal deletions and intact C-terminal • internal fragment - internal acyl ion - immonium ion(represent individual amino acid) Uninterpreted fragment ion searching • Fragmentation can be induced by PSD-MALDI-MS as well as by CID in triple quadruple or ion-trap mass spectrometer • Fragment ion spectra contain reduntant pieces of information How to interpret fragment ion 1. Manual interpretation 2. Interpret with database - A partial manual interpretation of the spectrum to identify consecutive elements of a particular (b or y) ion series - Uninterpreted fragment ion search program(SEQUEST) De novo sequencing • Data base independent • “peptide ladder sequencing” - different peptide in length by one amino acid - by chemical(Edman) ⇒ N-terminal blocking : Gln(128.13),Lys(128.17)구별, Ile, Leu 구별못함 - enzymatic degradation : Ile and Leu, Gln and Lys 구별 못함 - are analyzed by MALDI-TOF MS • CID spectra(fragment ion spectra) - are manually interpretated - missing frgament(incomplete ion series) 확인을 위해 trypsin 분해시 H218O사용 (50% H218O+50%H216O, intact C-terminal peptide ion series have doublet by 2u) - methyl esterfication of the carboxyl groups in the peptide (14u increase, derivatized and underivatized 비교 ) Peptide ladder sequence Phosphorylation site analysis strategies • Complication of phosphoprotein analysis - the frequently low stoichiometry of phosphorylation - the presence of multiple, differentially phosphorylated forms • In vitro analysis - scale up of protein by kinase reaction - comparison with 2D-PP maps of in vivo (confirmation of identity indirectly) - MS analysis Detection and isolation of phosphoproteins • For the analysis of the site(s) of protein phosphorylation - purification of phosphoprotein - enzymatic or chemical fragmentation of the phosphoprotein - Isolation, separation, analysis of peptide • Isolation - separation of proteins by gel electrophoresis - fragmentation of the phosphoprotein band or spot - extraction of the generated phosphopeptide • More positive identification - 32 P radiolabelling : in vivo(32 PO4), in vitro([γ-32P]ATP) - western blotting : particularly tyrosine phosphorylated protein Separation of phosphopeptides • 필요한 이유 - 농도를 농축하는 역할을 하여 S/N 비를 높임 - radiolabel의 activity를 이용하여 phosphopeptide의 상대적 또는 절대적인 양 을 구할 수 있음 - separation에 의해 확보된 재현성으로 단백 질의 phosphorylation 상태를 정량적으로 결 정할 수 있음 - nonpeptide contaminants를 제거하여 적은 양의 phosphopeptide의 분석을 용이하게 함 Phosphopeptide separation techniques • • • • By 2-dimensional phosphopeptide map Reversed-phase HPLC High-resolution gel electrophoresis Immobilized metal affinity chromatogrphy(IMAC) • Phosphopeptide는 상대적, 절대적으로 적은 양 때문에 분석이 어려우므로 이러한 점을 극 복할 수 있는 최적의 separation방법을 선택 해야 Separation by 2D-PP • 1st dimension by electrophoresis on thin-layer cellulose plate + 2nd dimension by TLC on the same plate • information - radiolabelled spot 수 ⇒ phosphorylated sites 최대수 - radiolabelled spot의 intensity ⇒ peptide 들의 상대적인 phosphorylation 정도 - relative state of hydropathy between phosphopeptie • MS analysis after extraction from plate - protease양이 중요 • sensitive and reproducibile by radiolabelling Separation by RP-HPLC • Reproducible and simple • column으로 분리하고 radioactivity count로 fraction ⇒ count를 시간의 함수로 하여 radioactive fraction의 수를 알 수 있음 • 단점 - very hydrophilic phosphopeptide, very hydrophobic phosphopeptide의 분리가 어렵다 - 2D-PP보다 resolution이 낮다 - phosphopeptide will stick to metal surface • 장점 - ESI MS와 on line으로 연결하여 사용할 수 있다(LC-MS/MS) - isotope을 사용할 수 없는 인체 단백질 분석 가능 Separation by high-resolution electrophorsis and IMAC • High-resolution gel electrophoresis - 2-DE - 특정 phosphopeptide의 손실이 많지만 널리 보급되어 있어 사용하기 좋음 • IMAC - 같은 sequence를 갖는 nonphosphorylated peptide에 비하여 상대적으로 매우 적은 양의 phosphorylated peptide의 분석 어려움 - separation and enrichment 1) phosphopeptide와 metal(Fe3+ ,Ga3+)의 chelating 2) elution by phosphate or increased pH 3) acidic amino acid 도 enrichment 되는 단점 Detremination of the type of phosphorylated amino acid • 이유 가능한 phosphorylated site의 수를 찾아냄으로써 polypeptide 내의 phosphorylated residues의 assignment를 쉽게할 수 있음 • Technique 1) phosphoamino acid analysis - 32P-amino acid(hydrolysate of 32P-labeled phosphoprotein or phosphopeptide) ⇒ autoradiography - phosphoamino acid standard ⇒ ninhydrin staining - sample과 standard의 비교 분석(보통 1site/phosphopeptide) 2) phosphoamino acid-specific immunodetction - antibodies specific for particular phosphoamino acid - 상업적으로 antibody판매 Determination of the site of phosphorylation • Chemical phosphopeptide sequencing - phosphopeptide sequencing by step-wise chemical degradation(nonradioactive, radioactive methods) - analyzed as phenylthiohydantoyl derivatives - not available in very limited amount • Mass spectrometric analysis of phosphopeptides - phosphopeptide의 양이 1pmole이상이면 2D-PP map에서 extraction이 가능하고, MS로 분석이 가능 - two basic theme 1) chemical lability of the phosphate ester bonds 2) the detection of the mass added to a peptide (80u) - product ion scan in a tandem MS으로 phosphorylation site 확인 ⇒ phosphorylated amino acid type을 알고 있으면 더 용이 Mass scan for phosphopeptides analysis • In-source CID - identify phosphopeptides by observation of H2PO4-(97U), PO3-(79U) and PO2-(63U) - detect phosphopeptides in negative ion mode and then switch to positive ion mode • Neutral loss scan - positive ion mode with ESI in a TQ MS - Q1, Q3 are scanned over different m/z ranges - neutral loss of phosphoserine and phosphothreonine : 98 Mass scan for phosphopeptides analysis • Presursor ion scan - negative ion ESI(다시 positive ion mode로 변경) - Q1 : continous scan, Q2 : ion fragmentation Q3 : 79m/z(PO3-)를 잃은 ion 만 통과 • Product ion scanning - in-source CID, neutral loss and precursor ion scanning는 특수한 경우에만 phosphorylated residue를 identify - 상기 3가지 방법을 이용할 수 없는 경우 peptide fragment ion 전체에 대한 해석이 필요 Mass scan for phosphopeptides analysis • Post-source decay MALDI • Enzymatic and chemical dephosphorylation - MALDI-TOF로 phosphopeptide의 mass 측정 + phosphate를 제거 후 MALDI-TOF로 mass 측정 - nonphosphorylated peptide에서 phosphopeptide 를 확인하는데 쉽게 이용 - identification of phosphorylation sites using MS/MS Emerging methods and future directions in phosphoprotien analysis • phosphoprotein의 분석에 가장 큰 문제점은 in vivo 32P-labeled phosphoprotein을 직접 이용하지 못한 다는 것 • in vivo와 비교해서 in vitro로 시험하나 동일하다는 보장이 없음 ⇒ in vivo를 직접 • in vivo 32P-labeled protein을 충분히 얻는다는 것은 어려우므로 분석기기 감도를 높이는 것이 유리 - FT-ICR-MS, microcapillary HPLC - at level of tens of attomoles 가능 • Single automated LC-MS/MS - presence of phosphoprotein, mass of peptide, CID spectrum of phosphopeptide Present and future challeges and opportunities • Protein identification and characterization has to be performed in a high-throughput manner, efficiently and with high accuracy and sensitivity • Robotic system • 2D-chromatography MS/MS