아미노산

From Bvio.com

Jump to: navigation, search

단백질의 구성물질: 아미노산

단백질을 가수분해하면 암모니아와 아미노산이 생성되는데, 아미노산은 단백질의 기본 구성단위다. 단백질에서 분리된 아미노산은 아미노기와 카르복실기가 같은 탄소원자에 결합하여 R-CHNH2-COOH의 일반식으로 나타낼 수 있는 α-아미노산이다. (R는 지방족 ·방향족 ·헤테로 고리등의 곁사슬/치환기를 뜻한다). 아미노산은 그 분자 크기가 평균 100 달톤 정도가 되기 때문에, 단백질의 크기를 어림짐작할때, 아미노산수에다 100을 곱하면, 대충의 크기가  된다. 가장 작은 아미노산은 글라이신(Glycine)으로, 가장 최초로 생명체에서 사용된 아미노산이라는 논문들이 있다. 아미노산은 일반적으로 백색 분말로 정제된다.

아미노산의 종류
아미노산은 대략 5개에서 6개 정도의 그룹으로 묵이는데, 가장 큰 분류는 얼마나 기름기가 많은가  적은가를 나타내는 기름기지수(hydrophobicity)이다. 기름기가 많은 아미노산과 물기가 많은 아미노산이 대략  반반적도 섞이면, 안정된 단백질 구조가 나온다. 그래서, 단백질은 일종의 물반 기름반의 고체반 액체반인 애매한(미묘한) 분자이다. 단백질(protein)을 구성하는 아미노산의 거의 대부분은 L-아미노산 형태로 존재한다. 청자고둥(cone snail)같은 일부 특이한 바다생물에서 D-아미노산이 발견되기도 했다. 단백질은 아미노산의 축합중합을 통해 만들어진다.

약자이름곁사슬 성질질량Isoelectric point비고
A Ala 알라닌(Alanine) 소수성 89.09 6.11
C Cys 시스테인(Cysteine) 친수성 121.16 5.05 Two cysteines can form a disulfide bond.
D Asp 아스파르트산(Aspartic acid) 산성 133.10 2.85
E Glu 글루탐산(Glutamic acid) 산성 147.13 3.15
F Phe 페닐알라닌(Phenylalanine) 소수성 165.19 5.49
G Gly 글라이신(Glycine) 친수성 75.07 6.06 α-탄소에 두 개의 수소가 붙어 있기 때문에, 광학 이성질체를 갖지 않는다.
H His 히스티딘(Histidine) 염기성 155.16 7.60
I Ile 아이소루신(Isoleucine) 소수성 131.17 6.05
K Lys 라이신(Lysine) 염기성 146.19 9.60
L Leu 루신(Leucine) 소수성 131.17 6.01
M Met 메싸이오닌(Methionine) 소수성 149.21 5.74
N Asn 아스파라젼(Asparagine) 친수성 132.12 5.41
P Pro 프롤린(Proline) 소수성 115.13 6.30 Can disrupt protein folding structures like α helix or β sheet.
Q Gln 글루타민(Glutamine) 친수성 146.15 5.65
R Arg 아르져닌(Arginine) 염기성 174.20 10.76
S Ser 시어린(Serine) 친수성 105.09 5.68
T Thr 쓰레오닌(Threonine) 친수성 119.12 5.60
V Val 발린(Valine) 소수성 117.15 6.00
W Trp 트립토판(Tryptophan) 소수성 204.23 5.89
Y Tyr 타이로신(Tyrosine) 친수성 181.19 5.64

Amino acids chemical rep.png

아미노산종족간의 호환성 (Amino acid group substitition)
대략  5-6개의 아미노산의 종족들은 서로 호환성을 갖는다. 그 호환성은 단백질의 내부에 주로 나타나는 아미노산과 외부 표면에 주로 나타나는 아미노산으로 구분을 할수도 있는데, 아래의 그림은 그러한 호환성를 연구한 독일의 패트릭 아고스 연구실의 JMB논문이다. 이런 호환성을 표로 만들면, 단백질의 진화에서 단백질들간의 상동성을 측정할수 있고, 그에 따라 단백질 서열의 정렬이라는 중요한 생정보학 방법이 가능하다.
Substitution group table 20060305.png


아미노산의 곁사슬/치환기(Amino acid R group)
아미노산의 치환기가 아미노산과 단백질의 구조의 다양성과 기능을 결정한다. 3차원 단백질은 치환기들이 서로 어떻게 상호작용하는가의 함수라고 할수 있다. 생정보학에서는 이런 치환기의 회전각도를 분석하여, 그 통계적 수치를 표로 작성하는 연구를 많이 한다.

필수아미노산 (Essential Amino acids)
22종의 주요 아미노산 중 체내에서 합성이 안 되고 음식을 통해서 섭취 해야 하는 필수아미노산은, 어른의 경우 발린(Valine) ·루신(Leucine) ·아이소류신(Isoleucine) ·메싸이오닌(Methionine) ·쓰레오닌(Threocine) ·라이신(Lysine) ·페닐알라닌(Phenylalanine) ·트립토판(Tryptophane)이고, 유아는 여기에다 히스티딘(Histidine)이 필수이며, 기타는 비필수아미노산이다. 비필수아미노산은 아미노기전이효소(transaminase)에 의해서 체내에서 필수아미노산으로부터 합성할 수 있으나, 글루타민(Glutamine) ·아스파라젼(Asparagine) ·알라닌(Alanine) ·프롤린(Proline) 등의 비필수 아미노산은 훨씬 용이하게 아미노기전이반응이 일어나서 다른 비필수아미노산을 합성할 수 있다. 

최초 발견된 아미노산 (First amino acid discovered: Asparagine)
가장 처음 발견된 아미노산은 아스파라젼으로 1806년 프랑스의 과학자 보클 랭과 로비케가 아스파라거스의 싹에서 새로운 결정을 분리시켜, 이것을 아스파라젼이라고 명명하였다. 단백질의 가수분해물에서 처음으로 아미노산을 분리시킨 사람은 브라코노이다. 그는 1820년 아교 ·고기 ·양털 등을 황산으로 분해하여, 아교로부터는 글라이신을, 고기와 양털로 부터는 루신(Leucine0을 단리시켰다.  그 후, 1935년 W.C.로즈의 쓰레오닌(Threonine) 발견에 이르기까지 약 100년에 걸쳐 22종의 주요 아미노산이 발견되었다. 이 밖에도 자연계로부터는 펩티드와 특수한 단백질의 구성성분으로서 각종 아미노산이 발견됨으로써 그 수는 현재 80종 이상에 이르고 있다. 


아미노산의 구조
3차원 아미노산의 구조는 매우 중요한 생정보학의 시발점이므로, 그것들을 외워두어야한다. 예를 들면, 라이신(Lysine)은 긴 CH 뼈대위에 NH2 기가 붙어 있다. 아래에 아미노산들의 3차원 구조를 보여준다.

Glycine jong small.png
Alanine jong small.png

Valine jong small.png
Isoleucine jong small.png

Leucine jong small.png
Methionine jong small.png

Serine jong small.png
Threonine jong small.png

Proline jong small.png
Aspartate jong small.png

Asparagine jong small.png
Lysine jong small.png

Histidine jong small.png
Arginine jong small.png

Phenylalanine jong small.png
Cysteine jong small.png

Tyrosine jong small.png
Glutamate jong small.png



생정보학책







Amino Acids: the information processing unit of proteins. There are at least 20 major basic amino acid types for living organisms. These are tetrahedral molecules with a central alpha carbon. Hydrogen, COOH group, NH3 and a side chain group (R) are around the alpha carbon. As they are tetrahedral they have mirror image molecules called D type amino acids. Nature chose L type alpha amino acids. They can be grouped into 4 or 5 different types according to some typical criteria. Bioinformatically, they are just a set of characters ( ACDEFGHIKLMNPQRSTVWY ). A protein is represented by these amino acid units such as: >AAF86908. glucose-6P/phosph...[gi:9295277] 1 mittlkqpti sfsnpdvlrk kfqvptsqfa sfaplirrks dlliqkplhv ssvkglgfgl 61 gdgllrerkp likceayead gsepikpepv pvpipgeaar kvkigiyfav wwalnvvfni 121 ynkkvlnafp ypwltstlsl amgslimvvs watriaeapn tdsdfwkall pvavahtigh 181 vaatvsmskv avsfthiiks aepafsvlvs rfflgesfaa gvywslvpii ggcalaavte 241 lnfnmigfmg amisnlafvf rnifskkgmk gksvsgmnyy aclsilslvl ltpfalyveg 301 pkmwaagwdk avsdigsnfi wwltaqsvfy hlynqvsyms ldeispltfs igntmkrisv 361 ivssiiifrt pvqpvnalga aiavfgtfly sqakq The above sequence as chosen randomly from http://www.ncbi.nlm.nih.gov/ For bioinformatist, the above string representation of protein is sufficient and the following chemical representations of amino acids and proteins would not be usually necessary. As you see, there can be infinite number of different ways of representing proteins. A good representation to a problem can reduce the work, we will look at some major ways of doing it. The following figure 1 shows the chemical representation of amino acids. Figure 1. IUPAC (The IUPAC (International Union of Pure and Applied Chemistry) chemical representations of aminio acids. We do not usually need these complex of representation in bioinformatics. Figure 2. shows the chemical structures of 20 amino acids (from wikipedia.org). It is important to know the rough characteristics of amino acids for common bioinformatics projects. The 20 amino acids are coded by 3 bases of DNA. Codon Table: The codon table shown in Table 1. summarizes it. The genetic code is fairly standard and many organisms use the same codon translation tables. The positions of the bases have slightly different weight on how they affect the final amino acid. The 3rd base has the least effect and called it is degenerate (wobble). For example, GAC and GAU both code for aspartic acid (Aspartate). Some amino acid such as Leucine is coded by 6 codons while some are coded only by two codons. This implies some bias in the amount of amino acids present in proteins. Leucine is common while Tryptophan is rare. Table 1. The codon table. RNA (DNA) UUU codes for phenylalanine (F). Figure 2. The chemical structures of 20 amino acids for proteins.

 

Personal tools
Google AdSense