有個同學問,他表格中有一條DNA,其中一條的堿基序列,如ATTAGACC....如何快速将它的另外一條序列計算出來呢?
那首先我們要拿起初中生物學的關于基因的知識,兩個序列是一一對應的,對應關系是A-T,C-G,也就是說,ATTAGACC...,對應的堿基序列應該是TAATCTGG...
這是在基因中的正好對應,碰到這種類似的經典問題,那如何在Excel中快速的計算?大家集思廣益,小編這裡提供兩種解決思路的方法。
第一種思路,先分列,再合并
❶在B2單元格中輸入公式:=MID($A$1,COLUMN(A1),1),向右填充,直至每一個字母占據一個單元格,如下所示:
❷然後我們用IF函數進行判斷,
在D2單元格中輸入=IF(B1="A","T",IF(B1="T","A",IF(B1="C","G","C"))),然後向右填充,如下所示:
❸複制B2至W2的内容,粘貼為數值,将公式去除掉
❹然後在B2單元格中輸入公式:=PHONETIC(B2:W2)
第2種思路,查找替換法
❶将序列中的A堿基替換成數字Z,使用公式:=SUBSTITUTE(A1,"A","Z")
❷然後将所有的T換成A,在前面的公式中再嵌套一個查找替換公式:=SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A")
❸然後将所有的Z換成T,在前面公式再嵌套一個
=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A"),"Z","T")
通過這三輪的轉換把A和T已經進行了互換,用同樣的方法将C和G進行互換
❹然後将所有的C替換成N,将所有的G替換成C,将所有的N替換成G即可完成,整體公式為:
=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A"),"Z","T"),"C","N"),"G","C"),"N","G")
本節完,關鍵是對于思路的理解,公式的其它技巧是用來輔助思路完成的
給堅持學習的自己點個贊和分享吧
----------------------
歡迎關注,更多精彩内容持續更新中....
,