现代的程序语言都是由英文字母编写,碱基序列更像汉字中的偏旁部首,腺嘌呤、鸟嘌呤、胞嘧啶、腺嘧啶、胸腺嘧啶五种不同碱基按一定规则反复排列,就形成了一个个功能不同的基因。
不同的基因不仅是遗传编码,还是包含细胞制造对应蛋白质的原始模具,按照这个模具就可以找到一个个不同功能的氨基酸,将氨基酸拼接成肽链,肽链拼接到一起就组成了功能不同,种类繁多的蛋白质,这些不同功能的蛋白质就是组成地球生物的最主要材料。
基因就是按照一定规则编码的碱基序列组合,基因的长度可以有很大的变化,最小的由几十个碱基对组成,最大的可以包含超过二百万碱基对。
人类基因的平均长度约为两万七千个碱基对,短的几百,长的过百万。
细菌的基因相对的都比较短,平均只有一千个碱基对,当然也会有少数很长的基因。
基因中的碱基序列通常分为两大部分,编码区和非编码区。
编码区的长度从几十个碱基对到几千个碱基对不等,主要作用就是定义组成蛋白质的氨基酸序列,就是蛋白质生产的模板。
非编码区包含的就是基因中编码区以外的部分,包括多种功能调控元件,如启动子、增强子、沉默子、终止子、内含子等等,这些元件在基因表达的调控中起着关键作用。
高级生物的基因序列很长,主要原因就是多细胞生物体组织结构复杂,非编码区需要编写复杂的功能组件,设定基因表达的各种条件,在需要的时刻启动编码中的蛋白质制造。
细菌只有一个细胞,组织结构简单,主要依靠强大的繁殖能力和庞大的群体适应性生存,因此基因非编码区都比较简单。
人类这样的高级动物漫长的进化历史中,很多过去有用的基因功能因为不适应当时的环境都沉默了,但是遗传物质中仍然传承着过去的那些碱基序列,两万五千多基因中,当前能识别出来的只有两万左右,三亿多碱基对中有大量都是无效的碱基。
曾凡的目标是改造出一种特殊的菌群,可以在血液中生存,进入心脏后自动驻留,靠群体功能检测心脏的缺陷或者畸形部位,进入心肌细胞内部,自动释放相应催化酶,催化缺陷部位的心肌细胞定向增殖发育,增生部位的细胞自动收缩或者启动凋亡程序,达到治疗的目的。
这种细菌自身的结构不需要太复杂,体积也不需要太大,但是遗传物质中要包含这些心肌细胞催化酶的基因,还要有能检测心脏缺陷的基因,这些基因都要有复杂的非编码功能区,曾凡想要实现的检测和治疗的目的要靠这些精确调控完成。
单一的订制细菌很难完成这么复杂的任务,曾凡采用的同样是分布式方案,整个菌群分工协作来完成任务,即便个别细菌损失或者失败,也不影响任务整体进度。
按照一个软件需求来定义功能,曾凡有了这段时间治疗上百例先天心脏病的经验,实现这部分功能的编码并不难,真正难的是把碱基对按照他设定的顺序重新排列。