以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 生物信息学 』   (http://bbs.xml.org.cn/list.asp?boardid=46)
----  基因四进位制  (http://bbs.xml.org.cn/dispbbs.asp?boardid=46&rootid=&id=17466)


--  作者:luantan100
--  发布时间:4/25/2005 10:56:00 PM

--  基因四进位制
基因四进位制与广义信息进位制定律

邓  宇    
100016  清华大学第一附属医院


当我们把事和物同信息、符号联系起来时,碰到的信息会越来越大,宛如原子弹级的信息大爆炸。如果在这种联系过程中,只用我们的手指头,那么数到“十”这个数,我们也就悬崖到头,无法再数下去了,即使象古代墨西哥尤里卡坦的玛雅人把脚趾也用上,也只不过就能数到二十。当我们把生命、基因同信息联系起来时,碰到的问题就会更大。我们显然知道,数是可以从0,1,…无穷无尽地写下去的,因此,我们必须把数的概念从实物的世界中解放出来,抽象地研究如何表示它们,如何对它们进行运算——这就是数学这样的学科。这是从小到大、从简单到复杂,从局部到整体的与生命科学相比而言,相对容易的发现、发明的科学革命历史进程。
生命、基因正相反,他是从巨到大,从大还没有到小,…!从复杂的混沌,没能到简单的非线性(如,再简单不过的一元的非线性决定论动力学迭代式,生成、输出难料的复杂混沌分形的乱果(表面化的非决定论、假随机的结果));从无穷无尽向 …,2,1,0的倒序写下去——近代生命科学,基因学科的时髦主流——实验的生物信息学。现在,正是我们必须把生命、基因的概念从实物的、归纳的另一个世界中解放革命出来,抽象地、理论地研究它们,即如何表示它们,如何对它们进行运算,想象、预测,开拓他们的时候了。这也有赖广义信息的守恒定律、信息的化学变化、信息的运算律,信息是事物现象属性标识的集合——信息新实质定义[1~13]等新广义信息论的前瞻铺垫。这就是已不算新鲜但还稚嫩的理论生物学,及新生的理论生命信息学——演绎的广义基因信息论,广义抽象,基因的数学、符号学、信息学。从0,1,…;A,G,T,C向AA,AG,…,AAA,AAG,…,AAA…A(n个),CCC…C(n位),类似无穷无尽经典数学的发现历程前行。

1 基因进位制  基因四进制
基因组份的基本单元碱基,核酸有4个:A,G,T,C。以他们为基,相当于1,2,3,4或A,B,C,D的4进位制。这4个核酸组成了他们的“个位”信息符——第1位,n=1。这里特别关注碱基的纵向长单链基因字符系的排布规律,是我们理论生物信息论的突破口之一,这是与已很明确的横向短碱基对AT,GC的重要区别。
当基因信息符或语义元超过4个,第5个时,逢4进一,进位到第2位(相当于十进制的十位):有AA,AG,AT,AC;GA,GG,…,CC。4×4=16个两两的排列组合,两位的基因核酸,即基因组在第2位有16个可能的基因符的排列组合。基因4进制的头两位共有4+16=20个信息符,n=2。
当基因信息符超过20个时,接着“逢四进一”向第三位进位:AAA,AAG,…,CCC。三位基因核酸共有4×4×4=64个组员,n=3。…。
在第4位,有AAAA,AAAG,AAAT,AAAC,AAGA,…,GAAA,…,CCCT,CCCC。第4位基因小组有44=256个核酸字符组成。
在第n位时,有4n个位元AA…A,AA…G,…,T…A…G…C,CC…C
└ n ┘ └ n ┘     └──n──┘└n个┘
└──────── 4n 个 ────────┘

2 广义信息进位制
2.1符号进位制——k进制  固定一种符号序列,命或定义其为A,B,C,…,K,有k个符号,并构成符号系的第1位。“逢k进一”,构造出,第2位,第3位,….,第n位。与数系的进位制类似,有符号二进位制,三进制,四进制,五进制(五行)等。符号的二进制有序列,个位A,B。三进制:A,B,C系列等(基因纵、横的综合)。
2.2  语义进位制  若有基本语义元a1,a2,a3,…,ai,…ak,k个。则有语义元k阶进位制,“逢k进1位”,从第一位到第N位有语义序列
a1,a2,a3,…,ai,…ak,a1a1, a1a2,…,aiaj,…,akak, a1a1a1,…, akak ak,…
└─第1位─┘ └── 第2位 ──┘└─第3位─┘ …
2.3 数系进位制  最常见和常用,如自然数、实数等数学数系中的二进制、十进制、十二进制、十六进制、六十进制,还有效率高的三进制等,大家很熟悉,不一一列举了。
2.4 基因进位制  即基因的四个基本单元A,G,T,C,构造出基因的四进制Quaternary system。物理进位,化学进位制。上述进位制多是物理性的,类似数系的进位制——广义符号进位制,多是简单的加法样运算或物理合成,合并。广义语义进位制可以有化学样的语义合成“化合”。
2.5 广义信息进位制  包括广义语义进位制、广义符号进位制等。有了信息进位制对“语义秩序定量法”也带来益处。符号序列可以有多种排列组合方式,固定一种或命或定义符号序列A1,A2,A3,…,AK,有k个基,则广义进位制,或信息k进位制,有:A1,A2,…,AK,A1A1, A1A2,…,AK AK,…,A1A2…AK(n位),…
一般来说,如果采用k进位制,就在下角处注k.例如AGC(k)表示AGC是在k进位制中的数符。规则律:在k进位制中,一定有:1.它有k个不同的信息(字符)基符号,即:A1,A2,A3,…,AK;2.它是“逢k进一”,即每位计满k后向高位进一,一个k进制正整符号L总可以写成 L=An×kn-1+An-1×kn-2+…+A1×k+A0。例如ATGCGT(4)=A×45+T×44+G×43+C×42+G×4+T×40。
一个k进位制的符号就是各位符号与k的方幂的乘积的和,其中幂指数等于相差符号所在位数(从右往左数)减1。
数学数系的进位制,与符号,基因的进位制正是“信息守恒定律[1,2,6,7]”的体现转换。就连原来不守恒的paradox霍金量子旧黑洞论,也被修正的霍金新黑洞实质“信息守恒”自己更正,黑洞信息都守恒,广义信息更守恒、不灭。
正象《中国新闻周刊》文章所说:“(旧的霍金黑洞论)这种理论从诞生之初就遇到了麻烦:它同很多科学家坚持的“信息守恒定律”互为矛盾。这一度被人们称为“黑洞悖论””。
“如同19世纪的科学家断定了能量守恒定律一样,20世纪的许多科学家提出了信息守恒一说——假如这个说法成立,那么“信息守恒定律”无疑将成为科学界最为重要的定律,也许比物质、能量守恒定律的意义更为深远。霍金的黑洞理论引起的激烈争执就是“信息”在黑洞中是否能够保存、守恒”。但他:Hawking不知是否已经意识到。在他的黑洞之外的“生命科学”的黑洞中,信息也正被撕碎,(被整理)被释放出:新生命的生物信息(理论),to be preserved,理论DAN信息论正在顽强坚韧地破土、发芽。自然科学、社会学,生命科学,人本文化的“信息守恒定律”——新的广义信息论已经启动[8~13]。
基因进位制的创立,为基因之迷的解惑提供了新的思路和方向,扩展开拓了生命科学,基因、蛋白组新领域。它是生命信息论的新思维,揭示基因奥秘的革命。它可以对基因组进行新的计量,新前景,新演绎。是解开基因编码迷团,理论基因符、基因词、基因句、基因段、…基因序列新途径的突破,新的期待。是非共识、预见外、计划外、不跟风的基础研究,“源头创新”,原始创造,开启了方便之门,如基因碱基序列分布轨迹的正弦、余弦的三角函数周期拟合等(将发表)。Gene bank要忙了,新活已经来了——理论基因学、理论生物信息论!

参考文献
1. 邓宇,生物-非生物界的信息守恒律与双大超循环世界图景,数理医药学杂志,2000,13(1):88~89
2. 邓宇,信息守恒的证明,中华医药杂志,2004, 4(6):36
3. 邓宇,量子论新诠释的数字实验模拟,中华医学研究,2004,64(3):30~31
4. 邓宇,信息的化学变化,中华医药杂志,2004,4(6):576
5. 邓宇,信息的数理新定义与广义信息运算,中华中西医学杂志,2004,2(7):115~116
6. 邓宇,信息守恒律与信息实质定义,中华医学荟萃,2003,3(4):1~2
7. 邓宇,信息-能量-物质的转换大守恒大统一,中华中西医学杂志,2004,2(9):116~118
8. 邓宇,被遗忘的中医哲学观第三元素:相似观分形论,中华医学荟萃杂志,2003,3(8):78~80
9. 邓宇,生命起源进化的高概率事件,数理医药学杂志,2001,14(5):446~447
10. 邓宇,“细胞群-自身调节-体液-神经协同”的经络实质模型:细胞社会学经络,中华医药学杂志,2003,2(8):23~25
11. 邓宇,生物信号转导的数理化质变模型,中华医药学杂志,2003,2(4):97~99
12. 邓宇,中医气的现代实质与气的定量:气集、气元,数理医药学杂志,2003,16(4):346~347
13. 邓宇,医院盈亏分析两点法的特点与对策,中华现代医院管理杂志,2004,2(5):64~65


--  作者:luantan100
--  发布时间:4/26/2005 8:25:00 AM

--  
实化的基因碱基四进制的系统小舒。
--  作者:luantan100
--  发布时间:4/26/2005 9:32:00 AM

--  
来自《中华新医学》2005,6(7):832-834
--  作者:zhaoming
--  发布时间:4/26/2005 4:13:00 PM

--  


--  作者:eyounx
--  发布时间:4/26/2005 5:54:00 PM

--  
无聊的人真是多
--  作者:luantan100
--  发布时间:5/3/2005 11:40:00 PM

--  
"参加全国数模竞赛拿了一等奖"得主,正如诺奖得主老丁等所说,拿诺奖的没有考试第一的!!!!
没戏了,这辈子,前冠军,程序匠!太有聊了
--  作者:luantan100
--  发布时间:6/16/2005 9:20:00 PM

--  
解读四进制与生物计算机

【编者按】

  二进制,对接触过计算机的人来说应该不陌生。但何谓四进制?四进制又与生物计算机有什么关系?让我们一起走进四进制的世界...


  二进制,对接触过计算机的人来说应该不陌生。但何谓四进制?四进制又与生物计算机有什么关系?

  因为我们有十个手指,所以日常生活中常用的运算方法是十进制,也就是以十为基数,逢十进一;二进制则是以二为基数,逢二进一,数字完全用0与1来表示,如十进制3可表示成11;而四进制以四为基数,逢四进一,如十进制3可表示成3,7可表示成13。

  计算机之所以采用二进制,是因为其运算单元,不管是以前的电子管,或是现在的集成电路,都只有两个状态:“有电流”和“没有电流”。有电流通过的运算单元被视为1,没电流通过的被视为0。如果依序查看计算机中的运算单元,就会得到一大串0和1的组合。这一大串数字经过电脑的排列组合及筛选后,就构成了现在使用的计算机系统。

  如果计算机采用了四进制会有什么好处?其中,最大的好处是能立即节省一半的运算单元,并能提高系统的整体运算速度。如果某台电脑需要二十万个运算单元,在采用了四进制后,只需十万个运算单元就能发挥相同的效果。

  相对于电子计算机,生物电脑的运算元件绝对不可能是集成电路或电子管这些与生物特性完全不相干的东西,就像DNA计算机,其本身依靠DNA中的A、T、G、C四个独立碱基构成,先天性的形成了一个四进制组合,这与目前半导体开合动作所形成的二进制一样。事实上,目前最可能成为生物计算机运算单元的,也就是DNA或RNA(核糖核酸)。

  当然,生物电脑仍存在很难突破的瓶颈。仅以运算元件来说,DNA或RNA分子的控制毕竟不如集成电路容易,况且是控制数以十万、百万计的DNA或RNA分子,更别提如何辨别这些分子。不过,正如当年的核融合技术在真正实现以前也曾遭遇过种种困难,最终在海森堡、欧本海默、费曼等物理学家的努力下还是取得了成功一样,待生物科技成熟后,相信生物电脑必然也将成功。


--  作者:luantan100
--  发布时间:6/16/2005 9:38:00 PM

--  
"当我们把事和物同信息、符号联系起来时,碰到的信息会越来越大,宛如原子弹级的信息大爆炸。如果在这种联系过程中,只用我们的手指头,那么数到“十”这个数,我们也就悬崖到头,无法再数下去了,即使象古代墨西哥尤里卡坦的玛雅人把脚趾也用上,也只不过就能数到二十。当我们把生命、基因同信息联系起来时,碰到的问题就会更大。我们显然知道,数是可以从0,1,…无穷无尽地写下去的,因此,我们必须把数的概念从实物的世界中解放出来,抽象地研究如何表示它们,如何对它们进行运算——这就是数学这样的学科。这是从小到大、从简单到复杂,从局部到整体的与生命科学相比而言,相对容易的发现、发明的科学革命历史进程。"


"因为我们有十个手指,所以日常生活中常用的运算方法是十进制,也就是以十为基数,逢十进一;二进制......"

有点眼熟。


--  作者:binaryluo
--  发布时间:6/17/2005 11:15:00 PM

--  
真长见识啊:)
--  作者:luantan100
--  发布时间:6/26/2005 7:41:00 PM

--  

信息的数理新定义与广义信息运算

邓宇  等
清华大学第一附属医院 100016

关键词  信息定义   信息定序   信息的化学变化   语义定序   语义信息

Shannon的经典信息理论对信息统计的定义、信息量的计算是纯数字、数量比特的运算,对语义确爱莫难助。属于两难:一是信息定义没有语义属性的本质的表述;再一就是语义、属性信息数理的比较定量(定序=定量)的疑难。在先期我们新给出的信息属性语义类定义之后又尝试给出该定义的数理表述及运算。

1. 信息新定义
根据我们新提出的信息实质新定义[]:信息是事物现象(事体、事件)属性标识的集合。可以给出信息数理新定义。
信息数理定义:若事体T(事物现象)有属性
          A={a1,a2,…,ana},
且属性的标识,或属性可标记为
          S={s1,s2,….,sns},
则集合
          M={m1,m2,…,mn},
被称为是事体T的信息(集合)。
这属性是广义的属性,比如包括该事物现象的组分特性C、关系特性R、规律特点L等。事件,属性、标记、信息间有
映射A®S,S®M;映象  M®S,S®A。
其属性语义数理定义的推出,及相应信息演算的信息质的运算,信息数的计算。广义信息运算。
  
2. 信息运算:是信息的信息运算或信息的语义运算。还有信息的符号运算。类似集合的代数运算,部分矩阵的运算方式。符号演算,语义运算(信息的化学变化),有信息运算的定义,由两个信息集A,B和另一个信息集C。
定义:一个A☻B到C的映射(反应)叫做一个A☻B到C的信息运算。
A☻B,运算符a☺b. åA☻B=åC,åa☺b=åc.
通式,åA=åB。有物理性的运算,如合成,还有化学性的运算,如化合,即信息的化学变化。
描写信息运算的符号,因信息有人性化和语义的内涵,故选择人性化的笑脸☺做他的运算演算符号,传统的映射表示为
☺:  (a,b)→c=☺(a,b)
☺(a,b)完全是一个符号,简便化后写成,a☺b,而不写成☺(a,b)
    ☺:   (a,b)→c=a☺b

2.1. 信息加法:相当于信息的合成或化合,既信息的创造。对于信息集A,B,C,AB,或信元a,b,c,ab,有信息加法
A+B=C
或A+B=AB,a+b=c,a+b=ab。一般情况下,C=AB,c=ab,属于语义或信息的化学合成,或信息语义的集成性创造、二次创新、增量创新。在信息或语义的原始创新下,常常有C>AB,c>ab,的源头创新、一次创新,既信息语义创造的首次创造或首次发现。如,信息+化学变化=信息的化学变化,化学+信息=化学信息,信息的化学变化≠化学信息,比物质的化学信息更广义。通常a☺b≠b☺a,特殊情况下也有a☺b=b☺a;事或物质的属性+标识=信息,事或物质的属性+标识≠物质!信息的算术(加法)创造。
对集合是加,对集合中的元素是排列组合样的加法,即信息集中,行矩阵与列矩阵信元相乘的积。
2.2. 信息减法:
C-A=B,
或AB-A=B,C-B=A,c-a=b,c-b=a,ab-a=b,ab-b=a, AB-B=A类似信息化学变化的消元,分解,复分解法等。特别的,信息减法的创造C-A=c,C∩(AB)’=C,C∩A’=C,(AB)’ 是AB的非、补集。A’,A的补集。C是信息的创造集或意外集,是出乎AB集意料之外的新的创意、创造、创新集。

2.3. 信息乘法(除法),放大,缩微。信息数字乘法。矩阵乘法AB={}其中,列矩阵与行矩阵的积。从符号元角度,意外新奇变化不多,其语义会有奇异的变换,生成。信息的指数运算。数字信息乘,信息信息乘。k×M,A☻B=A×B。信息的数字乘,往往是信息信号的放大,或拷贝复制,是物理性的扩大,无信息语义的本质变化,理论上说。若噪音巨长,可以改变原信息、语义,出错误的奇异的变种信息。信息的信息乘有信息自身或语义的新扩张,即信息或语义的几何创造,爆炸创新。
2.4. 信息数字除
信息乘法的逆运算,有数字除,信息除。信息的数字除,是物理性的信息信号、符号的缩小,语义不变。化学样的信息转导(乘法里也有),基因信息的遗传,与表达。缩微映象。
2.5. 信息的逆,信息的补,超补——创新集Ac
信元a有单位元e,及a的逆a-1,有a-1a=e。在信息的全集合中有,1-A=A’,特别的信息集又有1-(A+A’)=Ac,称A’是A的补集;Ac是全集(A+A’)的超级补集,不妨称为创新集。

见《中华医药杂志》将发表的“信息的化学变化:广义信息间的化学样反应(模式)”。

3. 语义定序定量:语义定量难度,语义定量的停止,广义信息论的桎梏。同义息、近义息、反义息(同义词、反义词、近义词)。升序,或降序的排列定序(定量),序权重、序编号。语义上的次序。语义秩,秩参量。语义度量。
4. 信息集的运算(信元运算)
物质的化学变化:是物质的分子组成、性质(分子)结构、等方面发生的变化。化学反应:物质发生化学变化而产生性质、成分、结构与原来不同的新物质的过程。化合:两种或多种(两种以上)物质经过化学反应而形成的新的物质。信息式:用信息符号表示各种信息的信息元组成的式子。物理变化:物质只改变形态不改变化学成分的变化。
5. 信息的化学变化:是有新信息创造或新语义产生的变化。即信息的内容、内涵、语义(元)、标识等发生的本质(根本)变化。信息的物理变化:信息的形式发生改变,但信息的内容、内涵、语义等没有发生变化的变化。信息的化合:两种或多种信息经过信息的化学样反应而形成新的信息。不确定度的减少。信息的合成,有物理合成,和化学合成(化合)两种。物理合成就是两或多种信息(语义)的简单加和、组合、合并,其内容、语义、标记无本质变化,即与原信息无根本的超越和区别,A+B=C=AB,即1+1=2,而不是1+1=3。信息的化学合成,简称信息化合:两种或多种(两种以上)信息经过化学样反应而形成的新的信息。A+B=C≠AB,即1+1=3的新、离奇创造。


参考文献
1. 张禾瑞,近世代数基础,高等教育出版社,1991。
2. 张家龙,公理学、元数学与哲学,上海人民出版社,1983。
3. 邓宇,信息守恒律与信息实质定义,中华医学荟萃杂志,
4. 邓宇,中医气广义量子波,数理医药学杂志,
5. 邓宇,生物-非生物界的信息守恒律与超大双循环世界图景,数理医药学杂志。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
74.219ms