以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 生物信息学 』   (http://bbs.xml.org.cn/list.asp?boardid=46)
----  [合集]有人做过这方面的工作?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=46&rootid=&id=10452)


--  作者:admin
--  发布时间:9/23/2004 2:05:00 AM

--  [合集]有人做过这方面的工作?


[合集]有人做过这方面的工作?           


发信人: kingsyl (Molecular Machine To Be Studied), 信区: Bioinformatics
标  题: [合集]有人做过这方面的工作?
发信站: 北大未名站 (2004年03月21日20:18:38 星期天), 站内信件

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  有人做过这方面的工作么                                                 
时间  北大未名站 (2003年10月14日13:08:37 星期二), 转信                       
───────────────────────────────────────
预测一段生物体内的序列能否折叠. 近来看swissprot的时候发现有不少序列看起来是没
有结构的样子, 比如:
ARYRCCRSKSRSRCRRRRRRCRRRRRRCCRRRRRRCCRRRRSYTFRCKRY

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:10:07 星期二), 转信                       
───────────────────────────────────────
no. but sounds interesting

how do you determine 'those sequences have no structure'. what exactly do
you mean

【 在 lazy (draughts) 的大作中提到: 】
: 预测一段生物体内的序列能否折叠. 近来看swissprot的时候发现有不少序列看起来是没
: 有结构的样子, 比如:
: ARYRCCRSKSRSRCRRRRRRCRRRRRRCCRRRRRRCCRRRRSYTFRCKRY

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:12:52 星期二), 转信                       
───────────────────────────────────────
我只是觉得那样的序列不像有结构. 而且生物体内本来也有很多多肽序列是没有稳定结构
的.
【 在 yix (Punk) 的大作中提到: 】
: no. but sounds interesting
: how do you determine 'those sequences have no structure'. what exactly do
: you mean

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:15:29 星期二), 转信                       
───────────────────────────────────────
i know some proteins will have a partially unfolded fragment. not sure
whether people look at this in a large scale before.

the sequence u pasted looks weird. so ARG-rich.

【 在 lazy (draughts) 的大作中提到: 】
: 我只是觉得那样的序列不像有结构. 而且生物体内本来也有很多多肽序列是没有稳定结构
: 的.

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:18:11 星期二), 转信                       
───────────────────────────────────────
【 在 yix (Punk) 的大作中提到: 】
: i know some proteins will have a partially unfolded fragment. not sure
: whether people look at this in a large scale before.
: the sequence u pasted looks weird. so ARG-rich.
nod, 我统计序列中的短串出现频率发现的, 而且swissprot里面很多序列都有一小段
序列重复出现多次的现象, 这不太像是一个有稳定结构的蛋白的样子

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:20:23 星期二), 转信                       
───────────────────────────────────────
but i just did a quick search. it seems that arg-rich RNA binding
peptides is a fold in SCOP.

check scop.b.ba.j.c.b.b

【 在 lazy (draughts) 的大作中提到: 】
: nod, 我统计序列中的短串出现频率发现的, 而且swissprot里面很多序列都有一小段
: 序列重复出现多次的现象, 这不太像是一个有稳定结构的蛋白的样子

───────────────────────────────────────
作者  kingsyl (苦学中,勿扰!-_-~谢谢), 信区: Bioinformatics                 
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:28:18 星期二), 站内信件                   
───────────────────────────────────────
有结构的蛋白质序列 同一安基酸相邻重复的情形比较少。
对所有的PDB进行统计
AAAAA有3个
RRRR 有1个
GGGG 有5个
CCCC 有0个
LLLL 有6个
SSSS 有8个
TTTT 有3个
KKKK 有4个
EEEE 有4个
QQQQ 有0个
PPPP 有1个
其它的只有连续在3个或者3个以下的。4个或者4个以上的有结构的目前情况如上。

【 在 lazy (draughts) 的大作中提到: 】
: nod, 我统计序列中的短串出现频率发现的, 而且swissprot里面很多序列都有一小段
: 序列重复出现多次的现象, 这不太像是一个有稳定结构的蛋白的样子

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:28:23 星期二), 转信                       
───────────────────────────────────────
hehe. what kind of short fragment are you looking for?
most of the time i think this kind of work is boring and uninteresting
but if u specifically look for some biological relevant short sequencces
you might have interesting result to write a paper

i remembered seeing MarkGerstein had a paper in genome biology, looking
for NQ rich region in six complete proteomes. NQ-rich has been known
to have some association with prion and amyloid formation.

just out of curiosity: have u looked for regions that are highly
aromatic residue rich? some one was saying pi-pi stacking provides
way to help amyloid formation, but no one has looked at this on a
genome scale yet.

【 在 lazy (draughts) 的大作中提到: 】
: nod, 我统计序列中的短串出现频率发现的, 而且swissprot里面很多序列都有一小段
: 序列重复出现多次的现象, 这不太像是一个有稳定结构的蛋白的样子

───────────────────────────────────────
作者  kingsyl (苦学中,勿扰!-_-~谢谢), 信区: Bioinformatics                 
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:32:30 星期二), 站内信件                   
───────────────────────────────────────
也许真是重复的安基酸多了 就难以生成稳定的结构。 如果能够找倒原因,当然是一个发
现啊。
【 在 lazy (draughts) 的大作中提到: 】
: 预测一段生物体内的序列能否折叠. 近来看swissprot的时候发现有不少序列看起来是没
: 有结构的样子, 比如:
: ARYRCCRSKSRSRCRRRRRRCRRRRRRCCRRRRRRCCRRRRSYTFRCKRY

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:33:59 星期二), 转信                       
───────────────────────────────────────
我本来的意思是想统计看看目前已知球蛋白中对3或者4个短串的出现频率, 看看是否有
没有什么偏好性或者刻意避免出现的东西, 然后看看能否作为知识应用到序列设计里面去
【 在 yix (Punk) 的大作中提到: 】
: hehe. what kind of short fragment are you looking for?
: most of the time i think this kind of work is boring and uninteresting
: but if u specifically look for some biological relevant short sequencces
: you might have interesting result to write a paper
: i remembered seeing MarkGerstein had a paper in genome biology, looking
: for NQ rich region in six complete proteomes. NQ-rich has been known
: to have some association with prion and amyloid formation.
: just out of curiosity: have u looked for regions that are highly
: aromatic residue rich? some one was saying pi-pi stacking provides
: way to help amyloid formation, but no one has looked at this on a
: ...........................

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:34:47 星期二), 转信                       
───────────────────────────────────────
那也是复合物有结构亚, 我查查原始文献看看单体有没有结构
【 在 yix (Punk) 的大作中提到: 】
: but i just did a quick search. it seems that arg-rich RNA binding
: peptides is a fold in SCOP.
: check scop.b.ba.j.c.b.b

───────────────────────────────────────
作者  kingsyl (苦学中,勿扰!-_-~谢谢), 信区: Bioinformatics                 
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:35:16 星期二), 站内信件                   
───────────────────────────────────────
序列库里有球蛋白的信息?

【 在 lazy (draughts) 的大作中提到: 】
: 我本来的意思是想统计看看目前已知球蛋白中对3或者4个短串的出现频率, 看看是否有
: 没有什么偏好性或者刻意避免出现的东西, 然后看看能否作为知识应用到序列设计里面去

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:35:21 星期二), 转信                       
───────────────────────────────────────
your statement is a little flawed.

【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
: 有结构的蛋白质序列 同一安基酸相邻重复的情形比较少。
here you are suggesting P ( has structure | adjacent a.a. same) is low

: 对所有的PDB进行统计
: AAAAA有3个
: RRRR 有1个
: GGGG 有5个
: CCCC 有0个
: LLLL 有6个
: SSSS 有8个
: TTTT 有3个
: KKKK 有4个
: ...........................
then your analyses here just show P ( adjacent a.a. same | has structure) is
low.
if P( adjacent a.a same) is also low ( which i think it pretty possible
also according to lazy's post). P ( has structure | adjacent a.a. same)
might not really be a low number.

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:37:34 星期二), 转信                       
───────────────────────────────────────
没有呀, 所以得自己处理亚, 先找个预测膜蛋白的软件把膜蛋白剔除掉, 然后就碰到这个
问题了
【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
: 序列库里有球蛋白的信息?

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:37:41 星期二), 转信                       
───────────────────────────────────────
ai 看来我说了半天prion & amyloid 你不感兴趣
:D

【 在 lazy (draughts) 的大作中提到: 】
: 我本来的意思是想统计看看目前已知球蛋白中对3或者4个短串的出现频率, 看看是否有
: 没有什么偏好性或者刻意避免出现的东西, 然后看看能否作为知识应用到序列设计里面去

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:39:30 星期二), 转信                       
───────────────────────────────────────
prion & amyloid序列特征上我的确不太感兴趣, 倒是对其聚合的MD模拟比较感
兴趣, 前一段这方面发了好几篇paper, hehe
【 在 yix (Punk) 的大作中提到: 】
: ai 看来我说了半天prion & amyloid 你不感兴趣
: :D

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:43:14 星期二), 转信                       
───────────────────────────────────────
呵呵
我记得上个学期上seminar的时候
有片讲amyloid aggregate的MD paper, PNAS 上
被我们系里面的教授一正狂批
说abtract 写得不honest
说是模拟aggregate
实际上是去模拟有了aggregate之后的elongation了

【 在 lazy (draughts) 的大作中提到: 】
: prion & amyloid序列特征上我的确不太感兴趣, 倒是对其聚合的MD模拟比较感
: 兴趣, 前一段这方面发了好几篇paper, hehe

───────────────────────────────────────
作者  kingsyl (苦学中,勿扰!-_-~谢谢), 信区: Bioinformatics                 
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:45:05 星期二), 转信                       
───────────────────────────────────────
  你的意思是说 XXXXX有结构的概率很大?

  我的推测是说目前看到的蛋白质结构里面 重复的XXXXX很少,所以我猜测XXXXX或者更
多的XXXXXX重复的片段很难出现稳定的结构。

【 在 yix (Punk) 的大作中提到: 】
: your statement is a little flawed.
: here you are suggesting P ( has structure | adjacent a.a. same) is low
: then your analyses here just show P ( adjacent a.a. same | has structure) is
: low.
: if P( adjacent a.a same) is also low ( which i think it pretty possible
: also according to lazy's post). P ( has structure | adjacent a.a. same)
: might not really be a low number.

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:48:08 星期二), 转信                       
───────────────────────────────────────
这个, 看你怎么去看聚合了, 现在的计算能力只能先把他大致限制在一个比较小的范围内
,然后再让它在里面动. 这也没有什么很不合理
【 在 yix (Punk) 的大作中提到: 】
: 呵呵
: 我记得上个学期上seminar的时候
: 有片讲amyloid aggregate的MD paper, PNAS 上
: 被我们系里面的教授一正狂批
: 说abtract 写得不honest
: 说是模拟aggregate
: 实际上是去模拟有了aggregate之后的elongation了

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:48:51 星期二), 转信                       
───────────────────────────────────────
hehe. i am not making any conclusion here
i am just saying there is flaw in your argument because the
conditional probability is not stated correctly.

alot of bioinformatics paper have these kinds of problem. if
the conditional probability is mis-stated, then you can not
do the right normalization

【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
:   你的意思是说 XXXXX有结构的概率很大?
:   我的推测是说目前看到的蛋白质结构里面 重复的XXXXX很少,所以我猜测XXXXX或者更
: 多的XXXXXX重复的片段很难出现稳定的结构中。

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:52:37 星期二), 转信                       
───────────────────────────────────────
条件概率我以前是考虑过的, 但是稍微有点麻烦, 因为原始序列库里面
会有同源的一组蛋白序列干扰统计. 如果这个暂且不计的话, 在所有的
长度为2的子串里面, 显著超过预期出现概率的都是以RR, AA这样的单字
重复为主
【 在 yix (Punk) 的大作中提到: 】
: hehe. i am not making any conclusion here
: i am just saying there is flaw in your argument because the
: conditional probability is not stated correctly.
: alot of bioinformatics paper have these kinds of problem. if
: the conditional probability is mis-stated, then you can not
: do the right normalization

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日13:59:41 星期二), 转信                       
───────────────────────────────────────
ft, 96年的science竟然就只有摘要
【 在 lazy (draughts) 的大作中提到: 】
: 那也是复合物有结构亚, 我查查原始文献看看单体有没有结构

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日14:03:44 星期二), 转信                       
───────────────────────────────────────
in a word, your argument is P( A | B) is low ==> P(B | A) is also low
this is wrong. and it's a common mistake

【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
:   你的意思是说 XXXXX有结构的概率很大?
:   我的推测是说目前看到的蛋白质结构里面 重复的XXXXX很少,所以我猜测XXXXX或者更
: 多的XXXXXX重复的片段很难出现稳定的结构。

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日18:50:26 星期二), 转信                       
───────────────────────────────────────
有没有统计过这样的相邻重复倾向于出现在什么样的二级结构下?

【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
: 有结构的蛋白质序列 同一安基酸相邻重复的情形比较少。
: 对所有的PDB进行统计
: AAAAA有3个
: RRRR 有1个
: GGGG 有5个
: CCCC 有0个
: LLLL 有6个
: SSSS 有8个
: TTTT 有3个
: KKKK 有4个
: ...........................

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日18:54:16 星期二), 转信                       
───────────────────────────────────────
RRRR这样的我看了看, 都是于DNA/RNA结合的蛋白, 复合物里面多肽构象为简单的一段螺

【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
: 有没有统计过这样的相邻重复倾向于出现在什么样的二级结构下?

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日19:03:53 星期二), 转信                       
───────────────────────────────────────
没错,至少还应该计算一个相对熵才能说明问题,呵呵

【 在 yix (Punk) 的大作中提到: 】
: in a word, your argument is P( A | B) is low ==> P(B | A) is also low
: this is wrong. and it's a common mistake

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日19:11:17 星期二), 转信                       
───────────────────────────────────────
run 一个二级结构预测的程序,如果计算结果和所有这样的repeat处的实际结构“倾向于
”出现偏差,那么,偶觉得自然界可能的确不喜欢这种存在:)
呵呵

【 在 lazy (draughts) 的大作中提到: 】
: RRRR这样的我看了看, 都是于DNA/RNA结合的蛋白, 复合物里面多肽构象为简单的一段螺
: 旋

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:07:49 星期二), 转信                       
───────────────────────────────────────
相对熵是什么啊?能不能给个公式看看?
相对熵等于什么的时候,yix说的这个式子能成立阿?解释解释,呵呵。

他说的这是两个统计的概念,false positive rate和false discovery rate。跟相对熵
有什么关系?我很感兴趣。

【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
没错,至少还应该计算一个相对熵才能说明问题,呵呵

【 在 yix (Punk) 的大作中提到: 】
: in a word, your argument is P( A | B) is low ==> P(B | A) is also low
: this is wrong. and it's a common mistake

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:11:03 星期二), 转信                       
───────────────────────────────────────
要是“倾向于”,是需要具有statistics significant好啊,还是不需要也行啊?要是需
要的话,这个,目前的二级结构预测的程序,有那么work么?

【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
run 一个二级结构预测的程序,如果计算结果和所有这样的repeat处的实际结构“倾向于

”出现偏差,那么,偶觉得自然界可能的确不喜欢这种存在:)
呵呵

【 在 lazy (draughts) 的大作中提到: 】
: RRRR这样的我看了看, 都是于DNA/RNA结合的蛋白, 复合物里面多肽构象为简单的一段螺
: 旋

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:32:11 星期二), 转信                       
───────────────────────────────────────
用二级结构预测的程序去评判是没有什么意义的, 因为现有的二级结构预测本来就是基于
知识的, 能不能预测对很大程度上取决于他的训练集的完备性
【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
: run 一个二级结构预测的程序,如果计算结果和所有这样的repeat处的实际结构“倾向于
: ”出现偏差,那么,偶觉得自然界可能的确不喜欢这种存在:)
: 呵呵

───────────────────────────────────────
作者  kingsyl (苦学中,勿扰!-_-~谢谢), 信区: Bioinformatics                 
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:54:56 星期二), 站内信件                   
───────────────────────────────────────
有 基于原理重头计算的二级结构预测软件么?

【 在 lazy (draughts) 的大作中提到: 】
: 用二级结构预测的程序去评判是没有什么意义的, 因为现有的二级结构预测本来就是基于
: 知识的, 能不能预测对很大程度上取决于他的训练集的完备性

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:55:51 星期二), 转信                       
───────────────────────────────────────
相对熵原理也就是最小鉴别信息原理,是随机过程理论中的概念,公式我输不了,自己查
书吧。
物理意义:在只掌握部分信息的情况下要对分布作出判断时,应该选取符合约束条件但
熵值取得最大的概率分布。从先验分布到未知分布的计算应该取满足已知条件,不确定
度(熵)变化最小的解。

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 相对熵是什么啊?能不能给个公式看看?
: 相对熵等于什么的时候,yix说的这个式子能成立阿?解释解释,呵呵。
: 他说的这是两个统计的概念,false positive rate和false discovery rate。跟相对熵
: 有什么关系?我很感兴趣。
: 没错,至少还应该计算一个相对熵才能说明问题,呵呵

───────────────────────────────────────
作者  lazy (draughts), 信区: Bioinformatics                                  
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日21:59:07 星期二), 转信                       
───────────────────────────────────────
没听说过
【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
: 有 基于原理重头计算的二级结构预测软件么?

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日22:08:03 星期二), 转信                       
───────────────────────────────────────
二级结构预测差不多都到70%以了吧,对于alpha的预测精度更高,至于work不work嘛,
呵呵,也就是这么一说

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 要是“倾向于”,是需要具有statistics significant好啊,还是不需要也行啊?要是需
: 要的话,这个,目前的二级结构预测的程序,有那么work么?
: run 一个二级结构预测的程序,如果计算结果和所有这样的repeat处的实际结构“倾向于
: ”出现偏差,那么,偶觉得自然界可能的确不喜欢这种存在:)
: 呵呵

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日22:14:25 星期二), 转信                       
───────────────────────────────────────
没错,我的意思就是如此:)
因为是基于知识的,因此在某种程度上这种“知识”是自然的偏好性的体现,那么如果无
法正确的预测,在现有的训练集的前体下,偶就认为这种repeat是不被偏好的。当然这对
于严格的评判是没有意义的,偶就是觉得可以增加一下自己继续做下去的决心:)

【 在 lazy (draughts) 的大作中提到: 】
: 用二级结构预测的程序去评判是没有什么意义的, 因为现有的二级结构预测本来就是基于
: 知识的, 能不能预测对很大程度上取决于他的训练集的完备性

───────────────────────────────────────
作者  yix (Punk), 信区: Bioinformatics                                       
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月14日23:34:52 星期二) , 站内信件                  
───────────────────────────────────────
actually i am not talking about false positive rate and false discovery rate
at all. i am just talking about a simple conditional probability term, but it
's important for analyzing and interpreting the data correctly
【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 相对熵是什么啊?能不能给个公式看看?
: 相对熵等于什么的时候,yix说的这个式子能成立阿?解释解释,呵呵。
: 他说的这是两个统计的概念,false positive rate和false discovery rate。跟相对熵
: 有什么关系?我很感兴趣。
: 没错,至少还应该计算一个相对熵才能说明问题,呵呵

───────────────────────────────────────
作者  newjun (闲), 信区: Bioinformatics                                      
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月15日03:24:35 星期三) , 站内信件                  
───────────────────────────────────────
有人统计过,好像是在中文的杂志上发表的。
结果证明两个残疾比一个残疾包含的结构信息要多。
当时我就很纳闷。

【 在 lazy (draughts) 的大作中提到: 】
: RRRR这样的我看了看, 都是于DNA/RNA结合的蛋白, 复合物里面多肽构象为简单的一段螺
: 旋

───────────────────────────────────────
作者  lylover (阅读R文档ing&思念cinderella), 信区: Bioinformatics            
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月15日04:19:26 星期三), 转信                       
───────────────────────────────────────
你这么一说,我倒是想起来,如果相同的残基在一起,形成alpha螺旋还是形成beta的几
率更大?
【 在 Feynman (早知道等下辈子再做帅哥了) 的大作中提到: 】
二级结构预测差不多都到70%以了吧,对于alpha的预测精度更高,至于work不work嘛,
呵呵,也就是这么一说

【 在 lylover (阅读R文档ing&思念cinderella) 的大作中提到: 】
: 要是“倾向于”,是需要具有statistics significant好啊,还是不需要也行啊?要是需
: 要的话,这个,目前的二级结构预测的程序,有那么work么?
: run 一个二级结构预测的程序,如果计算结果和所有这样的repeat处的实际结构“倾向于
: ”出现偏差,那么,偶觉得自然界可能的确不喜欢这种存在:)
: 呵呵

───────────────────────────────────────
作者  Feynman (早知道等下辈子再做帅哥了), 信区: Bioinformatics               
标题  Re: 有人做过这方面的工作么                                             
时间  北大未名站 (2003年10月15日21:02:42 星期三), 转信                       
───────────────────────────────────────
看了这一期pnas的文章,提出一种方法 prediction of protein secondary
structure from low-resolution three dimensional model obtained from ROSETTA
program。
不知道这是不是可以算作是部分的de novo预测了

【 在 kingsyl (苦学中,勿扰!-_-~谢谢) 的大作中提到: 】
: 有 基于原理重头计算的二级结构预测软件么?


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
187.500ms