以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 生物信息学 』   (http://bbs.xml.org.cn/list.asp?boardid=46)
----  ===数据格式问题===  (http://bbs.xml.org.cn/dispbbs.asp?boardid=46&rootid=&id=61259)


--  作者:dongyikun
--  发布时间:4/12/2008 3:51:00 PM

--  ===数据格式问题===
我从DBTSS数据库下载的启动子数据(promoter)
数据格式如下:
1,1 389834 1 3 NM_001013655 chr4_random 0 736550 1 1 1 822589 735715
AACTGACCTCCACTTATCTTGCTGCCTGGATTGGCATACATATTCCTCTGCCTGAAAAATTGCTCAATACTTTTGAAAGGTTGTTTCTCACTGTTACACCCAGGCATTTCTGCTAACACCAGCTGAGTTGTAAGGGGCCCTCCAGGAGACCTAGGTTGTTCTCCTTATCACATACATTATTTTCATTTATCAATTTACCCAGAACATCTAATGAAATATTATGGACACCAATAACATGAATACAAATATAGCTATAGACCCTAAAAAGTAAATTGATGTCTCTTGAAAGGCTGTCATGTCTTAGATGCTAAATTTGGAGTATGTGTTTGTAATAAATAAATAGCTTGCTTTAATAATTCTGATTTATGAATGTAATATAGGGGAGCAGCTTTTATTTCGCCCTTAATCTTAAAaaacaattagctgggtgtggtggtgggcacctgtagtcccagctactcaggaggctgaagcaggaggatggtgtgcacctgggaggcggagcttgcagtaagccaaaattgtgccactgcactccagcctgagtgacagtgtgagactctgtctcaaaaaaaaaaaaaaaaaaaaaGATCATACATGGAGTAAATGATGATTTAGCATAAAACACAACTTTAGCCTAAAATACAGATCATAGGGCTCAAACTTTGTTATTTTATGGGATTATACTAATCAGTTAATATTCAAAATTTACCATTTCAAAAGAAGAAATATTGGTCAGGGAAAATTGCCATTGCTTATACAGAAGAATGGAGGAATCTTTTTGACAACAACAATTCTAGTGATCTTCCTCATCACTGGTTCCAAAACCAAGCCCATGGAAGGTCTGCATAGGGATAATGTGGAGAACATGCAAGAGAAATACACATCACCAGCTCCTCAACTCAGAGCTCCAAGGGAATGGCCAAGGAAGCTGTATTGTCCTAAGAAATTTGAGACTGTTTTGACTTACAATAAATCCTGCTCAATCATATGTATGTATACACACACACACAACCACACACACAGACGGTGTTGTCAGTGAAGCCTCTAACAATGCATCTTGACTGGACAGATTTGACAATTAAAATGGCTGGAAGAAAATAGGCTTCATAAGTGTCACTTACTATTCACATTACACATTAAAAGGACATCTCCTAAATTAAATCTTGTCTATGATAAAAAGGCAGAAAATCATGACCCA
此格式非fasta格式(开头少了一个”>“)
如何将此格式的大量数据转化为fasta格式?
或者直接读入matlab?
--  作者:riverlee2008
--  发布时间:4/17/2008 11:49:00 PM

--  
用Bioperl或Biojava吧,多学点没坏处的
--  作者:dongyikun
--  发布时间:4/18/2008 10:30:00 AM

--  
谢谢了
--  作者:hust512
--  发布时间:3/1/2009 3:24:00 PM

--  
哈哈,没看懂! 走过留痕!
--  作者:zhyyjj_811
--  发布时间:9/20/2009 7:38:00 PM

--  
跟我一起学perl吧
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
78.125ms