我想为人类基因中的所有可能的外显子创建一个库。这是不可能的gtf文件,可在Ensembl。因为我想创造出所有可能的外显子组合的mRNA以及外显子和内含子的组合。我在不同的平台上搜索了这个问题,但没有找到任何结果。有人能帮我整理一下吗。提前谢谢。
我从biomart下载了所有外显子的坐标:它包含5列,前3列是染色体号。,开始外显子,结束外显子。第四列是转录本编号,第五列是外显子编号。10 100009838 100009947 enst0000032410910 99875577 99877336 enst0000032410910 99879811 99880361 enst0000032410910 99884011 99884209 enst0000032410910 99885687 99885866 enst0000032410910 99886300 99886632 enst0000032410910 99888825 99888953 enst0000032410910 99894946 99895050 enst0000032410910 99896267 99896397 enst0000032410910 99898086 99898285 enst0000032410910 99898743 99898760 enst0000032410910 99899919 99900066 enst0000032410910 99907995 99908094 enst0000032410910 99908953 99909146 enst0000032410910 99955214 99957205 enst0000032410910 99969115 99969237 enst0000032410910 99971980 99972134 enst0000032410910 100042193 100042573 enst0000037041810 100048758 100048876 enst0000037041810 100054347 100054446 enst0000037041810 100057013 100057152 enst0000037041810 100063614 100063725 enst0000037041810 100065188 100065370 enst0000037041810 100069714 100069869 enst0000037041810 100075911 100076107 enst0000037041810 100081403 100081869 ENST00000370418 1
因此,通过这些坐标文件,我可以制作所有可能的全基因组合,并以不同的名称获得快速格式。提前感谢