4月1日凌晨,被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、基因序列无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。它有多重要呢?最新一期Science把封面位置给了这项成果,并一口气刊登6篇论文,多方位概述了人类基因组测序工作背后的新发现以及对新基因组区域的一些初步分析。或能将我们对人类的生长发育和疾病的了解,推向了新的高度!▲《科学》杂志以封面报道和专题的形式介绍了人类基因组测序新成果 对人类基因组的研究,已经有50多年的历史。其中最有名的研究项目,是1990年启动的“人类基因组计划”。2003年4月14日,多国实验室耗费10多年的时间和30亿美元的资金,完成了人类基因组计划的测序工作,首次绘制出了人类基因组的图谱。当时的测序工作,大大推动了基因组学的研究,增加了我们对人体和疾病的理解。 但是,当时人类基因组计划得出的序列中,仍然留下了大约8%的空白,其中包含了很多高度重复的DNA序列,加起来有一条染色体那么长。▲人类的1至22号染色体 这8%的缺失,源于20年前测序技术的限制。当时使用的测序方法是“短读长测序”技术(“short-read" technology),一次只能读取很短的一段基因序列。 如果把基因组的一部分想象成段落中的一句话,比如“今天早上小明吃了个包子”,通过短读长测序,研究者能得到很多简短的小部件,比如“今天”“小明”“明吃”“包子”;再经过“拼图”式的分析,他们就可以拼凑出这句完整的话。然而,研究者虽然能知道这段基因里含有的简短小序列,却无法知道这段基因被重复了多少次。也就是说,研究者能够拼凑出“今天早上小明吃了个包子”这句话,但却不知道这句话在整个段落里是否重复出现、重复了多少次。正因缺少这些信息,在过去的20年里,重复序列一直是基因组学研究的一大难题。
|