国际先驱导报文章2004年10月21日出版的《自然》杂志,以15页的篇幅发表了国际人类基因组测序联盟(IHGSC)的最新成果。这篇名为“完成人类基因组常染色质测序”的文章公布了人类基因组迄今为止最精确的序列。2001年的草图中有15万个空隙,而这份新序列图只留下了341个空隙。整合后的基因组序列的错误率只有1个/10万个碱基对,包含有28.5亿个碱基对,覆盖了99%的常染色质区。实际上,这一成果已经超过了该项目预期的目标。IHGSC分为测序组、分析组和管理组,作为IHGSC的成员之一,中国科学家作出了应有的贡献。
除了获得人类基因组更为精确的序列,这项研究也澄清了人们长久以来一些模糊或错误的判断。例如,人类基因组只有20000到25000个基因,而不是以前估计的27000到40000个基因。在人类基因组中有一些称为“重复片段”的序列,这些序列一般大于1kb,相似度大于90%。这些重复片段可能由一个基因复制或进化而来,这种序列一直是基因组测序的难点。之前人们主要是高估了位于这些“重复片段”区上的基因数目。
这篇文章的发表标志着人类基因组计划又迈出了具有里程碑意义的一步。
人类基因组计划于1990年启动,其目标是完成人类24条染色体的基因组作图和DNA全长序列分析,并进行基因鉴定和功能分析。对人类基因组进行精确测序是这项计划至关重要的一步。2001年2月,人类基因组计划完成了里程碑意义的重大进展。IHGSC和私人测序机构美国塞莱拉公司分别在《自然》和《科学》杂志发表了“人类基因组序列草图”,但限于当时技术和数据分析手段的限制,草图还远不能称为“完美”。此后,由于基因组序列可以公开在网上查询,塞莱拉公司因经济利益暂缓了这项工作,而IHGSC则一直努力工作着,一步一步使这份草图更加精确漂亮。