金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
举个栗子
这是一个基因组测序数据的质检工具,通过你的基因测序数据,哪怕很少(1~2X 的覆盖度,只需要知道10,000个位点或者更少),就可以在5分钟内推测你的祖源来自哪里,推断是否有样品的标记的错误,样品污染等等其它这里不详细介绍的功能。

你可以看到,上面这个图每一种颜色的点就是一个世界上的民族,下面有对应的三个字母的缩写。比如CEU就是欧洲人,FIN就是芬兰人,CHB就是中国北京汉族,JPT是日本东京,TSI是意大利托斯卡纳等等。图中的两个蓝色的点就是我当前测试的两个样品。除了样品的上面提到的10000个位点信息,这个工具不知道的其它任何信息,但是最后它成功的把HG00553这个样品放到了波多黎各的位置处。
上面这个分析的分辨率受之前已有的数据点的采样信息的详细程度所限。以上是用的千人基因组的数据做的示例。这是基因组分析领域非常常规的分析,只不过我的方法这里用的信息量非常少,速度快一点。
举这个例子是想说明,信息就在数据里面,信息本身也是媒介和桥梁。你能怎么搭,就有怎么用的方法。
试想,如果我能收集到更多维度的feature, 比如身高,比如姓氏,比如纬度,比如,作息时间等等,我们就能够提供更多信息的预测或者判断。看这个项目
https://genesforgood.sph.umich.edu/ 其中有来自各地的志愿者参与的各个维度的信息收集的调查,并且是有时间维度的信息采集。 当样本数据足够大的时候,理论上,最后能够找到特定样品的信息(对特定的statistic进行deconvolution不是不可能)。不过通常大家现在主要关注的是跟疾病健康相关的问题。
现在市场上很有名的23andme,ancestry等等著名的基因检测服务公司,实际上已经把入门价格做的很低了。他们赚的钱不一定来自于直接对客户的服务。更重要的是,大型的制药厂,需要这些样品信息去进行新药的研发。人群的基因信息,就是新时代的金矿。
那么,对于普通人的生活,有什么影响呢?设想,我们说一家健康保险的公司(其实保险公司都已经在做这个信息收集了),它在拿到你的基因信息之后完全有能力对你进行未来的健康风险评估,可以调整你的保费,甚至可以拒绝承保(这里应该有法律约束)。那么你的信息就已经在影响你的生活了。那么更进一步,1997年有一部科幻电影
http://www.imdb.com/title/tt0119177/ GATTACA,就完全推广了一种可能的社会秩序,完全取决于你的基因品质的社会秩序。
然而,不同于你的网络上的信息,或者你的犯罪记录等等那些记录在磁盘或者纸张等媒介的信息,基因信息的媒介就是你自己,不可销毁。所以,现在题主觉得有必要了没? |
|