用户名
UID
Email
密码
记住
立即注册
找回密码
只需一步,快速开始
微信扫一扫,快速登录
开启辅助访问
收藏本站
快捷导航
门户
Portal
社区
资讯
会议
市场
产品
问答
数据
专题
帮助
签到
每日签到
企业联盟
人才基地
独立实验室
产业园区
投资机构
检验科
招标动态
供给发布
同行交流
悬赏任务
共享资源
VIP资源
百科词条
互动话题
导读
动态
广播
淘贴
法规政策
市场营销
创业投资
会议信息
企业新闻
新品介绍
体系交流
注册交流
临床交流
同行交流
技术杂谈
检验杂谈
今日桔说
共享资源
VIP专区
企业联盟
投资机构
产业园区
业务合作
投稿通道
升级会员
联系我们
搜索
搜索
本版
文章
帖子
用户
小桔灯网
»
社区
›
C、IVD技术区
›
生物信息服务
›
生物信息学硕士需要读博吗?
图文播报
2025庆【网站十二周
2024庆中秋、迎国庆
2024庆【网站十一周
2023庆【网站十周年
2022庆【网站九周年
2021庆中秋、迎国庆
返回列表
查看:
5651
|
回复:
5
[分享]
生物信息学硕士需要读博吗?
[复制链接]
千姿百态
千姿百态
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:18
|
显示全部楼层
|
阅读模式
登陆有奖并可浏览互动!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
生物信息学硕士需要读博吗,读博之后发展空间会不会
原文地址:https://www.zhihu.com/question/610864651
楼主热帖
小桔灯网业务合作须知!
如何注册小桔灯网VIP会员?
梦碎IPO,与资本唱反调,IVD企业炸雷了
[
同行交流
]
Northern Blot原理及实验步骤
[
Western Blotting技术
]
我想做蝴蝶标本,在蝴蝶还活着的时候怎么完整的杀掉它呢?
[
标本处理
]
如何看待鱼跃集团回应 94 元血氧仪涨到 299 元,称「货源紧俏,系商家自行定价」?
[
血球仪器
]
2022年10月中国血细胞分析仪市场分析与展望(完整版)
[
血球仪器
]
预测蛋白结构的准确率是如何量化的,冷冻电镜和alphafold的准确率分别如何?
[
特定蛋白分析
]
免临床试验体外诊断试剂目录更新了,新增了这些品类→
[
同行交流
]
Cell Reports Medicine|北师大舒妮团队发文综述AI赋能多模态影像融合技术在神经精神疾病精准医学中的应用
[
液体活检技术
]
回复
使用道具
举报
提升卡
长长的路
长长的路
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:18
|
显示全部楼层
快速发掘性状关联基因的好方法!
使用预测表达水平的全转录组关联研究(TWAS)已被认作一种鉴定复杂性状和疾病中新基因组风险区域和候选风险基因的有效方法
。由于基于预测表达的TWAS仅依赖于表达的遗传成分,因此可将其视为对表达与性状之间非零局部遗传相关性的检验。在这种背景下,显著的遗传相关性通常被解释为SNP对目的基因介导的性状所产生影响的评估。然而,这种解释需要强有力的假设,但由于连锁不平衡(LD)和多效性SNP效应,这些假设可能与经验数据相悖。因此,
与试图直接评估中介效应的方法相比,TWAS主要被用作关联测试
。
研究中,作者提出了一种对来自TWAS的基因-性状关联信号进行精细映射的方法——FOCUS。FOCUS解释了TWAS中LD和预测权重诱导的相关性结构,并控制SNP多效性效应。FOCUS将风险区域中所有SNP的GWAS汇总数据、表达预测权重(参考eQTL)和LD作为输入,并评估给定基因集的概率。此外,作者扩展了概率SNP精细映射方法,以在预定义的置信水平上筛选包含因果基因(负责关联信号的基因)的基因集。
广泛的模拟表明,当数据中存在因果基因,FOCUS在评估后验概率和可信集合时近似无偏
(指定确定性)。
当因果组织不可用,而使用具有相关表达水平的替代组织时,FOCUS在标准假设下仍能保证性能
。这在一定程度上缓解了对组织的严格要求!
总体而言,TWAS更像是对GWAS分析的补充,通过利用GWAS数据、群体材料全转录组数据、LD等构建统计模型,直接检测基因-性状的关联性,从而更快发掘与性状关联的关键基因
。
康测科技以
全自动核酸建库平台
、
独立自主云分析平台
等先进平台为基础,充分利用
Digital RNA-seq
创新技术,通过
UMI数字标签
去重纠错,
SNP鉴定更准确
,为TWAS分析奠定
最坚实
、
最可靠
的基础!
方法概述
为了明确TWAS显著区域中基因-性状关联,作者首先分析推导TWAS统计量之间的协方差结构,作为预测中LD和eQTL权重的函数。接着,作者使用多变量高斯分布对一个区域内(TWAS显著和不显著)所有基因的边际TWAS关联统计(Ztwas)的整个向量进行建模。
上述模型中,作者利用截距项量化由预测表达标记的平均SNP效应大小(λsnp),从而控制由于SNP多效性造成的偏差。作者证明eQTL在组织之间很大程度上是共享的,并采用标准的贝叶斯方法来计算区域中每个基因的边际后验包含概率(PIP)。为了避免过度拟合,作者使用多变量高斯先验对未知的因果效应λpe进行积分。作者还使用PIP计算ρ-可信基因集(包含概率为ρ的因果基因)。此外,为了解释由于不可预测的表达或其他潜在功能机制而导致的因果机制缺失,作者将零模型作为可信集合中的可能结果,并用于基因后验评估的正则化。最后,作者使用基于模拟的程序来计算后验预测检查,在给定的TWAS Z-score下测量FOCUS模型的拟合优度。
一、FOCUS在模拟中产生准确的可信集合
为了表征预测表达相关性结构并验证框架,作者从真实的基因型数据开始进行广泛的模拟,以生成表达参考面板和GWAS汇总数据(Fig. 2)。
作者证实风险区域中的非因果基因与性状显著关联,这促使TWAS精细映射优先考虑因果影响性状的基因。作者在各种架构下对复杂性状进行模拟,以评估使用FOCUS计算的90%可信基因集的性能(Fig. 3)。当测定相关组织中的因果基因时,作者发现
模拟中90%可信基因集平均包含83%(s.d. 0.04)的因果基因
(Fig. 3)。在SNP直接影响下游性状的模拟中,作者发现性能略有下降,这表明尽管回归掉平均局部效应,但
FOCUS仍能保持性能
。接下来,作者改变了GWAS和参考eQTL数据集的样本量。结果显示:
随着样本量的增加,FOCUS检测因果基因的性能有所提高
(Fig. 3)。与GWAS样本量相比,
参考eQTL的样本量对性能的影响更大
。遗传力定义了基于SNP方法的预测上限。而由于非零遗传力更容易检测到,作者预计性能会有所提高。事实上,作者证实
性能随因果基因表达的遗传性而增加
(Fig. 3)。此外,作者探究了先验效应-大小分布对基因表达的影响,并发现
性能在很大范围内保持稳定
。
二、使用代理组织时,FOCUS仍保持稳定
接下来,作者探究了当因果基因在相关组织中缺失,但在不同组织中能被测量时FOCUS的性能。部分研究表明,顺式调控的基因表达水平在组织和功能结构之间表现出高度的遗传相关性。如果一个因果基因的代理组织模型在90%可信基因集中,作者认为该基因被成功精细映射。当相关组织和代理组织中eQTL的样本量相同,但代理组织的遗传力低于相关组织时,作者发现准确性显著下降。当代理组织基因表达的遗传力至少等同相关组织时,这种效应又未被观察到 (Mann–Whitney U-test P=0.27)。这表明,当因果eQTL在组织之间共享,增加表达的遗传力可以提高检测因果基因的能力。模拟中,作者发现:当相关组织和代理组织中表达的遗传力相似时,共享eQTL效应大小的相关性对性能不起主要影响。总而言之,
当潜在的组织特异性因果基因由代理组织eQTL权重表示时,FOCUS对模拟扰动相对稳健,并且表现良好
。
三、对于混淆,FOCUS依旧稳健
作者证明,由于eQTL SNP之间的LD,TWAS统计量是相关的。这意味着当推理中不包括因果基因的预测表达时,附近的基因可能会在精细映射中被优先考虑。FOCUS通过显式建模零值作为计算可信基因集时的可能解释来应对这种情况。作者测试了当表达和性状无关时FOCUS在标准-零模拟中的性能,发现2495/2500模拟中零模型包含在90%可信基因集中。298/2500模拟中零模型是唯一定义90%可信基因集的模型。余下2202/2500可信基因集中零模型的平均后验概率远大于邻近基因模型。因此,当基因表达和性状无关时,FOCUS也是准确的。此外,作者在69%(s.d. 0.07)的90%可信基因集中鉴定到零模型(Fig. 4),与存在因果基因的模拟相比,这一比例明显更高。总而言之,
当缺少因果表达时,优先零模型的挑战设置中,FOCUS是稳健的
。
随后,作者探究了稳态基因表达对下游性状没有中介效应,但基因的eQTL对下游性状具有多效性(即多效性eQTL)的模拟。作者通过计算多效性模拟中每个风险区域的零模型优先于对应区域基因的频率来衡量性能,发现251/500个区域中零模型排名靠前 (Fisher’s exact P<2.2×10−16)。多效性eQTL模拟中,90%可信基因集可以通过零模型捕获得到富集(328/500 sets; Fisher’s exact P<2.2×10−16) 。接着,作者聚焦包含零模型的可信集合,并在多效性eQTL模拟和标准模拟中计算平均后验概率。作者发现:与标准模拟相比,可信基因集在更大比例的区域中包含零模型。同样,与标准模拟相比,多效性eQTL模拟聚焦可信集合中零模型的捕获,导致分配给零模型的后验密度更多。这意味着,
在SNP表现出水平多效性效应的大多数模拟中,FOCUS优先考虑零模型
。
四、FOCUS提高精细映射因果基因的分辨率
在确定可信集合中包含因果基因后,作者着手量化捕获基因的平均数量。作者发现,在相关组织模拟中,90%可信基因集平均包含4.4个基因 (s.d. 1.3),这导致每个风险区域平均有54%的预测基因。在改变模型参数和样本量后,90%可信基因集中的基因数量相似。为了完整性,作者在模拟中使用90%可信基因集对基因优先排序,以便与TWAS P值和共定位的后验概率进行直接比较。具体而言,作者模拟了一个复杂性状,其中一个区域中的多个基因具备因果,每个基因都有多个eQTL。之后,作者通过两种方式筛选基因。首先,作者利用P值或PP4排名挑选相同数量的基因作为90%可信基因集 (标记“matched”)。其次,使用COLOC (PP4≥0.8) 和TWAS P值(P<0.05/15277)的标准阈值来挑选基因。作者发现利用可信集合对基因优先排序比这两种方法更好 (Fig. 5)。与非大小匹配的方法相比,FOCUS的相对性能有所提高。总而言之,
在真实模拟中FOCUS识别因果基因的灵敏度更高
。
五、应用于脂质GWAS
作者分析了来自脂肪组织的、eQTL权重的脂质GWAS。为了解释缺失的基因预测模型,作者通过参考45个测量组织,将脂肪组织中无法预测的基因整合到基因表达模型。RefSeq (version 65)已知的26292个基因中,作者数据涵盖了12663个基因,剩余2614个基因在RefSeq中没有找到。脂肪优先的TWAS在108个(63 unique)独立区域中鉴定到301个(202 unique)显著基因。在通过GWAS鉴定到的160个(89 unique)风险区域中,有75个(46 unique)与TWAS结果重叠,而GWAS和eQTL仅25%风险区域重叠(Table 1)。并且,在具有显著TWAS关联的75个性状-区域对中,有47个具有多个显著的TWAS关联。
作者发现61/75个风险区域包含的因果基因少于2个。可信集合的最大PIP平均为88%。这意味着
大多数风险区域可以用单个因果基因来解释
。通过计算PIP,作者评估了每个风险区域的90%可信基因集,并发现与转录组范围的显著基因相比,优先基因的数量(平均1.9)显著减少。通过将FOCUS的灵敏度与先验方差项的设置进行对比,作者发现计算的PIP在脂质性状之间高度相似。将FOCUS结果与TWAS排名进行比较,作者发现47/75性状-区域对中,TWAS Z-score最高的基因也是PIP最高的基因。当排除零模型后,这个比例增加到57/75。 作为阳性对照,作者检测了LDL的1p13位点,该区域存在风险SNP rs12740374(NC_000001.10:g.109817590G>T),被证明可以扰乱 SORT1基因的转录并影响下游LDL水平。作者在90%可信集合中检测到4/34基因,其中SORT1的后验概率达95%(Fig. 6)。
最后,作者研究了90%可信基因集包含零模式的区域(基因表达模型驱动风险证据较弱的地区)。作者在脂质性状的可信集合中检测到25/ 75个零模型,这表明与解释观察信号的统计噪声相比,大多数重叠的 GWAS风险区域与顺式调控表达水平所贡献的风险更一致。
FOCUS输出的PIP取决于FOCUS模型的正确性。如果FOCUS模型不能准确捕获潜在的生成过程,则PIP将存在偏差
。作者使用模拟程序量化适合每个基因的模型,发现FOCUS模型与观测数据基本一致。
总结
作者提出了一种精细映射方法FOCUS,通过使用预测eQTL权重、LD和GWAS汇总统计来评估可信因果基因集。作者证明在零模拟中FOCUS优先考虑零模型,并且当区域中基因影响下游性状时,仍能准确识别因果基因。90%可信基因集在各种模拟中保持稳定,eQTL样本量和基因表达的SNP遗传力对性能影响最大。
除了提供对需要验证多少基因以识别区域中因果基因的置信度进行量化外,FOCUS还允许多个因果SNP和基因,同时通过使用共轭先验来整合基因效应大小,这有利于应对等位基因异质性(eQTL和GWAS中普遍存在)。此外,除了预测基因表达,FOCUS也可以应用于其他在复杂性状病因中具有既定作用的预测分子性状(例如可变剪接外显子)。
作者建议尽可能优先考虑样本量大于100的eQTL数据,并对具有稳健非零SNP遗传力的基因进行推断。
参考文献
Nicholas Mancuso, Malika K. Freund, Ruth Johnson, et al. Probabilistic fine-mapping of transcriptome-wide association studies[J]. Nature Genetics, 2019
回复
支持
反对
使用道具
举报
长长的路
长长的路
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:19
|
显示全部楼层
答主目前在umass和harvard进行生物信息学phd联合培养,也在欧洲待过一段时间。根据我个人的经验和周围人的发展了解。这个问题需要具体到是在哪个国家的生物信息学硕士,毕业之后在哪个国家发展,同时计算,统计,数学,编程能力怎么样?还是只是会正常做点组学数据分析等等这些都是影响发展空间的具体因素。
目前的话,北美,特别是美国对于生物信息学的需求相对来说还是比较大的,如果去公司发展的话,读不读博和在北美找不找的到工作没有太大的相关性。核心还是我上面说的计算,统计,数学,编程能力。但是phd与否会决定你的第一份工作的上限,以及起步收入。比如目前在北美大的药厂甚至high-tech的AI 相关的AI scientist岗位,都是需要phd背景,或者是master毕业但是在工业界工作了3-5年。这个和咨询界读了MBA/phd直升associate,没有MBA/phd从analyst干起,2-3年升associate一样。
当然了,并不是读博就一定好,因为根据答主的一些经历,我确实也遇到很多人其实并不适合读博,因为读博的过程非常煎熬,而且如果不是对自己做的课题感兴趣,其实很难坚持下来,没有人能保证你一定什么时间能毕业,对于生物信息学来说,就目前而言对于大家的生物学综合背景,数理统计能力的要求越来越高,工作量也越来越大。在你年近30,还只能靠着奖学金糊口,哪怕是harvard的phd(比如免疫系),我知道的很多老外毕业了,还欠几万刀贷款呢,一般北美生信phd工资一个月2000-3500刀不等,而欧洲在英国我知道的剑桥那边可能也2000磅不到,到手的工资也就够自己一个人糊口。而硕士进入工业界的同学朋友可能已经10-20w美金的package了,这些世俗的压力也都是需要问问自己承受得了。
欧洲的话,需求相对少一点,但是如果身份没有问题,然后计算,统计,数学,编程能力很强的话,找工作应该是没问题,未来的发展肯定也还是会有一定的ceiling,你们可以去看下现在国际大厂做分析和各种管线的director有几个不是PHD,但是如果目标只是早点工作挣钱,中层领导,那么硕士并不会影响太多。
核心点还是搞清楚自己到底想要什么。
回复
支持
反对
使用道具
举报
清风寡欲
清风寡欲
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:19
|
显示全部楼层
想科研,读博,想就业不读博也够用。
回复
支持
反对
使用道具
举报
感恩由您
感恩由您
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:20
|
显示全部楼层
需要,或者不需要,你内心是有想法的。比如,未来工作做什么,待遇怎么样?
回复
支持
反对
使用道具
举报
感恩由您
感恩由您
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-3-11 18:20
|
显示全部楼层
想做科研,继续从事研究或者高校老师工作,每天为项目申请这些事忙碌,那就要读博,如果只为找到好工作,薪资有理想的水平,没有科研追求,那就没有太大的必要,因为硕士在未来5-10年完全足够条件适应生物学行业的需求和发展。
回复
支持
反对
使用道具
举报
返回列表
发表回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
ISO 15189认证
业界动态
CAP认证
侧向层析技术
中标结果
CE注册
关闭
官方推荐
/3
【扫描左侧二维码关注微信】参与交流!
网站定期开展行业相关话题互动交流活动!对认真参与讨论的桔友将有金桔奖励!欢迎参与。
查看 »
IVD业界薪资调查(月薪/税前)
长期活动,投票后可见结果!看看咱们这个行业个人的前景如何。请热爱行业的桔友们积极参与!
查看 »
小桔灯网视频号开通了!
扫描二维码,关注视频号!
查看 »
返回顶部
快速回复
返回列表
客服中心
搜索
官方QQ群
洽谈合作
关注微信
微信扫一扫关注本站公众号
个人中心
个人中心
登录或注册
业务合作
-
投稿通道
-
友链申请
-
手机版
-
联系我们
-
免责声明
-
返回首页
Copyright © 2008-2024
小桔灯网
(https://www.iivd.net) 版权所有 All Rights Reserved.
免责声明: 本网不承担任何由内容提供商提供的信息所引起的争议和法律责任。
Powered by
Discuz!
X3.5 技术支持:
宇翼科技
浙ICP备18026348号-2
浙公网安备33010802005999号
快速回复
返回顶部
返回列表