m0_72311273 2022-07-03 21:15 采纳率: 100%
浏览 51
已结题

R语言分析有关测序的二项分布

假定Illumina测序的碱基错误服从二项分布,错误率为1%。对某一长度为1000bp的基因进行测序,尝试在R中模拟分析,发生测序错误的碱基数95%的可能不会超过多少?

  • 写回答

1条回答 默认 最新

  • huiyiiiiii 2022-07-03 22:59
    关注
    • 查看该分布的概率密度图像
      curve(expr=dbinom(x,1000,0.01),0,1000)
      

    img

    • 查看该分布的概率分位数函数图像
    curve(expr=pbinom(x,1000,0.01),0,1000)
    

    img

    • 利用随机数发生器函数评估
    Observation_times<-100000000
    length_of_gene<-1000
    Probability_of_success<-0.01
    result<-rbinom(Observation_times,length_of_gene,Probability_of_success)
    
    result<-sort(result)
    result[length(result)*0.95]
    [1] 15
    

    升序排列一亿次重复实验的结果,取第95%位置的结果
    发生测序错误的碱基数95%的可能不会超过15个碱基。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 7月16日
  • 已采纳回答 7月8日
  • 创建了问题 7月3日

悬赏问题

  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图点聚合中Marker的位置无法实时更新
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程