m0_72311273 2022-07-03 21:15 采纳率: 100%
浏览 51
已结题

R语言分析有关测序的二项分布

假定Illumina测序的碱基错误服从二项分布,错误率为1%。对某一长度为1000bp的基因进行测序,尝试在R中模拟分析,发生测序错误的碱基数95%的可能不会超过多少?

  • 写回答

1条回答 默认 最新

  • huiyiiiiii 2022-07-03 22:59
    关注
    • 查看该分布的概率密度图像
      curve(expr=dbinom(x,1000,0.01),0,1000)
      

    img

    • 查看该分布的概率分位数函数图像
    curve(expr=pbinom(x,1000,0.01),0,1000)
    

    img

    • 利用随机数发生器函数评估
    Observation_times<-100000000
    length_of_gene<-1000
    Probability_of_success<-0.01
    result<-rbinom(Observation_times,length_of_gene,Probability_of_success)
    
    result<-sort(result)
    result[length(result)*0.95]
    [1] 15
    

    升序排列一亿次重复实验的结果,取第95%位置的结果
    发生测序错误的碱基数95%的可能不会超过15个碱基。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 7月16日
  • 已采纳回答 7月8日
  • 创建了问题 7月3日

悬赏问题

  • ¥15 安装CentOS6时卡住
  • ¥20 关于#监控系统#的问题,如何解决?(相关搜索:系统软件)
  • ¥20 c语言写的8051单片机存储器mt29的模块程序
  • ¥60 求直线方程 使平面上n个点在直线同侧并且距离总和最小
  • ¥50 java算法,给定试题的难度数量(简单,普通,困难),和试题类型数量(单选,多选,判断),以及题库中各种类型的题有多少道,求能否随机抽题。
  • ¥50 rk3588板端推理
  • ¥250 opencv怎么去掉 数字0中间的斜杠。
  • ¥15 这种情况的伯德图和奈奎斯特曲线怎么分析?
  • ¥250 paddleocr带斜线的0很容易识别成9
  • ¥15 电子档案元素采集(tiff及PDF扫描图片)