龙哥 毛哼哼爸 2021-05-31 20:07 采纳率: 33.3%
浏览 54
已采纳

请教如何使用python从word中提取数字,存入CSV

分组:2 打印结果依次为 i,b1,P1,breakpoint,b2,P2
和生物燃料的线性关系

IL6,IL10无断点

Version:1.0 StartHTML:0000000107 EndHTML:0000004359 StartFragment:0000000127 EndFragment:0000004341
] "此时变量y 为:"
[1] "IL1b"
[1] "IL1b"               "-0.107648809523819" "0.339014229656206"  "22.7457597598328"   "0.103020721767575"
[6] "0.361098065608572"
[1] "breakpoint:"
[1] 22.74576
[1] "-----------------------(end)-----------------------"
[1] "-----------------------(start)-----------------?------"
[1] "此时变量y 为:"
[1] "IL5"
[1] "IL5"                 "0.0393546517271973"  "0.507875620155004"   "44.9984318923382"    "-0.0739995182265517"
[6] "0.25727508099701"   
[1] "breakpoint:"
[1] 44.99843
[1] "-----------------------(end)-----------------------"
[1] "-----------------------(start)-----------------?------"
[1] "此时变量y 为:"
[1] "IL13"
[1] "IL13"               "0.376060723360758"  "0.0653383537180709" "49.9999861005274"   "-0.542856877790935"
[6] "0.0169611166504877"
[1] "breakpoint:"
[1] 49.99999
[1] "-----------------------(end)-----------------------"
[1] "-----------------------(start)-----------------?------"

这个word文件,我想把  "IL1b"               "-0.107648809523819" "0.339014229656206"  "22.7457597598328"   "0.103020721767575"  这行中的字符串内容提取出来,还有下面那行[6]后面的 "0.361098065608572"提取出来,
把这6项存入csv表格的一行中。
然后再依次把"IL5" 、"IL13"后面的字符串也提出来,存入CSV中,请问,应该如何操作。

  • 写回答

3条回答 默认 最新

  • 关注

    用python-docx模块读取word文档,

    再用正则表达式提取需要的内容保存为列表再存入CSV

    代码如下:{如果对你有帮助,可以给我个采纳吗,谢谢!! 点击我这个回答右上方的【采纳】按钮}。
     

    import re
    import csv
    # 我先用字符串代替了,你可以改为用python-docx模块读取word文档,
    wordtext = '''
    IL6,IL10无断点
    
    Version:1.0 StartHTML:0000000107 EndHTML:0000004359 StartFragment:0000000127 EndFragment:0000004341
    ] "此时变量y 为:"
    [1] "IL1b"
    [1] "IL1b"               "-0.107648809523819" "0.339014229656206"  "22.7457597598328"   "0.103020721767575"
    [6] "0.361098065608572"
    [1] "breakpoint:"
    [1] 22.74576
    [1] "-----------------------(end)-----------------------"
    [1] "-----------------------(start)-----------------?------"
    [1] "此时变量y 为:"
    [1] "IL5"
    [1] "IL5"                 "0.0393546517271973"  "0.507875620155004"   "44.9984318923382"    "-0.0739995182265517"
    [6] "0.25727508099701"
    [1] "breakpoint:"
    [1] 44.99843
    [1] "-----------------------(end)-----------------------"
    [1] "-----------------------(start)-----------------?------"
    [1] "此时变量y 为:"
    [1] "IL13"
    [1] "IL13"               "0.376060723360758"  "0.0653383537180709" "49.9999861005274"   "-0.542856877790935"
    [6] "0.0169611166504877"
    [1] "breakpoint:"
    [1] 49.99999
    [1] "-----------------------(end)-----------------------"
    [1] "-----------------------(start)-----------------?------"
    
    '''
    
    li = re.findall(r'\[1\]\s*"(.+?)"\s*"(.+?)"\s*"(.+?)"\s*"(.+?)"\s*"(.+?)"\s*\[6\]\s*"(.+?)"',wordtext, re.M)
    print(*li,sep="\n")
    
    with open("data.csv","w",newline="") as fileObj:
        csv.writer(fileObj).writerows(li)
    

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。