刚刚开始学Python 2019-05-17 11:35 采纳率: 0%
浏览 224

如何处理这样的数据?

图片说明
(原始数据)
规格型号这一列是海关的申报要素,具体如下:
1.品名;2.用途;3.材质;4.品牌;5.型号;6.容量;7.是否含汞;8.额定电压;
图片说明
(目标格式)

我需要把这些要素数据提取出来并归类。现在的问题是有些厂家申报要素的顺序不一样,并且有些要素数据没有申报。

我目前是用excel的分列功能把“|”这样的杠杠分开了,之后人工分类,但有十万条数据,有没有大神可以讲解其他的办法?

  • 写回答

1条回答 默认 最新

  • waple_0820 博客专家认证 2019-05-23 17:31
    关注

    可以用python中pandas库,可以很方便地处理excel数据,不懂的话可以看看我的博客,里面可能会对你有些启发

    评论

报告相同问题?

悬赏问题

  • ¥15 如何利用c++ MFC绘制复杂网络多层图
  • ¥20 要做柴油机燃烧室优化 需要保持压缩比不变 请问怎么用AVL fire ESE软件里面的 compensation volume 来使用补偿体积来保持压缩比不变
  • ¥15 python螺旋图像
  • ¥15 算能的sail库的运用
  • ¥15 'Content-Type': 'application/x-www-form-urlencoded' 请教 这种post请求参数,该如何填写??重点是下面那个冒号啊
  • ¥15 找代写python里的jango设计在线书店
  • ¥15 请教如何关于Msg文件解析
  • ¥200 sqlite3数据库设置用户名和密码
  • ¥15 AutoDL无法使用docker install吗?
  • ¥15 cups交叉编译后移植到tina sdk的t113,只需要实现usb驱动打印机,打印pdf文件