末章EPSan 2022-12-04 02:20 采纳率: 50%
浏览 8

Python Pandas数据处理相关

求助,我正在做机器学习相关问题,现在我爬取得原始数据需要进行清洗,如下:

img

我希望能使用pandas库遍历每一行,然后将text中包含的keywords列字符串全部清理掉,请问我该怎么做,我目前做到的成果如下,似乎没有结果:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2022/12/4 1:22
# @Author  : CherryWh1te
# @Site    : www.mozac.tech
# @File    : csv_tester.py
# @Software: PyCharm
import pandas as pd
df = pd.read_csv("./data/origin/2022-11-12_Hot_topic.csv")
df = df.dropna(axis=0,how='any')
for index,row in df.iterrows():
    text = str(row['text']).replace(row['keywords'],"")
    row['text'] = text.replace("#", "")
df.to_csv("./data/processed/cleaned_2022-11-12_Hot_topic.csv",index=False)
  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-12-04 04:10
    关注
    评论

报告相同问题?

问题事件

  • 创建了问题 12月4日

悬赏问题

  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?
  • ¥15 matlab(相关搜索:紧聚焦)
  • ¥15 基于51单片机的厨房煤气泄露检测报警系统设计
  • ¥15 路易威登官网 里边的参数逆向
  • ¥15 Arduino无法同时连接多个hx711模块,如何解决?
  • ¥50 需求一个up主付费课程