对DataFrame的循环写法

数据都已经处理好，就差一个对DataFrame的循环，d2=data.loc[data['类别']=='娱乐']，循环内容，对它进行切词，应该怎么办


data={
    '类别':['体育','娱乐'],
    '内容':['鲍勃库西奖归谁属？ NCAA最强控卫是坎巴还是弗神新浪体育讯如今，本赛季的NCAA进入到','《翻滚吧阿信》台北首映 彭于晏获封准影帝(图)新浪娱乐讯 昨日(8月11日)，电影《翻滚吧']
}
data=DataFrame(data)
data
d2=data.loc[data['类别']=='娱乐']
cut_d2 = jieba.lcut(str(d2['内容'].values),cut_all=False)
file_path=open(r'stop_words.txt',encoding='utf-8')
stop_words = file_path.read()
new_cut2 = []
for word in cut_d2:
    if word not in stop_words:
        new_cut2.append(word)
new_cut2=[name for name in new_cut2 if len(name) > 1]


#计算频次
wordsDict = {} #新建字典用于储存词及词频
for word in new_cut2:
    if len(word) == 1: #单个的字符不作为词放入字典
        continue
    else:
        wordsDict.setdefault(word, 0) #设置词的初始出现次数为0
        wordsDict[word] +=1 #对于重复出现的词，每出现一次，次数增加1
        
wordsDict_seq = sorted(wordsDict.items(),key=lambda x:x[1], reverse=True) #按字典的值降序排序
wordsDict_seq=wordsDict_seq[:300] 



dd2= pd.DataFrame(list(wordsDict_seq))
dd2.columns = ['词','频次']
import numpy as np
c2=np.array(dd2["词"])
list2 = c2.tolist() 
list2

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

dataframe for循环筛选_Python循环12种超强写法，又快又省内存
2020-12-27 11:25

窦泽南的博客 0 前言说到处理循环，我们习惯使用for, while等，比如依次打印每个列表中的字符：在打印内容字节数较小时，全部载入内存后，再打印，没有问题。可是，如果现在有成千上百万条车辆行驶轨迹，叫你分析出其中每个客户的...
编程Python习题练习.doc
2023-06-13 15:15

【编程】Python 习题练习 1. Python 中的 DataFrame 是一种二维表格数据...以上是针对 Python 编程习题的详细解析，涵盖了数据结构、语言特性、运算符优先级、字符串操作、输入输出、循环与条件语句等方面的知识点。
python中使用iterrows()对dataframe进行遍历的实例
2020-09-20 09:36

在Python编程中，Pandas是一个广泛使用的数据处理库，它提供了丰富而强大的数据分析工具。其中，DataFrame是Pandas中最核心的数据结构之一，它是一个二维标签化数据结构，能够存储不同类型的数据，适合处理表格数据...
CPA-Python编程(二级)错题集图文练习.pdf
2022-11-16 20:23

以上是对题目中涉及的Python编程相关知识点的详细解释，涵盖了数据与信息的区别、Python语法规则、流程图表示、变量赋值、字符串操作、逻辑表达式、pandas库的使用以及循环计算等内容。这些知识点是学习Python编程的...
试题中国电子学会青少年软件编程等级考试标准python三级word练习.doc
2023-06-14 11:16

【Python编程基础与实践】...这些题目涵盖了Python的基础知识，包括输入输出、逻辑判断、运算符优先级、变量命名、循环结构、函数定义、数据类型和操作、库的使用等，对学习Python编程的青少年来说是非常有价值的练习。
dataframe for 循环数据格式 python_小心Python语言中for循环的一个坑
2020-11-21 10:44

weixin_39580748的博客今天有老师给出了一道分解质因数的题目：从键盘输入一个正整数，对其进行因数分解，例如10=2*5,60=2*2*3*5。岱山实验学校的李老师给出一段简明易懂的代码(此处稍作简化处理)：#算法1：一重循环，简单直接num = int...
Python DataFrame详解：创建、操作与空值处理
2025-12-26 16:50

息相吹的博客深入讲解Pandas中DataFrame的创建、增删改查操作，涵盖从列表、字典构建数据框，行列选择、数据替换及空值处理等核心技巧，适合数据处理初学者系统掌握数据结构操作。
r语言tidyverse教程：4 dplyr
2023-05-06 07:45

微小冷的博客文章目录简介和数据准备行列筛选 mutate 数据概述集合运算 R语言系列：编程基础循环语句向量、矩阵和数组列表、数据帧排序函数apply系列函数 tidyverse：readrtibbletidyrdplyr 简介和数据准备 dplyr，这个吊诡...
资料NCT-Python编程一级-模拟卷4(含答案word练习.doc
2025-07-01 03:14

模拟卷四以选择题的形式对考生的基础知识进行检测，题目内容涉及模块导入、变量值交换、程序设计语言种类区分、Python语言归属、判断条件、程序运行错误检测、简单算术运算、Python语言特点、字符串变量声明、条件...
python高性能写法_Python高性能编程
2020-12-17 00:10

weixin_39980234的博客作者：NebulaDun博客园：Python高性能编程前言python现在已经被广泛使用了，它效率高，平常做一些简单的实验，处理一些数据都可以使用python。我写这篇文章的目的，是想和大家分享下提升python性能的小技巧，这些...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月15日

对DataFrame的循环写法

0条回答 默认 最新

问题事件

0条回答默认最新