对数据进行清洗,得到了cleaned_text,形式如下:
想要对cleaned_text这一列的文本进行分词,之后探究整个文本里词频最高的前十五个单词,根据网上找的代码如下:
for cyber_type in df.cleaned_text.unique():
top50_word = df[df.cleaned_text == cyber_type].str.split(expand=True).stack().value_counts()[:15]
fig = px.bar(top50_word, color=top50_word.values, color_continuous_scale=px.colors.sequential.RdPu, custom_data=[top50_word.values])
fig.update_traces(marker_color='red')
fig.update_traces(hovertemplate='<b>Count: </b>%{customdata[0]}')
fig.update_layout(title=f"Top 15 words for {cyber_type}",
template='simple_white',
hovermode='x unified')
fig.show()
但是一直报错:
请问应该怎么修改?感谢各位,谢!