CSDNRGY 2017-09-08 05:11 采纳率: 87.5%
浏览 1948
已采纳

我的数据库中有100G的数据,如何能提取出这100G里面的高频词?

数据库是mysql
数据库是从各个新闻网爬取的数据
数据都是结构性的数据

  • 写回答

2条回答

  • illbehere 2017-09-08 05:56
    关注

    把数据分词放到hdfs上,然后用spark处理下就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 NAO机器人的录音程序保存问题
  • ¥15 C#读写EXCEL文件,不同编译
  • ¥15 MapReduce结果输出到HBase,一直连接不上MySQL
  • ¥15 扩散模型sd.webui使用时报错“Nonetype”
  • ¥15 stm32流水灯+呼吸灯+外部中断按键
  • ¥15 将二维数组,按照假设的规定,如0/1/0 == "4",把对应列位置写成一个字符并打印输出该字符
  • ¥15 NX MCD仿真与博途通讯不了啥情况
  • ¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
  • ¥15 gradio的web端页面格式不对的问题
  • ¥15 求大家看看Nonce如何配置