无敌手Greeny 2015-04-19 08:50 采纳率: 66.7%
浏览 1781
已结题

把文本里的内容保存为数组,用于记录每个词组的位置

图片说明


这是文本里内容的格式,已经分过词,去掉了停用词,计算了词组的权重,现在想将这些词在文本的位置存在一个数组中,相当于建立一个VSM空间模型,最后用于聚类分析。


注意,有很多这样的文本,如图:


图片说明


要把所有的文本里的词组的位置记录下来。每一个文本代表一个用户。还有我不知道是建立一维数组好还是二维数组好一些。或者说是用Map这样的类型
希望大神能贴出代码来

  • 写回答

3条回答 默认 最新

  • threenewbee 2015-04-19 09:28
    关注

    用Map也可以,用二维数组也可以。
    无非就是split放入数组,然后用一个整数变量,循环,将这个变量和每一个词语配对,存入你的结果表。

    评论

报告相同问题?

悬赏问题

  • ¥15 活动选择题。最多可以参加几个项目?
  • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
  • ¥15 vs2019中数据导出问题
  • ¥20 云服务Linux系统TCP-MSS值修改?
  • ¥20 关于#单片机#的问题:项目:使用模拟iic与ov2640通讯环境:F407问题:读取的ID号总是0xff,自己调了调发现在读从机数据时,SDA线上并未有信号变化(语言-c语言)
  • ¥20 怎么在stm32门禁成品上增加查询记录功能
  • ¥15 Source insight编写代码后使用CCS5.2版本import之后,代码跳到注释行里面
  • ¥50 NT4.0系统 STOP:0X0000007B
  • ¥15 想问一下stata17中这段代码哪里有问题呀
  • ¥15 flink cdc无法实时同步mysql数据