hai-geek 2016-10-11 02:50 采纳率: 60%
浏览 3213
已采纳

Java中文分词,判断一个词语是否存在词典里?

如题,词典使用arraylist数组 求问如何判断?

 public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

x是我的字典数组 但是不可行 求问其他解决方法?
全部代码在这

 import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.ArrayList;
public class InsertString {
    public static ArrayList x = new ArrayList();
    public static String[] s =null;
    public static void main(String[] args) {
        try {
            //String encoding="GBK";
            File file = new File("F:\\dictionary.txt");
            BufferedReader input = new BufferedReader(new FileReader(file));
            String ss = new String();

            int i = 0;
            while ((ss = input.readLine()) != null) {
                String[] s = ss.split(",,");
                x.add(s[i]);
                i = i + 1;
            }
            //System.out.println(x);
            //System.out.println(x);
            input.close();
        } catch (Exception e) {
            // TODO: handle exception
            System.out.println("read fail");
        }
        String input = "你好";  // 要匹配的字符串
        new Split(input).start();
    }
}
class Split {
    private String input=null;
    public Split (String input) {
        this.input = input;
    }
    public void start(){
        String temp=null;
        for(int i=0;i<this.input.length();i++){
            temp=this.input.substring(i);//每次从字符串的首位截取一个字,并保存在temp
            if(this.isInDictionary(temp)){
                System.out.print(temp);
                this.input=this.input.replace(temp,"");
            }
        }
        if(null != this.input && !"".equals(this.input)) {
            this.input = this.input.substring(0,this.input.length()-1);
            this.start();
        }
    }
    //判断当前词是否在字典中
    public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

}

在stackoverflow上有回答说要重写equals和hashcode方法 不是很懂怎么写。。。
debug到判断这一步会自动返回false

  • 写回答

3条回答 默认 最新

  • 祈祷爱绝缘 2016-10-11 05:22
    关注

    看了一下代码,首先你的代码有一些小问题:
    1.前边定义的那个String[] s = null;根本没用到,因为你又定义了临时变量String[] s。
    2.你从txt文档中读词的时候,写的有问题,你读了一整行,然后用split分隔了,把第一个词放到list里面了,然后剩下的就没管,直接读第二行了,并且这时你的i=1了,会把分隔结果的第二个词放入list,所以肯定不对,而且后边有可能出现数组越界的。
    3.list如果知道要存的类型的话,最好还是加上泛型,ArrayList list = new ArrayList();

    我建了个txt文档,然后里面内容是“你好,,好的”发现确实返回false了,然后跟踪代码发现,contains方法底层实际上调用的还是equals方法,然后在equals方法中,先是比较了两个字符串的长度,如果长度相等,才会比较内容,你要匹配的字符串的长度是2,但是从文档中读的字符串长度是3。。所以导致了返回false。。这个还是挺神奇的,我再看看为什么长度会是3.。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 vc6.0中想运行代码的时候总是提示无法打开文件是怎么回事
  • ¥25 关于##爬虫##的问题,如何解决?:
  • ¥15 ZABBIX6.0L连接数据库报错,如何解决?(操作系统-centos)
  • ¥15 找一位技术过硬的游戏pj程序员
  • ¥15 matlab生成电测深三层曲线模型代码
  • ¥50 随机森林与房贷信用风险模型
  • ¥50 buildozer打包kivy app失败
  • ¥30 在vs2022里运行python代码
  • ¥15 不同尺寸货物如何寻找合适的包装箱型谱
  • ¥15 求解 yolo算法问题