xuanhuameiying
hai-geek
采纳率60%
2016-10-11 02:50

Java中文分词,判断一个词语是否存在词典里?

已采纳

如题,词典使用arraylist数组 求问如何判断?

 public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

x是我的字典数组 但是不可行 求问其他解决方法?
全部代码在这

 import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.ArrayList;
public class InsertString {
    public static ArrayList x = new ArrayList();
    public static String[] s =null;
    public static void main(String[] args) {
        try {
            //String encoding="GBK";
            File file = new File("F:\\dictionary.txt");
            BufferedReader input = new BufferedReader(new FileReader(file));
            String ss = new String();

            int i = 0;
            while ((ss = input.readLine()) != null) {
                String[] s = ss.split(",,");
                x.add(s[i]);
                i = i + 1;
            }
            //System.out.println(x);
            //System.out.println(x);
            input.close();
        } catch (Exception e) {
            // TODO: handle exception
            System.out.println("read fail");
        }
        String input = "你好";  // 要匹配的字符串
        new Split(input).start();
    }
}
class Split {
    private String input=null;
    public Split (String input) {
        this.input = input;
    }
    public void start(){
        String temp=null;
        for(int i=0;i<this.input.length();i++){
            temp=this.input.substring(i);//每次从字符串的首位截取一个字,并保存在temp
            if(this.isInDictionary(temp)){
                System.out.print(temp);
                this.input=this.input.replace(temp,"");
            }
        }
        if(null != this.input && !"".equals(this.input)) {
            this.input = this.input.substring(0,this.input.length()-1);
            this.start();
        }
    }
    //判断当前词是否在字典中
    public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

}

在stackoverflow上有回答说要重写equals和hashcode方法 不是很懂怎么写。。。
debug到判断这一步会自动返回false

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

3条回答

  • dfsdffe 祈祷爱绝缘 5年前

    看了一下代码,首先你的代码有一些小问题:
    1.前边定义的那个String[] s = null;根本没用到,因为你又定义了临时变量String[] s。
    2.你从txt文档中读词的时候,写的有问题,你读了一整行,然后用split分隔了,把第一个词放到list里面了,然后剩下的就没管,直接读第二行了,并且这时你的i=1了,会把分隔结果的第二个词放入list,所以肯定不对,而且后边有可能出现数组越界的。
    3.list如果知道要存的类型的话,最好还是加上泛型,ArrayList list = new ArrayList();

    我建了个txt文档,然后里面内容是“你好,,好的”发现确实返回false了,然后跟踪代码发现,contains方法底层实际上调用的还是equals方法,然后在equals方法中,先是比较了两个字符串的长度,如果长度相等,才会比较内容,你要匹配的字符串的长度是2,但是从文档中读的字符串长度是3。。所以导致了返回false。。这个还是挺神奇的,我再看看为什么长度会是3.。

    点赞 评论 复制链接分享
  • dfsdffe 祈祷爱绝缘 5年前

    我试了一下感觉好像可以啊,你说的不可行是什么原因?说清楚点呗

    点赞 1 评论 复制链接分享
  • caozhy 从今以后生命中的每一秒都属于我爱的人 5年前

    你这样循环当然是可以的,但是每找一个单词就要循环一次效率太低。用hashtable或者字典树可以优化下。

    点赞 评论 复制链接分享

相关推荐