hai-geek 2016-10-10 18:50 采纳率: 60%
浏览 3214
已采纳

Java中文分词,判断一个词语是否存在词典里?

如题,词典使用arraylist数组 求问如何判断?

 public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

x是我的字典数组 但是不可行 求问其他解决方法?
全部代码在这

 import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.ArrayList;
public class InsertString {
    public static ArrayList x = new ArrayList();
    public static String[] s =null;
    public static void main(String[] args) {
        try {
            //String encoding="GBK";
            File file = new File("F:\\dictionary.txt");
            BufferedReader input = new BufferedReader(new FileReader(file));
            String ss = new String();

            int i = 0;
            while ((ss = input.readLine()) != null) {
                String[] s = ss.split(",,");
                x.add(s[i]);
                i = i + 1;
            }
            //System.out.println(x);
            //System.out.println(x);
            input.close();
        } catch (Exception e) {
            // TODO: handle exception
            System.out.println("read fail");
        }
        String input = "你好";  // 要匹配的字符串
        new Split(input).start();
    }
}
class Split {
    private String input=null;
    public Split (String input) {
        this.input = input;
    }
    public void start(){
        String temp=null;
        for(int i=0;i<this.input.length();i++){
            temp=this.input.substring(i);//每次从字符串的首位截取一个字,并保存在temp
            if(this.isInDictionary(temp)){
                System.out.print(temp);
                this.input=this.input.replace(temp,"");
            }
        }
        if(null != this.input && !"".equals(this.input)) {
            this.input = this.input.substring(0,this.input.length()-1);
            this.start();
        }
    }
    //判断当前词是否在字典中
    public boolean isInDictionary(String temp){
        InsertString a=new InsertString();
        if(a.x.contains(temp)){

            return true;
        }
        return false;
    }

}

在stackoverflow上有回答说要重写equals和hashcode方法 不是很懂怎么写。。。
debug到判断这一步会自动返回false

展开全部

  • 写回答

3条回答 默认 最新

  • 祈祷爱绝缘 2016-10-10 21:22
    关注

    看了一下代码,首先你的代码有一些小问题:
    1.前边定义的那个String[] s = null;根本没用到,因为你又定义了临时变量String[] s。
    2.你从txt文档中读词的时候,写的有问题,你读了一整行,然后用split分隔了,把第一个词放到list里面了,然后剩下的就没管,直接读第二行了,并且这时你的i=1了,会把分隔结果的第二个词放入list,所以肯定不对,而且后边有可能出现数组越界的。
    3.list如果知道要存的类型的话,最好还是加上泛型,ArrayList list = new ArrayList();

    我建了个txt文档,然后里面内容是“你好,,好的”发现确实返回false了,然后跟踪代码发现,contains方法底层实际上调用的还是equals方法,然后在equals方法中,先是比较了两个字符串的长度,如果长度相等,才会比较内容,你要匹配的字符串的长度是2,但是从文档中读的字符串长度是3。。所以导致了返回false。。这个还是挺神奇的,我再看看为什么长度会是3.。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)
编辑
预览

报告相同问题?

悬赏问题

  • ¥15 全志t113i启动qt应用程序提示internal error
  • ¥15 ensp可以看看嘛.
  • ¥80 51单片机C语言代码解决单片机为AT89C52是清翔单片机
  • ¥60 优博讯DT50高通安卓11系统刷完机自动进去fastboot模式
  • ¥15 minist数字识别
  • ¥15 在安装gym库的pygame时遇到问题,不知道如何解决
  • ¥20 uniapp中的webview 使用的是本地的vue页面,在模拟器上显示无法打开
  • ¥15 网上下载的3DMAX模型,不显示贴图怎么办
  • ¥15 关于#stm32#的问题:寻找一块开发版,作为智能化割草机的控制模块和树莓派主板相连,要求:最低可控制 3 个电机(两个驱动电机,1 个割草电机),其次可以与树莓派主板相连电机照片如下:
  • ¥15 潜在扩散模型的Unet特征提取
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部