写一个Java程序能够找出这两个文本中相同的单词，求帮忙看看哪里错了？

 package union.practice;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashSet;
import java.util.Set;

/**
 * 有两个文本文件，每一行是一个单词，写一个Java程序能够找出这两个文本中相同的单词。
 * 1.需要考虑所有有可能出现的异常，需要有较好的用户体验，出现异常应该有友好的提示信息而不是java中的Exception；
 * 2.程序尽量简洁高效，要求两个文本中各有10万单词量时，找出相同单词的时间不超过0.5秒； 3.对写的程序要有完整的单元测试代码。
 */
public class App {

    // commonStringSet存储最后结果
    public static volatile Set<String> commonStringSet = new HashSet<String>();
    public static volatile Set<String> setA = new HashSet<String>();
    public static volatile Set<String> setB = new HashSet<String>();


    /**
     * 找出两个文本文件中相同的单词
     * 
     * @param file1
     *            文件1文件名
     * @param file2
     *            文件2文件名
     * @param destination
     *            相同文本存储的位置
     */
    public Set<String> findCommonWordsInTwoFiles(String fileA, String fileB) {
        //开启两个线程，分别读取两个文件的内容存储到他们对应的HashSet，同时比较当前读取到的内容是否存在于另一线程对应的集合中，如果在，添加到公共集合
        final String tempFileA = fileA;
        final String tempFileB = fileB;

        Thread tA = new Thread(new Runnable() {
            public void run() {
                File fA = new File(tempFileA);

                try {
                    BufferedReader bfA = new BufferedReader(new FileReader(fA));

                    // 读取文件1中的内容存储于set1中
                    String temp = null;
                    while ((temp = bfA.readLine()) != null) {
                        synchronized (setA) {
                            setA.add(temp);
                        }
                        if(setB.contains(temp))
                            synchronized (commonStringSet) {
                                commonStringSet.add(temp);
                        }
                    }

                    bfA.close();
                } catch (FileNotFoundException e) {
                    System.out.println("待查找的文件不存在");
                } catch (IOException e) {
                    System.out.println("系统读取文件异常");
                }
            }
        });
        tA.start();

        Thread tB = new Thread(new Runnable() {
            public void run() {
                File fB = new File(tempFileB);

                try {
                    BufferedReader bfB = new BufferedReader(new FileReader(fB));

                    // 读取文件1中的内容存储于set1中
                    String temp = null;
                    while ((temp = bfB.readLine()) != null) {
                        synchronized (setB) {
                            setB.add(temp);
                        }
                        if(setA.contains(temp))
                            synchronized (commonStringSet) {
                                commonStringSet.add(temp);
                            }

                    }

                    bfB.close();
                } catch (FileNotFoundException e) {
                    System.out.println("待查找的文件不存在");
                } catch (IOException e) {
                    System.out.println("系统读取文件异常");
                }
            }
        });
        tB.start();

        //等待AB线程执行结束后返回
        try {
            tA.join();
            tB.join();
        } catch (InterruptedException e) {
            System.out.println("系统不能处理您的请求");
        }

        return commonStringSet;
    }

}

测试的时候拿已知的HashSet结果与函数返回的结果相比较，但是从运行结果来看，并不总是相等的，我想问题应该是出在同步的层面，求解释（测试时数据量比较大，其中一个文件有10万行，一个文件两百行）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2016-07-29 00:51
关注
问题应该是Thread不同步问题，假设tA读到500行，tB读到100行，假设在100到500行以内有相同的，setA里有，但是setB里没有，这样就不会成功。
建议你两个文件一行一行的同时读。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【java】一个项目有两个相同的类，会出问题么？ eclipse jar java java-ee spring
2019-01-04 14:41

回答 5 已采纳 jvm 在判断是否是重复类是根据这个类是由哪个类加载器加载来判断，理论上来说你这样做没有问题，因为你依赖的jar包中的ClassA 和你自己创建的ClassA是由不同的类加载器加载的
求帮写一个java小程序 java 小程序
2016-03-10 01:29

回答 6 已采纳参考代码如下： ``` import java.io.BufferedReader; import java.io.File; import java.io.FileInputStrea
java 集合问题找出两个集合中相同的元素并打印出来
2016-05-24 14:24

回答 8 已采纳 package set; import java.util.HashSet; /* * 作业：把1-100 数随机不重复放入到数组[97] ,找出未存入的数！ */ publ
06从零开始学Java之编写第一个Java程序HelloWorld
2023-03-14 10:29

一一哥Sun的博客在之前的文章中，壹哥带大家搭建出了Java的开发环境，配置了JDK环境变量，并且我们也熟悉了dos命令行的操作。总之，在真正进行编写代码之前做了很多准备工作，我相信各位早就迫不及待的想要编写代码了。那么从这篇...
java 如何用正则表达式抓出两个相同单词之间的文本
2016-09-10 11:20

回答 2 已采纳 1、首先你可以直接用split方法分割字符串。 2、非要用正则的话参考如下： public static void getBetweenTime(){ String testStr =
两个list通过stream的方式找到集合中对象属性相同的对象 java
2022-03-17 22:53

回答 1 已采纳 java stream优雅的操作流，stream的常见操作_西凉的悲伤的博客-CSDN博客_stream 数组合并这里写目录标题List
【JAVA】怎么把list中对象某两个属相相同的拿出来，用stream eclipse jar java java-ee spring
2019-01-11 10:35

回答 1 已采纳算了我写出来了 Map, Double> ftmlCollect = ftml.stream() .collect(Collectors.groupingBy(
java程序从键盘输入十个整数存入数组a中_并编程实现:_编程题7.1 1、编写一个程序,文件名为 Task7_1.java ,要求从键盘输入两个整数,分别计算并输出两个数的和,差,积,商。运行结...
2021-03-08 04:17

weixin_39875192的博客【简答题】int a,b,c; a = 3; b = ++a; c = a++; 执行上述代码后a,b,c的值分别为多少?...【简答题】3、数学表达式6 ≤y ≤15【简答题】大家可以把上次模拟测中错了的题目进行更正,拍照后上传。每道...
麻烦大家帮我看看我这个问题出在哪里了呢？Java java
2015-06-05 14:35

回答 4 已采纳 NotePad的句柄没有找到。
java工作中经常说写一个接口,提供一个接口，这个接口是怎么回事? java
2017-09-12 01:28

回答 6 已采纳别人要你提供接口肯定是这个接口的实现类也是由你去写呀，只要接口规范，别人可以调用你的写的实现类，也可以调用别人写的实现类。
帮忙解释一下，这个url什么意思？实在看不懂 java
2016-04-07 09:47

回答 1 已采纳这个js或者jsp访问某个后台文件的标准格式，如访问servlet。pid与mod都是后台文件需要的参数，前面的type也是一样的。 ${ctx}/rest/common/productType:
如何用Java写一个聊天机器人
2022-03-06 21:33

Str_Null的博客如何用Java写一个聊天机器人?
Java 两个LocalDate求问怎么比较先后？ java
2019-08-16 19:38

回答 1 已采纳 isAfter或isBefore方法， ``` LocalDate date1; public boolean verify(LocalDate date2){ if(date
2022计算机Java二级考试四十五套题真题【收藏版】（一周裸考计划）
2020-11-27 10:42

张国荣家的弟弟的博客的，加个vip什么的，故而以下是博主整理的有关java面试题的以下内容，我想以一种幽默风趣????的风格来给大家分享和探讨。另外附加有一些公司的面试真题（内部分享）下面我就开启????耳机模式。并且⭐是重要部分，要...
Java英语单词（5000个）
2019-05-26 20:31

阳宗德的博客 Java基础常见英语词汇 OO: 面向对象 OOP: object-oriented programming,面向对象编程 JDK:Java development kit, java开发工具包 JVM:java virtual machine ,java虚拟机 Compile:编绎 Run:运行...
没有解决我的问题, 去提问

悬赏问题

¥15 将二维数组，按照假设的规定，如0/1/0 == "4"，把对应列位置写成一个字符并打印输出该字符
¥15 NX MCD仿真与博途通讯不了啥情况
¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
¥15 gradio的web端页面格式不对的问题
¥15 求大家看看Nonce如何配置
¥15 Matlab怎么求解含参的二重积分？
¥15 苹果手机突然连不上wifi了？
¥15 cgictest.cgi文件无法访问
¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改