问一个关于排序算法效率的问题。

就这段代码，下面有3种简单的排序法：冒泡、选择、插入。
我的问题是，为什么冒泡排序和选择排序在对数组进行逆序排序的时候花的时间比对随机数组进行排序所花的时间少呢？

[code="java"]import java.util.Random;
public class ArrayUtil {

public static void bubbleSort(int[] array){
    for(int i=0; i<array.length - 1; i++){
        for(int j=0; j<array.length - i - 1; j++){
            if(array[j]>array[j + 1]){
                swap(array, j, j + 1);
            }
        }
    }
}

public static void selectionSort(int[] array){
    for(int i=0; i<array.length - 1; i++){
        int minIndex = i;
        for(int j=i; j<array.length - 1; j++){
            if(array[j + 1] < array[minIndex]){
                minIndex = j + 1;
            }
        }
        swap(array, i, minIndex);
    }
}

public static void insertionSort(int[] array){

    for(int i=1; i<array.length; i++){
        if(array[i]<array[i - 1]){
            int temp = array[i];
            int j = i - 1;
            while(j>=0 && temp<array[j]){
                array[j + 1] = array[j];
                j--;
            }
            array[j + 1] = temp;
        }
    }
}

private static void swap(int[] array, int index1, int index2) {
    int temp = array[index1];
    array[index1] = array[index2];
    array[index2] = temp;
}

public static void main(String[] args){
    int[] array = new int[10000];
    generateRandomArray(array);
    long b = System.currentTimeMillis();
    ArrayUtil.bubbleSort(array);
    long e = System.currentTimeMillis();
    System.out.println("冒泡+随机:" + (e - b)/1000.0);

    generateContradictoryArray(array);
    b = System.currentTimeMillis();
    ArrayUtil.bubbleSort(array);
    e = System.currentTimeMillis();
    System.out.println("冒泡+逆序:" + (e - b)/1000.0);

    generateRandomArray(array);
    b = System.currentTimeMillis();
    ArrayUtil.selectionSort(array);
    e = System.currentTimeMillis();
    System.out.println("选择+随机:" + (e - b)/1000.0);

    generateContradictoryArray(array);
    b = System.currentTimeMillis();
    ArrayUtil.selectionSort(array);
    e = System.currentTimeMillis();
    System.out.println("选择+逆序:" + (e - b)/1000.0);

    generateRandomArray(array);
    b = System.currentTimeMillis();
    ArrayUtil.insertionSort(array);
    e = System.currentTimeMillis();
    System.out.println("插入+随机:" + (e - b)/1000.0);

    generateContradictoryArray(array);
    b = System.currentTimeMillis();
    ArrayUtil.insertionSort(array);
    e = System.currentTimeMillis();
    System.out.println("插入+逆序:" + (e - b)/1000.0);
}

private static void generateContradictoryArray(int[] array) {
    for(int i=0; i<array.length; i++){
        array[i] = array.length - i;
    }
}

private static void generateRandomArray(int[] array) {
    Random random = new Random();
    for(int i=0; i<array.length; i++){
        array[i] = random.nextInt();
    }
}

}
[/code]

还有，java.util.ArrayList源代码里ensureCapacity方法中这一句[code="java"]int newCapacity = (oldCapacity * 3)/2 + 1;[/code]为什么用这个*3/2+1？这是什么公式？有什么好处？
[b]问题补充：[/b]
[quote="mymGrubby"]这个是一个在增量处理的问题，有专家统计过1.5倍的增量方式是效率综合最高的。

增量的方式:
1.newCapacity = 所需要的值。
2.newCapacity = oldCapacity + 特定值。
3.newCapacity = oldCapacity * 倍数(>1)。

第一种当前空间效率最好。但ArrayList变化时要频繁申请内存。

第二种总体效率比第一种好，但没有第三种好。

第三种倍数是关键，倍数太大，当前内存浪费过多，倍数太小要频繁申请内存。以前这个倍数大概是2，但数大量数据证明1.5是最好的倍数，再加1应该有更好的效率(oldCapacity 比较小的时候)。[/quote]

果然，在JDK1.1中，Vector的源代码是这样：
[code="java"] private void ensureCapacityHelper(int minCapacity) {
int oldCapacity = elementData.length;
Object oldData[] = elementData;
int newCapacity = (capacityIncrement > 0) ?
(oldCapacity + capacityIncrement) : (oldCapacity * 2);
if (newCapacity < minCapacity) {
newCapacity = minCapacity;
}
elementData = new Object[newCapacity];
System.arraycopy(oldData, 0, elementData, 0, elementCount);
}[/code]
谢谢[url="http://mymgrubby.iteye.com/"]mymGrubby[/url]

还有一个问题就是为什么冒泡排序和选择排序在对数组进行逆序排序的时候花的时间比对随机数组进行排序所花的时间少呢？
[b]问题补充：[/b]
[quote="xuyao"]我来回答一地问题，因为是随即数位数太多了，比较要比较高位，所以开销很大，这样没有可比性。你的逆序最大才1000，所以逆序快，建议生成同等位数的再试试。我反正试过了。[/quote]
首先谢谢你的回答。
我刚把generateRandomArray()方法给改了，改成这样：
[code="java"]private static void generateRandomArray(int[] array) {
Random random = new Random();
for(int i=0; i<array.length; ){
int item = random.nextInt(10000);
int j;
if(i==0) array[i]=item;
for(j=0; j<i; ){
if(array[j]==item) break;
j++;
}
if(j==i){
array[i] = item;
i++;
}
}
}[/code]
这样保证了生成的随机数组不包含重复的数字，并且是0到10000内的数字。但结果似乎仍然是老样子。
[quote="xuyao"]你的逆序最大才1000[/quote]array.length是10000，第一次循环，i=0，array.length - i应该是10000吧。 :)
[b]问题补充：[/b]
[quote="mymGrubby"]对冒泡排序和选择排序来说，逆序情况下比随机情况下swap操作要少很多。[/quote]
这个应该是不对的，冒泡排序逆序情况下每一步都要swap操作，是49995000次，随机的时候要少得多，比如我刚运行了一下，只swap了25152355次。而选择排序的swap操作在逆序情况下和随机情况下是一样的，都是9999次。
[b]问题补充：[/b]
[quote="RednaxelaFX"]主要还是因为冒泡排序中除了交换之外，寻找逆序对的额外消耗太大了，无法忽略。如果遍历整个数组只完成了一次交换，而这个数组的长度有很大，那么遍历的过程本身显然就有着无法忽略的开销。 [/quote]
可是似乎逆序的时候同样也要遍历相同次数，我并没有在哪个条件下改变i、j的增量，也没有在哪个条件下跳出某次循环。
寻找逆序对的操作同样存在于对逆序数组排序的整个过程中呀。是吧？ :)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

18条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dch1287 2008-12-29 16:08
关注
稍微总结一下:
JVM一定是有优化才造成冒泡的逆序反而快了这一点毫无疑问这个优化不是系统的而是JVM的因为在.net上结果是合理的

交换的时候的位数对交换没有影响都是32位int类型你看到的位数多少是没有意义的所以是等价的

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(17条)

报告相同问题？

关注问题

数据结构与算法分析--C语言描述_数据结构与算法_
2021-10-01 12:55

本资源"数据结构与算法分析--C语言描述"是针对数据结构初学者的一个优秀教材，旨在帮助读者快速掌握这一领域。首先，数据结构是组织和存储数据的方式，它决定了数据的访问效率和处理速度。常见的数据结构包括数组...
数据结构课设排序算法的可视化演示（QT+C++）
2017-12-06 18:27

数据结构是计算机科学中的核心课程...总的来说，"数据结构课设排序算法的可视化演示（QT+C++）"是一个综合性的项目，它涵盖了数据结构、算法、编程和可视化等多个方面，对于提升计算机科学学生的综合素质具有重要意义。
【数据结构】常见的八大排序算法
2022-12-25 17:28

吉始的博客排序有内部排序和外部排序，这里八大排序就是内部排序，指直接插入，希尔，选择，堆排，冒泡，快排，归并，计数。附有动图解释和思维导图汇总
【数据结构】常见八大排序算法
2024-10-14 10:00

爱吃香菜¹的博客排序有内部排序和外部排序，八大排序就是内部排序，指直接插入排序，希尔排序，选择排序，堆排序，冒泡排序，快速排序，归并排序，计数排序。分别有递归、非递归方式。
【数据结构】常见八大排序算法总结
2024-01-16 22:02

李斯啦果的博客 1.直接插入排序2.希尔排序3.选择排序4.堆排序5.冒泡排序6.快速排序,Hoare版本,挖坑法,前后指针法快速排序的递归实现快速排序的非递归实现 7....计数排序（非比较排序）9基数排序 10排序算法的复杂度及稳定性分析
C++数据结构与算法 （第4版）
2019-01-06 22:38

根据提供的文件信息，这里主要关注的是“C++数据结构与算法（第4版）”这一主题，虽然实际内容并未给出具体章节或知识点，但我们可以基于标题、描述以及部分已知内容来推测书中可能涵盖的关键知识点。 ### C++数据...
【数据结构】八大排序之快速排序算法
2024-01-02 20:50

修修修也的博客数据结构快速排序详解.内容包括:快排的简介及思想,快排代码实现的三种方式,快排的时间复杂度分析,快排的优化,快排的非递归实现,快排的三路划分算法.
【王道考研】王道数据结构与算法详细笔记（全）
2023-06-08 21:56

小强在学习的路上的博客线性表是具有相同数据类型的n(n>0)个数据元素的有限序列。(其中n为表长，当n=0时线性表是一个空表。若用L命名线性表，则其一般表示为)1. 存在惟一的第一个元素。2. 存在惟一的最后一个元素。3. 除第一个元素之外，每...
学懂C语言（四十）：C语言 数据结构与算法详解
2024-08-04 11:32

猿享天开的博客 C语言 数据结构与算法详解
内部排序算法效率比较,数据结构实验，C语言实现
2021-05-27 21:09

X.CloudX的博客内部排序算法效率比较,数据结构实验，C语言实现 1.直接插入排序 2.折半插入排序 3.希尔排序 4.简单选择排序 5.堆排序 6.冒泡排序 7.快速排序 8.归并排序实验内容与要求对我们所学过的各种排序算法，分别测试统计...
没有解决我的问题, 去提问

问一个关于排序算法效率的问题。

18条回答 默认 最新

18条回答默认最新