多维数组的遍历性能

数组是Java中的一种容器对象,它拥有多个单一类型的值。当数组被创建的时候数组长度就已经确定了。在创建之后,其长度是固定的。下面是一个长度为10的数组:

public class ArrayDemo {
    private int arraySize=10;
    public int[] arrayOfIntegers = new int[arraySize];
}

上面的代码是一维数组的例子。换句话说,数组长度只能在一个方向上增长。很多时候我们需要数组在多个维度上增长。这种数组我们称之为多维数组。为简单起见,我们将它称为2维数组。当我们需要一个矩阵或者X-Y坐标系的时候,二维数组是非常有用的。下面就是一个二维数组的例子:

public class TheProblemOf2DArray {
    private static final int ARR_SIZE=10;
    public static void main(String[] args) {
        int arr[][]=new int[ARR_SIZE][ARR_SIZE];
    }
}

想象一下,一个二维数组看起来就像一个X-Y坐标系的矩阵。

然而,可能让Java开发者们感到惊讶的是,Java实际上并没有二维数组。
在一个真正的数组中,所有的元素在内存中都存放在连续的内存块中,但是在Java的二维数组并不是这样。Java中所有一维数组中的元素占据了相邻的内存位置,因此是一个真正的数组。

在Java中,当我们定义:

int singleElement // 表示一个int变量
int[] singleDArray // 表示一个int变量数组(一维)
int[][] twoDArray // 表示一个int变量数组的数组(二维)

这意味着,在上面的例子中,二维数组是一个数组的引用,其每一个元素都是另一个int数组的引用。
这张图片清楚地解释了这个概念。
由于二维数组分散在存储器中,所以对性能有一些影响。为了分析这种差异,我写了一个简单的Java程序,显示遍历顺序的重要性。

/**
 * 二维数组的问题
 * 
 * 我们在初始化一个任意大小的2维数组。(为简化分析我们使用二维方阵)我们将用两种不同方式迭代同一个数组,分析结果 两种迭代方式的性能差距很大
 * 
 */
public class TheProblemOf2DArray {
    // 数组大小:数组越大,性能差距越明显
    private static final int ARR_SIZE = 9999;

    public static void main(String[] args) {
        // 新数组
        int arr[][] = new int[ARR_SIZE][ARR_SIZE];
        long currTime = System.currentTimeMillis();
        colMajor(arr);
        System.out.println("Total time in colMajor : "
                + (System.currentTimeMillis() - currTime) + " ms");
        // 新数组,与arr完全相同
        int arr1[][] = new int[ARR_SIZE][ARR_SIZE];
        currTime = System.currentTimeMillis();
        rowMajor(arr1); // this is the only difference in above
        System.out.println("Total time in col : "
                + (System.currentTimeMillis() - currTime) + " ms");
    }

    /**
     * 下面的代码按列优先遍历数组 即在扫描下一列之前先扫描完本列
     * 
     */
    private static void colMajor(int arr[][]) {
        for (int i = 0; i < ARR_SIZE; i++) {
            for (int j = 0; j < ARR_SIZE; j++) {
                // See this, we are traversing j first and then i
                arr[i][j] = i + j;
            }
        }
    }

    /**
     * 如果我们转换内外循环 程序就以行优先顺序遍历数组 即在扫描下一行之前先扫描完本行
     * 这意味着我们访问数组时每次都在访问不同的列(因此也在访问不同的页) 代码微小的改变将导致这个程序花费更多的时间完成遍历
     */
    private static void rowMajor(int arr[][]) {
        for (int i = 0; i < ARR_SIZE; i++) {
            for (int j = 0; j < ARR_SIZE; j++) {
                /*
                 * 看这个,我们先遍历j,然后遍历i,但是对于访问元素来说 它们在更远的位置,所以需要花费的更多
                 */
                arr[j][i] = i + j;
            }
        }
    }
}

下面是运行结果:
Total time in colMajor : 133 ms
Total time in col : 2036 ms
可以看出性能差距还是很大的,所以在操作二维数组的时候按顺序操作。