多维数组的遍历性能
数组是Java中的一种容器对象,它拥有多个单一类型的值。当数组被创建的时候数组长度就已经确定了。在创建之后,其长度是固定的。下面是一个长度为10的数组:
public class ArrayDemo {
private int arraySize=10;
public int[] arrayOfIntegers = new int[arraySize];
}
上面的代码是一维数组的例子。换句话说,数组长度只能在一个方向上增长。很多时候我们需要数组在多个维度上增长。这种数组我们称之为多维数组。为简单起见,我们将它称为2维数组。当我们需要一个矩阵或者X-Y坐标系的时候,二维数组是非常有用的。下面就是一个二维数组的例子:
public class TheProblemOf2DArray {
private static final int ARR_SIZE=10;
public static void main(String[] args) {
int arr[][]=new int[ARR_SIZE][ARR_SIZE];
}
}
想象一下,一个二维数组看起来就像一个X-Y坐标系的矩阵。
然而,可能让Java开发者们感到惊讶的是,Java实际上并没有二维数组。
在一个真正的数组中,所有的元素在内存中都存放在连续的内存块中,但是在Java的二维数组并不是这样。Java中所有一维数组中的元素占据了相邻的内存位置,因此是一个真正的数组。
在Java中,当我们定义:
int singleElement // 表示一个int变量
int[] singleDArray // 表示一个int变量数组(一维)
int[][] twoDArray // 表示一个int变量数组的数组(二维)
这意味着,在上面的例子中,二维数组是一个数组的引用,其每一个元素都是另一个int数组的引用。
这张图片清楚地解释了这个概念。
由于二维数组分散在存储器中,所以对性能有一些影响。为了分析这种差异,我写了一个简单的Java程序,显示遍历顺序的重要性。
/**
* 二维数组的问题
*
* 我们在初始化一个任意大小的2维数组。(为简化分析我们使用二维方阵)我们将用两种不同方式迭代同一个数组,分析结果 两种迭代方式的性能差距很大
*
*/
public class TheProblemOf2DArray {
// 数组大小:数组越大,性能差距越明显
private static final int ARR_SIZE = 9999;
public static void main(String[] args) {
// 新数组
int arr[][] = new int[ARR_SIZE][ARR_SIZE];
long currTime = System.currentTimeMillis();
colMajor(arr);
System.out.println("Total time in colMajor : "
+ (System.currentTimeMillis() - currTime) + " ms");
// 新数组,与arr完全相同
int arr1[][] = new int[ARR_SIZE][ARR_SIZE];
currTime = System.currentTimeMillis();
rowMajor(arr1); // this is the only difference in above
System.out.println("Total time in col : "
+ (System.currentTimeMillis() - currTime) + " ms");
}
/**
* 下面的代码按列优先遍历数组 即在扫描下一列之前先扫描完本列
*
*/
private static void colMajor(int arr[][]) {
for (int i = 0; i < ARR_SIZE; i++) {
for (int j = 0; j < ARR_SIZE; j++) {
// See this, we are traversing j first and then i
arr[i][j] = i + j;
}
}
}
/**
* 如果我们转换内外循环 程序就以行优先顺序遍历数组 即在扫描下一行之前先扫描完本行
* 这意味着我们访问数组时每次都在访问不同的列(因此也在访问不同的页) 代码微小的改变将导致这个程序花费更多的时间完成遍历
*/
private static void rowMajor(int arr[][]) {
for (int i = 0; i < ARR_SIZE; i++) {
for (int j = 0; j < ARR_SIZE; j++) {
/*
* 看这个,我们先遍历j,然后遍历i,但是对于访问元素来说 它们在更远的位置,所以需要花费的更多
*/
arr[j][i] = i + j;
}
}
}
}
下面是运行结果:
Total time in colMajor : 133 ms
Total time in col : 2036 ms
可以看出性能差距还是很大的,所以在操作二维数组的时候按顺序操作。