数据结构

2020-09-15 学习记录数据结构和算法 0 评论

程序＝算法＋数据结构

算法＝逻辑＋控制

[TOC]

1、数据结构论述（数据之间都存在某种结构）

1.1计算机处理对象之间存在的是一种非常简单像一条线一样的关系，我们称之为线性结构

1.2 一个领导对应着多个领导者，职工记录之间存在一对多的关系，我们称为树状结构

1.3 职工之间还往往存在多对多的关系，这类数学模型我们称为图形结构

数据结构算法，就是研究数据之间的各种结构

2、数据

例如，电话薄数据对象中数据元素是每个人的记录, 数据项是都包含姓名，电话号码

3、数据结构

4、数据储存结构（Storage Structure））

5、数据结构的操作（Operation）

数据元素的查找、插入、删除、遍历、排序等（其它复杂操作都是基于以上基本操作）

6、数据类型（Data Type）

数据类型: 是程序设计语言中用来刻划操作对象的特性的一个值的集合和定义在此集合上的一组操作的总称

7、抽象数据类型

ADT一般包含数据元素、数据元素之间关系及操作三要素 (D, R, O)，其中：

 D是数据元素集,
 R是D上的关系集合,
 O是对D的基本操作集。

ADT 的特点：抽象性、扩展性

8、学习数据结构的意义

对设计编辑软件，写出软件有重大意义

9、时间复杂度

我们把算法需要执行的运算次数用输入大小n 的函数表示，即 T(n) 。
此时为了估算算法需要的运行时间和简化算法分析，我们引入时间复杂度的概念。

我们假设计算机运行一行基础代码需要执行一次运算。

int aFunc(void) {
    printf("Hello, World!\n");      //  需要执行 1 次
    return 0;       // 需要执行 1 次
}

那么上面这个方法需要执行 2 次运算

int aFunc(int n) {
    for(int i = 0; i<n; i++) {         // 需要执行 (n + 1) 次
        printf("Hello, World!\n");      // 需要执行 n 次
    }
    return 0;       // 需要执行 1 次
}

这个方法需要 (n + 1 + n + 1) = 2n + 2 次运算。

我们把算法需要执行的运算次数用输入大小n 的函数表示，即 T(n) 。
此时为了估算算法需要的运行时间和简化算法分析，我们引入时间复杂度的概念。

定义：存在常数 c 和函数 f(N)，使得当 N >= c 时 T(N) <= f(N)，表示为
$$
T(n) = O(f(n))
$$
如图：

当 N >= 2 的时候，f(n) = n^2 总是大于 T(n) = n + 2 的，于是我们说 f(n) 的增长速度是大于或者等于 T(n) 的，也说 f(n) 是 T(n) 的上界，可以表示为 T(n) = O(f(n))。

因为f(n) 的增长速度是大于或者等于 T(n) 的，即T(n) = O(f(n))，所以我们可以用 f(n) 的增长速度来度量 T(n) 的增长速度，所以我们说这个算法的时间复杂度是 O(f(n))。

算法的时间复杂度，用来度量算法的运行时间，记作: T(n) = O(f(n))。它表示随着输入大小n 的增大，算法执行需要的时间的增长速度可以用 f(n) 来描述。

显然如果 T(n) = n^2，那么 T(n) = O(n^2)，T(n) = O(n^3)，T(n) = O(n^4) 都是成立的，但是因为第一个 f(n) 的增长速度与 T(n) 是最接近的，所以第一个是最好的选择，所以我们说这个算法的复杂度是 O(n^2) 。

那么当我们拿到算法的执行次数函数 T(n) 之后怎么得到算法的时间复杂度呢？

我们知道常数项对函数的增长速度影响并不大，所以当 T(n) = c，c 为一个常数的时候，我们说这个算法的时间复杂度为 O(1)；如果 T(n) 不等于一个常数项时，直接将常数项省略。

1
2
3

比如
第一个 Hello, World 的例子中 T(n) = 2，所以我们说那个函数(算法)的时间复杂度为 O(1)。
T(n) = n + 29，此时时间复杂度为 O(n)。

我们知道高次项对于函数的增长速度的影响是最大的。n^3 的增长速度是远超 n^2 的，同时 n^2 的增长速度是远超 n 的。同时因为要求的精度不高，所以我们直接忽略低此项。

1 2	比如 T(n) = n^3 + n^2 + 29，此时时间复杂度为 O(n^3)。

因为函数的阶数对函数的增长速度的影响是最显著的，所以我们忽略与最高阶相乘的常数。

1 2	比如 T(n) = 3n^3，此时时间复杂度为 O(n^3)。

综合起来：如果一个算法的执行次数是 T(n)，那么只保留最高次项，同时忽略最高项的系数后得到函数 f(n)，此时算法的时间复杂度就是 O(f(n))。为了方便描述，下文称此为大O推导法。

由此可见，由执行次数 T(n) 得到时间复杂度并不困难，很多时候困难的是从算法通过分析和数学运算得到 T(n)。对此，提供下列四个便利的法则，这些法则都是可以简单推导出来的，总结出来以便提高效率。

对于一个循环，假设循环体的时间复杂度为 O(n)，循环次数为 m，则这个
循环的时间复杂度为 O(n×m)。

void aFunc(int n) {
    for(int i = 0; i < n; i++) {         // 循环次数为 n
        printf("Hello, World!\n");      // 循环体时间复杂度为 O(1)
    } 
}

此时时间复杂度为 O(n × 1)，即 O(n)。

对于多个循环，假设循环体的时间复杂度为 O(n)，各个循环的循环次数分别是a, b, c…，则这个循环的时间复杂度为 O(n×a×b×c…)。分析的时候应该由里向外分析这些循环。

void aFunc(int n) {
    for(int i = 0; i < n; i++) {         // 循环次数为 n
        for(int j = 0; j < n; j++) {       // 循环次数为 n
            printf("Hello, World!\n");      // 循环体时间复杂度为 O(1)
        }
    }
}

此时时间复杂度为 O(n × n × 1)，即 O(n^2)。

对于顺序执行的语句或者算法，总的时间复杂度等于其中最大的时间复杂度。

void aFunc(int n) {
    // 第一部分时间复杂度为 O(n^2)
    for(int i = 0; i < n; i++) {
        for(int j = 0; j < n; j++) {
            printf("Hello, World!\n");
        }
    }
    // 第二部分时间复杂度为 O(n)
    for(int j = 0; j < n; j++) {
        printf("Hello, World!\n");
    }
}

此时时间复杂度为 max(O(n^2), O(n))，即 O(n^2)。

对于条件判断语句，总的时间复杂度等于其中时间复杂度最大的路径的时间复杂度。

void aFunc(int n) {
    if (n >= 0) {
        // 第一条路径时间复杂度为 O(n^2)
        for(int i = 0; i < n; i++) {
            for(int j = 0; j < n; j++) {
                printf("输入数据大于等于零\n");
            }
        }
    } else {
        // 第二条路径时间复杂度为 O(n)
        for(int j = 0; j < n; j++) {
            printf("输入数据小于零\n");
        }
    }
}

此时时间复杂度为 max(O(n^2), O(n))，即 O(n^2)。

时间复杂度分析的基本策略是：从内向外分析，从最深层开始分析。如果遇到函数调用，要深入函数进行分析。

最后，我们来练习一下

一. 基础题
求该方法的时间复杂度

void aFunc(int n) {
    for (int i = 0; i < n; i++) {
        for (int j = i; j < n; j++) {
            printf("Hello World\n");
        }
    }
}

参考答案：
当 i = 0 时，内循环执行 n 次运算，当 i = 1 时，内循环执行 n - 1 次运算……当 i = n - 1 时，内循环执行 1 次运算。
所以，执行次数 T(n) = n + (n - 1) + (n - 2)……+ 1 = n(n + 1) / 2 = n^2 / 2 + n / 2。
根据上文说的大O推导法可以知道，此时时间复杂度为 O(n^2)。

二. 进阶题
求该方法的时间复杂度

void aFunc(int n) {
    for (int i = 2; i < n; i++) {
        i *= 2;
        printf("%i\n", i);
    }
}

参考答案：
假设循环次数为 t，则循环条件满足 2^t < n。
$$
可以得出，执行次数t=log(2)(n),即 T(n) = log(2)(n)，可见时间复杂度为 O(log(2)(n))，即 O(log n)
$$
三. 再次进阶
求该方法的时间复杂度

long aFunc(int n) {
    if (n <= 1) {
        return 1;
    } else {
        return aFunc(n - 1) + aFunc(n - 2);
    }
}

参考答案：
显然运行次数，T(0) = T(1) = 1，同时 T(n) = T(n - 1) + T(n - 2) + 1，这里的 1 是其中的加法算一次执行。
显然 T(n) = T(n - 1) + T(n - 2) 是一个斐波那契数列，通过归纳证明法可以证明，当 n >= 1 时 T(n) < (5/3)^n，同时当 n > 4 时 T(n) >= (3/2)^n。
所以该方法的时间复杂度可以表示为 O((5/3)^n)，简化后为 O(2^n)。
可见这个方法所需的运行时间是以指数的速度增长的。如果大家感兴趣，可以试下分别用 1，10，100 的输入大小来测试下算法的运行时间，相信大家会感受到时间复杂度的无穷魅力。

本文链接： https://blog.xiaoandx.club/article/data_structure_and_algorithm/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

WEI.ZHOU大眼睛工程师

个人简介

数据结构

1、数据结构论述（数据之间都存在某种结构）

数据结构算法，就是研究数据之间的各种结构

2、数据

例如，电话薄数据对象中 数据元素是每个人的记录, 数据项是都包含姓名，电话号码

3、数据结构

4、 数据储存结构（Storage Structure））

5、数据结构的操作（Operation）

数据元素的查找、插入、删除、遍历、排序等（其它复杂操作都是基于以上基本操作）

6、数据类型（Data Type）

数据类型: 是程序设计语言中用来刻划操作对象的特性的一 个值的集合和定义在此集合上的一组操作的总称

7、抽象数据类型

ADT 的特点： 抽象性、扩展性

8、学习数据结构的意义

9、时间复杂度

我们把算法需要执行的运算次数 用 输入大小n 的函数 表示，即 T(n) 。

此时为了 估算算法需要的运行时间 和 简化算法分析，我们引入时间复杂度的概念。

WEI.ZHOU大眼睛工程师

例如，电话薄数据对象中数据元素是每个人的记录, 数据项是都包含姓名，电话号码

4、数据储存结构（Storage Structure））

数据类型: 是程序设计语言中用来刻划操作对象的特性的一个值的集合和定义在此集合上的一组操作的总称

ADT 的特点：抽象性、扩展性

我们把算法需要执行的运算次数用输入大小n 的函数表示，即 T(n) 。

此时为了估算算法需要的运行时间和简化算法分析，我们引入时间复杂度的概念。