最新公告
  • 欢迎光临数据科学与编程,我们是数据学科学兴趣交流小组立即加入我们
  • 数据结构基础概念

    一、内容要点

    (一)什么是数据结构

    1.用计算机解决问题需要几个步骤:

    • 从实际问题抽象出数学模型;
    • 设计解决此数学问题的算法
    • 编译、调试程序,直至得到最终答案。

    2.问题的类型

    • 例1:图书管理系统、新生信息登记系统、酒店入住登记系统等 此类文章管理的数学模型中,计算机处理的对象间一般存在着一对一的线性关系,所以叫线性数据结构
    • 例2:计算机与人机对弈问题、游戏中触发模型和步骤等 此类游戏博弈的数学模型中,计算机的处理对象间一般存在着一对多的数据关系,它叫树形数据结构。因为对应关系可看作一个倒置的树,此类关系结构是非线形的。
    • 例3:人际关系脉络关系、城市公交问题等 此类多交叉路口交通灯的数学模型中,计算机处理的对象间一般存在着多对多的数据关系,它叫图状数据结构。通过图示表示出来是类似于“网”状,所以又叫网状数据结构,此类关系结构是非线性的。

    3.数据结构的定义

    • 数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象以及它们之间关系的操作等的学科。

    (二)基本概念和术语

    1.数据:

    • 数据是对客观事物的符号总称(了解符号学),是计算机中所有能输入到计算机中并被计算机程序处理的符号关系的总称。
    • 数据元素:数据元素是数据的基本单位,在计算机中通常考虑做一个整体进行处理。数据项包含于数据元素。
    • 数据项:数据项是数据最小的不可分割单位
    • 数据对象:性质相同的数据元素的集合,是数据的一个子集。
    • 数据结构:相互之间存在一种或多种特定关系的数据元素的集合。数据结构包含三方面:数据的逻辑结构、数据的存储结构和数据的运算

    2.数据的逻辑结构:

    • 定义:数据的逻辑结构即数据元素之间的逻辑关系,独立于计算机。
    • 线性结构:一对一,唯一直接前驱且唯一直接后继(或不存在)
    • 树形结构:一对多,唯一直接前驱(或不存在)且不唯一直接后继
    • 图形结构(网状结构):多对多,不唯一直接前驱且不唯一直接后继

    辅助理解:(已理解的跳过)我们可以从生活中的一些物与物之间的逻辑关系更好地理解上面的数据逻辑结构。线性结构比如火车车厢的关系、或者一群小孩子拉着手围成圈做游戏,每一个个体都只有两只手去拉别人,在离散数学图论中,可以将它们看作每个节点最多有且只能有一个入度和一个出度;树形结构,比如我们中学历史课本上的附庸关系、工作中的严格上下级关系等,每个人只有一个直系长官,每个长官下面可以有多个下属,每个节点能有一个入度和多个出度;网状结构,比如开party,所有人随机和别人谈话,节点的入初度不严格规定,每个节点可以有多个入度和多个出度

    3.数据的存储结构:

    • 顺序存储方法:该方法就是将逻辑上相邻的点存储在物理上也表示相邻,节点间的相邻关系由存储上的相邻关系体现。一般用数组实现。
    • 链接存储方法:该方法不要求逻辑上相邻的点存储在物理上也相邻,节点间的相邻关系由附加的指针字段表示的,得到的存储表示成为链式存储结构。一般借用指针实现 。
    • 索引存储方法:该方法通常是在存储节点信息的基础上,还建立附加啊的索引表。索引表中的每一项称作索引项,索引项的一般关键形式是:(关键字,地址)。关键字唯一标识节点,地址做指向节点的指针。
    • 散列存储方法:该方法的基本思想是根据关键字直接计算出节点的存储地址。

    4.数据的运算

    数据的运算是在数据的逻辑结构定义的操作算法,如检索、插入、删除、更新和排序等。

    5.数据的类型

    • 原子类型:其值不可再分的数据类型,类比数据项记忆
    • 结构类型:其值可再分的数据类型,类比数据元素记忆
    • 抽象数据类型:抽象数据组织和与之相关的操作。

    6.数据的操作

    • 插入:在数据结构的指定位置上增添新的数据元素
    • 删除:删除数据结构中某位置的数据元素
    • 更新:改变某位置上数据元素的值,在概念上等价于删除和原位插入操作
    • 查找:在数据结构中查找某个满足特定要求的数据元素的位置或值
    • 排序:(在线性结构中)重新安排数据元素之间的逻辑顺序关系,使之按值由小到大或相反次序排列。

    更希望能在浏览的过程中,读者自己也能回忆,不停思考一个问题:“我能用几种算法完成以上操作,还有没有更优解?“博主在写代码的时候,只要ddl允许,会一直不停地去完善自己的算法和代码,怎样会更有序整洁些、怎样命名和注释别人看我的代码时会有一种赏心悦目的感觉、怎样优化下去耗时耗空间最小、怎样添加一些新奇有趣的小功能…心无旁骛地沉在里面,不要去纠结一些浅薄浮躁的声音。

    (三)算法和算法分析

    1.算法

    • 算法:算法是对某一问题求解步骤的描述,它是有限序列,每一条指令具有操作层面上的明确性。
    • 特点:(1)有穷性;(2)确定型;(3)可行性;(4)输入性:0或多个输入;(5)输出性:0或多个输出。
    • 算法设计的要求:(1)正确性;(2)可读性;(3)健壮性;(4)效率与低存储量要求

    2.算法效率的度量

    • 时间复杂度:一个语句的频度,是指该语句在算法中被重复执行的次数。算法中所有语句的频度之和记做 t(n),它是该算法求解问题规模n的函数。当问题无限大时,t(n)的数量级称为渐近时间复杂度,简称为时间复杂度,记作 t(n)=o(f(n)).
    • 空间复杂度:算法的空间复杂度s(n),定义为该算法耗费存储空间,它是问题规模为n的函数。渐进空间复杂度也常常称为空间复杂度,记作s(n)=o(f(n)).

    二、重难点

    • 重点:数据的逻辑结构、数据的存储结构、数据的运算三方面的概念及关系
    • 难点:分析算法的时间复杂度

    三、典例

    例1:设有数据结构line = (D,R),其中

    D={01,02,03,04,05,06,07,08,09,10},R={r},

    r={<05,01>,<01,03>,<03,08>,<08,02>,<02,07>,<07,04>,<04,06>,<06,09>,<09,10>}

    • 解答:线性,原因:定义,一一对应关系
    • 选择此题的原因:熟悉一下数据结构的表示方法,学会用图形解决问题。其余此类体型属于赘述,不予添加,有兴趣的道友自己看教材,找题目。

    例2:设n为整数,指出下列各算法的时间复杂度。

    分析:

    <1>算法的时间复杂度由嵌套最深层的语句执行次数决定。prime算法的嵌套最深语句是“i++”,它的执行次数由条件(n%i)!=0 && i*0.1<sqrt(n)决定,所以看出执行次数小于sqrt(n),所以prime算法的时间复杂度是o(n^1/2^).

    <2>同上,嵌套最深语句是“p*=1;sum+=p;”,执行n次,所以算法的时间复杂度是o(n).

    <3>同理,嵌套最深语句是”p*=j”,外层每循环一次,内层语句执行n次,外层一共循环n次,所以sum2的算法时间复杂度为o(n^2^).

    • 决定时间复杂度的主要是循环,要分析时间复杂度,应从循环入手。

     

    本站上原创文章未经作者许可,不得用于商业用途,仅做学习交流使用,本站免责声明。转载请注明出处,否则保留追究法律责任的权利。《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权
    数据科学与编程 » 数据结构基础概念

    发表评论

    • 52会员总数(位)
    • 307资源总数(个)
    • 40本周发布(个)
    • 1 今日发布(个)
    • 329稳定运行(天)

    提供最优质的博文资源集合

    立即阅览 了解详情