企业视频展播,请点击播放
视频作者:武汉纺友技术有限公司
常见的数据质量问题包括:1.数据收集错误,遗漏了数据对象,或者包含了本不应包含的其他数据对象。2.数据中的离群点,即不同于数据集中其他大部分数据对象特征的数据对象。3.存在遗漏值,数据对象的一个或多个属性值缺失,导致数据收集不全。4.数据不一致,收集到的数据明显不合常理,或者多个属性值之间互相矛盾。例如,体重是负数,或者所填的邮政编码和城市之间并没有对应关系。5.重复值的存在,数据集中包含完全重复或几乎重复的数据。正是因为有以上问题的存在,直接拿采集的数据进行分析or可视化,得出的结论往往会误导用户做出错误的决策。因此,对采集到的原始数据进行数据清洗和规范化,是数据可视化流程中不可缺少的一环。
既然是数据可视化,那么可视化的元素肯定是数据,这里所指的数据是广义上的数据,包括文本、图片、声音等超媒体数据。ECharts在可视化过程中所涉及的四种基本数据集类型分别是表格数据、网状数据、场数据和几何空间(spatial)数据,像集合、列表等也是常用的数据集类型。这些基本数据集类型又是由不同的数据类组合构成的,这里的数据类是指可视化中所涉及的数据种类,主要包括四种数据类,分别是数据项、数据项的属性、链接(links)、位置。数据项的属性又可分为类别型和有序型两种,其中有序型又进一步细分为序数型和数值型。
![](https://img3.dns4.cn/pic1/337021/p7/20211209141646_9487_zs.jpg)
在创建数据可视化时,重要的是要了解图表的需求及其用途。仅这两件事就可以使您的可视化从零变为英雄。这样可以确保您不仅创建具有战略目的的可视化图形来回答特定问题,而且还可以使观众轻松理解该可视化文件。了解可视化的要求。这使您可以创建一个图表,以清晰明了的方式传达信息。同样,它可以确保您不会因不必要的信息而使图表过载,否则可能会使观众感到困惑。因此,了解可视化需要什么,并通过突出显示特定的点来使其保持简单。这将对观看者产生持久影响。