数据操作

在前面的章节中,我们已经学习了连接不同类型数据库的方法,包括关系型数据库
(SQLite 和 MySQL)和非关系型数据库(MongoDB 和 Redis)。关系型数据库通常以表格
形式返回结果,非关系型数据库则可能支持嵌套数据结构和其他特性。
通常来说,即使数据已经被载入内存中,我们为数据分析所做的准备还远远不够。事
实上,在进行任何统计建模和可视化之前,大部分数据仍需要花费大量的时间进行清洗和
转换。在本章中,我们将学习用于数据操作的一系列内置函数和许多相关的扩展包。这些
扩展包都非常强大。然而,为了能够更好地使用这些包,需要扎实地掌握前面章节所介绍
的知识。
本章,我们会介绍以下主题:

使用R内置函数操作数据框

通过 sqldf 包使用 SQL 查询数据框

使用 data.table 包操作数据

使用 dplyr 管道操作处理数据框

使用 rlist 包处理嵌套数据结构

原文地址:https://www.cnblogs.com/navysummer/p/10361720.html