视频: Xgboost (Boosting) Intuition Easily Explained 2024
在分析数据之前,你必须做出的第一个决定是如何在R中表示数据。你的数据只有一个维度,那么你已经知道矢量很好地代表了这种类型的数据。但是,如果您的数据具有多个维度,则可以选择使用矩阵,列表或数据框。所以,问题是:你什么时候用哪个?
当所有数据都是单一类时,矩阵和高维数组很有用 - 换句话说,所有的数据都是数字的,或者所有的数据都是字符。如果你是一个数学家或统计学家,你对矩阵很熟悉,而且可能经常使用这种类型的对象。
<!但是在很多实际的情况下,你将拥有许多不同类别的数据 - 换句话说,你将会混合使用数字和字符数据。在这种情况下,您需要使用列表或数据框。如果您将数据想象为单个电子表格,那么数据框架可能是一个不错的选择。请记住,数据框只是一个长度相同的已命名向量的列表,这在概念上非常类似于包含列和列标题的电子表格。
<! - 2 - >
如果您熟悉数据库,则可以将数据框视为与数据库中的单个表类似。数据框架非常有用,在许多情况下,将是您存储数据的首选对象。如果您的数据由一组对象组成,但不能将其表示为数组或数据框,则列表是您的理想选择。因为列表可以包含各种其他对象,包括其他列表或数据框,所以它们非常灵活。因此,R有各种各样的工具来处理列表。
值组成的单一类型(例如字符,数字或整数)组成, 。
将其视为电子表格中的单个列或行,或者将其视为数据库表中的 | 列。 | 矩阵或数组 |
---|---|---|
单一类型的多维对象(称为 | 原子
)。矩阵是一个二维数组。 |
当您必须以多维存储数字时,请使用
数组。 |
list | 列表可以包含任何类型的对象。
列表对于存储 所属的数据集合非常有用。因为列表可以包含列表,所以这种类型的 |
对象非常有用。
数据。帧 |
数据帧是一种特殊的名称列表,其中所有 | 元素具有相同的长度。数据库与单个电子表格或数据库中的表 | 类似。
|