视频: 在R中讀取Excel資料表 2024
在尝试在R中描述你的数据,你必须确保你的数据格式正确。这意味着
-
确保所有数据都包含在数据框中(如果是单个变量,则保存在向量中)
-
确保所有变量的类型正确
-
检查值是否全部被处理正确
有些数据可能只有有限数量的不同值。例如,人们可以是男性,也可以是女性,而且只能用几种颜色来描述大多数的头发类型。
<! - 1 - >有时更多的价值观在理论上是可能的,但不现实。例如,汽车的发动机可以有16个以上的汽缸,但是你不会找到很多汽缸。以这样或那样的方式,所有这些数据可以被看作 分类 。按照这个定义,分类数据也包括序数据。另一方面,您有可能具有无限可能值的数据。这并不一定意味着这些值可以是任何你喜欢的值。例如,一辆汽车的里程数以每加仑英里数表示,通常四舍五入到整个英里。但是,每辆车的实际价值都会有所不同。
连续的 。 间隔比例数据和比例比例数据通常都是连续数据。 虽然分类和连续数据之间的区别并不总是清楚的。年龄本质上是一个连续的变量,但通常用出生后的年数表示。
在描述数据时,需要区分转换为因子的数据和需要保留数字的数据。如果您可以将数据视为分类,则将其转换为一个因子有助于分析数据。