如何在R中读取Excel/xlsx文件?
我们可以使用readxl和xlsx之类的库轻松读取R中的excel文件。
让我们从语法开始
Readxl:Readxl是R函数之一,可帮助读取R中的excel文件。
Xlsx:这是一个专用的R软件包,用于在R环境中读取xlsx文件。
read_excel(x, row.names = FALSE, na = "", sheet = 1) read.xlsx(x,row.names=FALSE, header = TRUE, sheet=1)
其中:
X =输入文件。
通过提及TRUE和FALSE,可以启用或者禁用row.names =行名。
header =如果启用,则标题将显示,否则被禁用。
Sheet =读取提到的工作表编号。
即工作表1,工作表2。
使用readxl包在R中读取Excel文件
Excel是一种了不起的电子表格数据存储软件,已在企业中广泛使用。
在数据分析中,大多数数据存储在excel电子表格中。
由于R以其统计数据分析功能而闻名,因此很多时候我们会遇到以excel格式传递的数据。
可以将一个excel文件导入R,并且您可以执行数据的处理,操纵,写入和分析。
在本文中,我们将深入研究excel文件以及如何在R中读取它们。
1 –准备要处理的数据
我们无法将excel文件导入R并开始对其进行处理或者分析。
需要采取一些初步步骤来简化此过程。
在任何数据存储平台中,都应确保存储或者收集的数据格式正确,并且缺少值。
例如,如果您使用内置的Car数据集,则其中会有多列。
其中,一列是距离。
可以用多种方式表示距离。
它可以根据您所居住的国家/地区以公制或者英制为单位。
除此之外,还取决于您对显示单位的偏好。
由于以不同单位显示的数据将不同,因此我们需要在开始工作之前对其进行预处理。
您应该首先处理此类数据,并将其转换为正确的维度。
你应该,
为存储的数据确定正确的指标。
缺少的值应得到解决(替换或者删除)
寻找适当的标题,并避免使用长名称作为标题。
确保存储的所有数据都是偶数,并且其中应该没有不确定性。
您的数据已完成!让我们继续下一步,我们将设置工作环境。
2 –设置工作环境
在R中,只要您在程序范围之外使用文件,就应该设置工作目录,以使R可以在该目录中导入/保存文件和数据。
让我们设置您的工作目录。
以下代码将显示当前工作目录,并请注意,它将是所有PC的默认目录。
#shows the current working directory getwd()
Output = "C:/Users/Dell/Documents"
现在,将工作目录设置为我们的文件夹/目录。
#sets the new working directory setwd("C:/Users/Dell/Desktop/rfiles")
上面的代码会将工作目录更改为我们建议的目录。
希望您能清楚地在R中设置工作目录。
让我们继续下一步。
3 –使用" Readxl"读取数据
在本节中,我们将使用" Readxl"包阅读excel文件。
以下代码将安装" readxl"软件包并导入名为excel文件的" testdoc"(在我的PC中)。
#install required packages install.packages('readxl') library(readxl) #reads the excel file df<-read_excel("testdoc.xlsx") df
R中的Readxl
哇,棒极了!您已经阅读了R中的excel文件。
看看它在R中的外观如何。
像这样,借助" Readxl"包,您可以在R中读取excel文件。
4 –使用file.choose()选择文件
如果要读取R中的任何类型的文件,则必须首先将其导入。
好的,您将首先设置工作目录,并使用扩展名提及文件名并读取数据。
这是常规流程吗?
但是您知道您可以在程序运行时选择任何文件吗?是的,通过使用函数file.choose(),您可以轻松地在PC中选择文件并可以在R中读取它们。
#chooses the file df<-read_excel(file.choose())
通过执行以上代码,您将获得一个弹出窗口,如下所示。
使用file.choose()函数选择文件
在弹出窗口中,您可以打开PC中存储的任何文件。
酷吧?现在,您不需要任何路径,也可以输入冗长的文件名。
只需选择并导入到R。
这是关于Excel文件。
如果要选择csv文件,则应编写read_csv(file.choose())。
5 –使用工作表名称读取R中的excel/xlsx文件
有时,您的excel文件表可能有多个表。
现在,您需要按名称访问第二个工作表。
你怎么能这样做?
担心?
请不要!
" Readxl"包具有某些参数,您可以其中读取带有工作表名称或者工作表编号的文件。
让我们看看它是如何工作的。
#reads the excel file with sheet name/number df<-read_excel("testdoc.xlsx",sheet = 2) df<-read_excel("testdoc.xlsx",sheet = "Mydatasheet")
您可以看到,我已经提到了我的工作表名称,该名称在excel文件中位于第二位。
readxl函数将读取" Mydatasheet"数据。
不用担心数据,为了说明我已经复制了工作表1中的数据。
因此,如果您的excel文件有多张工作表或者多张工作表已用不同的名称重命名,请不要担心,只需提及工作表编号或者工作表名称即可。
read_excel将处理所有事情。
如果要选择文件,可以通过在file.choose()中提及工作表名称来轻松选择文件并读取所需的工作表。
df<-read_excel(file.choose(),"Mydatasheet")
使用xlsx包读取R中的Excel文件
到目前为止,我们已经使用Readxl函数读取了数据。
现在,让我们使用read_xlsx函数读取R中的excel文件。
1 –在R中安装xlsx软件包
我们将首先安装所需的软件包。
#installs the required packages install.packages('xlsx') library(xlsx)
#reads the excel file in R df<-read_xlsx('testdoc.xlsx') df
read.xlsx函数的功能与readxl函数相同。
您可以在R中看到excel文件。
2 –使用xlsx读取具有工作表名称的excel文件
read_xlsx可以轻松读取R中的excel文件。
您还可以指定要读取的工作表名称。
在本节中,让我们看看它是如何工作的。
#reads the excel file by sheet name/number dummy<-read_xlsx("testdoc.xlsx",sheet = "Mydatasheet") View(dummy)
正如您所注意到的,我们的函数读取了名为Mydatasheet的第二张表。
这样,您可以通过指定工作表编号或者名称轻松读取excel文件。
3 –在运行时选择excel文件
最后,我们在本文的最后一部分。
其中我们将看到如何直接从PC中选择excel文件。
正如我们在以上各节中熟悉的file.choose()函数一样,我们可以在read.xlsx函数中实现它。
#choose the file from the PC df<-read.xlsx(file.choose(),1) View(df)
执行上述代码后,您会发现一个弹出窗口,要求您选择要使用的文件。
只需选择任何excel文件,函数就会自动在R中读取该文件。