在Python中导入数据的方法主要包括以下几种:
导入.xlsx文件:
使用路径时需加r前缀或手动替换路径中的为/,以避免转义问题。若未指定sheet_name参数,则默认导入第一个sheet。index_col参数用于指定行索引列。header参数用于设置列索引。
导入.csv文件:
直接指定文件路径。若文件分隔符非逗号,需通过参数指定分隔符。nrows参数可用于指定读取的行数。encoding参数设置编码格式。文件路径或名中含中文时,需指定engine。行、列索引及指定导入列的设定方法与.xlsx文件一致。
导入.txt文件:
使用read_table函数。即使文件是逗号分隔,也需指定分隔符号。其他参数使用方法与read_csv基本相同。
导入SQL文件:
首先连接数据库。使用read_sql方法执行SQL查询语句。可设置行索引、列索引等参数。
直接创建DataFrame输入数据:
使用列表或字典创建DataFrame。使用数组创建带索引的DataFrame。从字典列表创建时,可使用zip函数或直接从序列字典创建。
这些方法涵盖了Python中常见的数据导入方式,根据具体的数据类型和格式选择合适的方法进行导入即可。