您现在的位置是:网站首页> 编程资料编程资料
python进行数据合并concat/merge_python_
2023-05-25
293人已围观
简介 python进行数据合并concat/merge_python_
前言:
两个表中的数据,要根据关键字段,进行合并。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。
1、pd.concat
pd.concat 函数:
- 拼接的对象可以是series,还可以是dataframe
- 拼接对象的个数不受限axis 控制拼接方向(既支持上下拼接,也支持左右拼接)
- 左右拼接 axis=1,左右拼接的依据是行索引;上下拼接 axis =0 ,拼接依据是列名,默认是上下拼接
- join 指定拼接方法
- join=“inner” 内联,表示保留两个表共有的行索引
- join=“outer” 外联,表示保留两个表所有的行索引,默认外联
#导入需要的包 import pandas as pd
#创建需要的数据集:产品表 dict1={"产品编号":["CP13","CP14","CP15","CP16","CP17"],"产品名称":["产品A003","产品A004","产品A005","产品A006","产品A007"]} df1 = pd.DataFrame(dict1) df1
#创建需要的数据集:详情表 dict2={"订单编号":["20220913","20220914","20220915","20220915"], "产品编号":["CP13","CP14","CP15","CP16"], "产品销量":[13,24,45,32], "负责人":["张三","赵六","李八","李八"]} df2 = pd.DataFrame(dict2) df2
pd.concat([df1,df2])#默认上下拼接,拼接依据是列名;默认外联,保留两个表都有的索引信息

pd.concat([df1,df2],ignore_index=True)#重置行索引

#左右拼接的依据是行索引 axis默认是0上下拼接,1为左右拼接;默认外联(join = 'outer') pd.concat([df1,df2],axis=1)

#join指定了拼接方法,内联,表示保留两个表共有的行索引 pd.concat([df1,df2],axis=1,join="inner")

2、 df.append
和concat上下拼接的结果类似
df1.append(df2)

3、 pd.merge()
- 拼接对象是dataframe或者series,左表必须是datafram
- 拼接的数量只能是两个
- 拼接方向只能左右拼
#left_on写左表进行拼接的字段,right_on写右表要进行拼接的字段 pd.merge(df1,df2,left_on="产品编号",right_on="产品编号",how = 'right')
#若两表拼接字段名完全一样,可写一个on pd.merge(df1,df2,on="产品编号")

4、 df.join
和concat左右拼接的结果类似
df1.join(df2, lsuffix='_b', rsuffix='_a')

总结

到此这篇关于python进行数据合并concat/merge的文章就介绍到这了,更多相关python数据合并内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
您可能感兴趣的文章:
相关内容
- Python和Excel的完美结合的常用操作案例汇总_python_
- Python 处理 Pandas DataFrame 中的行和列_python_
- python安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))问题解决_python_
- Python Panda中索引和选择 series 的数据_python_
- Python Pandas教程之series 上的转换操作_python_
- Numpy安装、升级与卸载的详细图文教程_python_
- 将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程_python_
- Python Pandas教程之使用 pandas.read_csv() 读取 csv_python_
- Python 运算符Inplace 与Standard _python_
- 详解Python中数据处理的方法总结及实现_python_
