点击上方“Python爬虫与数据挖掘”,进行关注
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
鸡
汤
两岸猿声啼不住,轻舟已过万重山。
数据合并是数据处理过程中的必经环节,pandas作为数据分析的利器,提供了四种常用的数据合并方式(concat,merge,append,join),让我们看看如何使用这些方法吧!
1.concat()
concat() 可用于两个及多个 DataFrame 间行/列方向进行内联或外联拼接操作,默认对行(沿 y 轴)取并集。
「使用方式」
pd.concat(
objs: Union[Iterable[~FrameOrSeries], Mapping[Union[Hashable, NoneType], ~FrameOrSeries]],
axis=0,
join='outer',
ignore_index: bool = False,
keys=None,
levels=None,
names=None,
verify_integrity: bool = False,
sort: bool = False,
copy: bool = True,
)
「主要参数」
objs:一个序列或是Series,DataFrame对象的映射。
axis:连接的轴,0('index',行),1('columns',列),默认为0。
join:连接方式 ,inner(交集), outer(并集),默认为outer。
ignore_index:是否重置串联轴的索引值。如果为True,则重置索引为0,…, n - 1。
keys:创建层次化索引。可以是任意值的列表或数组、元组数组、数组列表(如果将levels设置成多级数组的话)
names:生成的分层索引中级别的名称。
示例
创建两个 DataFrame。
df1 = pd.DataFrame(
{'char': ['a', 'b'],
'num': [1, 2]})
df2 = pd.DataFrame(
{'char': ['b', 'c'],
'num': [3, 4]})