python数据处理常用方法集合

请在此处阐明文章摘要方便文章列表页展现。


pandas

拼接多个df

1
2
3
4
5
6
7
a = pd.DataFrame({'a':[i for i in range(1, 5)], 'b':[i for i in range(11, 15)]})
b = pd.DataFrame({'a':[i for i in range(101, 105)], 'b':[i for i in range(111, 115)]})

# 参数axis=0是纵向拼接
DataFrame = pd.concat([df for df in [a, b]])
# 拼接之后更新index
DataFrame.reset_index(drop=True, inplace=True)

Dict

向字典添加key和value

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 添加的key不存在则会添加、否则覆盖
dicts = {
't1': [1, 2, 3,],
't2': [2, 3, 4,]
}
dicts.update({'t3': 1})
Out: {'t1': [1, 2, 3], 't2': [2, 3, 4], 't3': 1}


dicts = {
't1': [1, 2, 3,],
't2': [2, 3, 4,]
}
dicts.update({'t1': 1})
Out: {'t1': 1, 't2': [2, 3, 4]}

List

判断元素是否存在

1
2
3
lists = [1, 2, 3, 't1', 't2']
if 't1' in lists:
print('Y')

删除指定元素

1
2
lists = [1, 2, 3, 't1', 't2']
lists.remove('t1')

列表元素合并

1
print('_'.join(['1','2','3','4','5']))

字符串处理

模糊查询元素

1
2
3
4
5
6
7
8
import difflib

list1 = ['qqaabb', 'wweerr', '121', 'qbcd', 'plqs']
# word=模糊匹配的关键字
# possibilities=列表
# n=返回的数量,如果有多个符合模糊匹配条件,按照匹配程度从高到低排序
# cutoff=模糊匹配百分比,1代表完全匹配
data = difflib.get_close_matches('qs', list1, 1, cutoff=0.5)

OS

列举当前路径中的文件名称

1
os.listdir()

IF

一行if

1
2
a = '1'
print(1 if a == '1' else 0)