读取输入相关

glob

  • 作用:遍历目标文件夹中的文件,优势包括:

    • 可以遍历子目录
    • 目标文件可以使用通配符匹配文件名和类型
  • 用法

    • 先构造一个正则表达式的字符串,eg:
      • /home/abc/**/*.smali
      • PS:其中**表示的是匹配所有,包括子目录中的文件,也就是匹配/home/abc/下的所有的.smali结尾的文件,包括子目录中的文件;
      • 使用**的时候在筛选的时候要设置recursive=True;
      • 可以使用os.path.join将路径拼接起来;
    • 然后调用glob.iglob(文件名正则表达式,recursive=True)表示遍历所有符合正则的文件名,并且在**中进行递归,该函数返回一个文件名的迭代器;
  • 代码例子
1
2
3
4
5
import glob

source_path = os.path.join(目录,'.后缀')
for eachfile in glob.iglob(source_path):
apkbasename=os.path.basename(eachfilename)

特定格式文件处理

json

  • 作用:提供python读写json文件的功能

  • 用法:用法简单,这里仅介绍对文件读写,对内存对象存取json格式的话是类似的

  • 代码例子

1
2
3
4
5
6
7
8
9
import json

# 写
with open('xxx','w+') as f:
json.dump(data,f)

# 读
with open('xxx','r+') as f:
a=json.load(f)

csv

  • 作用:提供csv文件读写的方法

  • 用法

    • 注意使用过程中python的版本会影响到csv文件的换行符情况,如果是python3的话需要在open的参数中增加newline=''
    • 写入对象的类型为列表;
  • 代码例子

1
2
3
4
5
6
7
8
9
10
11
12
import csv

# 写
with open('filename','r'[,newline='']) as f: # newline是否需要取决于python版本,python3则需要
reader=csv.reader(f)
for row in reader:
# some operation

# 读
with open('filename','w') as f:
writer=csv.writer(f)
writer.writerows(xxx) # xxx为列表类型

lxml

  • 作用:

提供读写xml文件的能力

  • 用法

    • 这里推荐使用lxml库,xml.etree.ElementTree库的缺点在于无法解析xml中的namespace,在某些具体的使用场景中是需要的,如解析安卓API文档的xml时;
    • 除此之外lxml的功能可以覆盖ElementTree库中的功能;
  • 代码例子

1
2
3
4
5
6
7
8
9
10
11
12
13
from lxml import etree as ET

# 从文件读取:
allroot=ET.ElementTree().parse(文件名)
# 寻找所有标签,返回列表:
allroot.findall(标签名)
#每个标签变量的属性,返回一个map类型,用访问map的方式可以访问到
attrMap=eachclass.attrib
eachclass.attrib['name']
#遍历xml文件中的所有节点:
for xx in allroot.iter()
#获取xml中的命名空间:
curNamespace=allroot.nsmap