10. 标准简介
10.1.
操作系统接口

os
模块提供许多操作系统交互函数:
>>>

import os

os.getcwd() #
返回当前工作目录
'C:\\Python313'

os.chdir('/server/accesslogs') #
改变当前工作目录

os.system('mkdir today') #
系统 shell 运行 mkdir 命令
0

一定要使用 import os 不是 from os import * 。避免内建 open() 函数 os.open() 替换因为它们使用方式大不相同

内置 dir() help() 函数用作交互辅助工具用于处理大型模块 os:
>>>

import os

dir(os)
<
返回模块所有函数组成列表>

help(os)
<
返回根据模块文档字符串创建详细说明页面>

对于日常文件目录管理任务, shutil 模块提供易于使用高级别的接口:
>>>

import shutil

shutil.copyfile('data.db', 'archive.db')
'archive.db'

shutil.move('/build/executables', 'installdir')
'installdir'

10.2.
文件通配符

glob
模块提供目录使用通配符搜索创建文件列表函数:
>>>

import glob

glob.glob('*.py')
['primes.py', 'random.py', 'quote.py']

10.3.
命令行参数

一般工具脚本常常需要处理命令行参数这些参数列表形式存储 sys 模块 argv 属性举例来说我们查看下面 demo.py 文件:

#
文件 demo.py
import sys
print(sys.argv)

以下命令行运行 python demo.py one two three 输出结果:

['demo.py', 'one', 'two', 'three']

argparse
模块提供一种复杂机制处理命令行参数以下脚本提取多个文件选择显示:

import argparse

parser = argparse.ArgumentParser(
prog='top',
description='Show top lines from each file')
parser.add_argument('filenames', nargs='+')
parser.add_argument('-l', '--lines', type=int, default=10)
args = parser.parse_args()
print(args)

通过 python top.py --lines=5 alpha.txt beta.txt 命令行运行时脚本 args.lines 5 args.filenames ['alpha.txt', 'beta.txt']。
10.4.
错误输出重定向程序终止

sys
模块具有 stdin , stdout stderr 属性后者对于发出警告错误消息非常有用即使 stdout 向后可以看到它们:
>>>

sys.stderr.write('Warning, log file not found starting a new one\n')
Warning, log file not found starting a new one

终止脚本直接方法使用 sys.exit() 。
10.5.
字符串模式匹配

re
模块高级字符串处理提供正则表达式工具对于复杂匹配操作正则表达式提供简洁优化解决方案:
>>>

import re

re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
['foot', 'fell', 'fastest']

re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
'cat in the hat'

需要简单功能首选字符串方法因为它们容易阅读调试:
>>>

'tea for too'.replace('too', 'two')
'tea for two'

10.6.
数学

math
模块提供用于浮点数学运算下层 C 函数访问:
>>>

import math

math.cos(math.pi / 4)
0.70710678118654757

math.log(1024, 2)
10.0

random
模块提供进行随机选择工具:
>>>

import random

random.choice(['apple', 'pear', 'banana'])
'apple'

random.sample(range(100), 10) #
替代取样
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33]

random.random() # [0.0, 1.0)
区间随机浮点数
0.17970987693706186

random.randrange(6) #
range(6) 随机选取整数
4

statistics
模块计算数值数据基本统计属性均值中位数方差):
>>>

import statistics

data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]

statistics.mean(data)
1.6071428571428572

statistics.median(data)
1.25

statistics.variance(data)
1.3720238095238095

SciPy
项目 <https://scipy.org> 许多其他模块用于数值计算
10.7.
互联网访问

许多模块用于访问互联网处理互联网协议其中简单 urllib.request 用于URL检索数据以及 smtplib 用于发送邮件:
>>>

from urllib.request import urlopen

with urlopen('http://worldtimeapi.org/api/timezone/etc/UTC.txt') as response:

for line in response:

line = line.decode() #
字节转换字符串

if line.startswith('datetime'):

print(line.rstrip()) #
去除末尾换行


datetime: 2022-01-01T01:36:47.689215+00:00

import smtplib

server = smtplib.SMTP('localhost')

server.sendmail('soothsayer@example.org', 'jcaesar@example.org',

"""To: jcaesar@example.org

From: soothsayer@example.org


Beware the Ides of March.

""")

server.quit()

注意第二示例需要localhost运行邮件服务器。)
10.8.
日期时间

datetime
模块提供简单复杂方式操作日期时间虽然支持日期时间算法实现重点有效成员提取进行输出格式化操作模块支持感知时区对象
>>>

#
方便构造格式化日期

from datetime import date

now = date.today()

now
datetime.date(2003, 12, 2)

now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
'12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.'

#
日期支持日历运算

birthday = date(1964, 7, 31)

age = now - birthday

age.days
14368

10.9.
数据压缩

常见数据存档压缩格式模块直接支持包括:zlib, gzip, bz2, lzma, zipfile tarfile。:
>>>

import zlib

s = b'witch which has which witches wrist watch'

len(s)
41

t = zlib.compress(s)

len(t)
37

zlib.decompress(t)
b'witch which has which witches wrist watch'

zlib.crc32(s)
226805979

10.10.
性能测量

一些Python用户了解同一问题不同方法相对性能产生浓厚兴趣。 Python提供一种可以立即回答这些问题测量工具

例如元组封包功能相比传统交换参数可能吸引力。timeit 模块可以快速演示运行效率方面一定优势:
>>>

from timeit import Timer

Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
0.57535828626024577

Timer('a,b = b,a', 'a=1; b=2').timeit()
0.54962537085770791

timeit 精细级别相反, profile pstats 模块提供用于较大代码识别时间关键部分工具
10.11.
质量控制

开发高质量软件一种方法开发过程函数编写测试开发过程经常运行这些测试

doctest
模块提供工具用于扫描模块验证程序文档字符串嵌入测试测试构造典型调用及其结果剪切粘贴文档字符串一样简单通过用户提供示例改进文档并且允许doctest模块确保代码保持文档真实:

def average(values):
"""
计算数字列表算术平均值

>>> print(average([20, 30, 70]))
40.0
"""
return sum(values) / len(values)

import doctest
doctest.testmod() #
自动验证嵌入测试

unittest
模块 doctest 模块那样易于使用允许单独文件维护全面测试:

import unittest

class TestStatisticalFunctions(unittest.TestCase):

def test_average(self):
self.assertEqual(average([20, 30, 70]), 40.0)
self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
with self.assertRaises(ZeroDivisionError):
average([])
with self.assertRaises(TypeError):
average(20, 30, 70)

unittest.main() #
从命调用执行所有测试

10.12.
自带电池

Python
自带电池理念通过复杂强大功能可以最好看到一点例如:

xmlrpc.client
xmlrpc.server 模块使得实现远程过程调用变成小菜一碟尽管存在模块名称用户需要直接了解处理 XML。

email
用于管理电子邮件包括MIME其他符合 RFC 2822 规范邮件文档 smtplib poplib 不同它们实际上发送接收消息),电子邮件提供完整工具用于构建解码复杂消息结构包括附件以及实现互联网编码协议

json
解析这种流行数据交换格式提供强大支持。 csv 模块支持逗号分隔格式直接读取文件这种格式通常为数电子表格支持。 XML 处理 xml.etree.ElementTree , xml.dom xml.sax 支持这些模块软件包共同大大简化 Python 应用程序其他工具之间数据交换

sqlite3
模块 SQLite 数据库包装提供可以使用稍微准的 SQL 语法更新访问持久数据库

国际化许多模块支持包括 gettext , locale ,以及 codecs