Skip to main content

4. 更多控制流程工具

除了刚才介绍的 while 语句,Python知道从其他语言已知的通常的控制流语句,有一些扭曲。

4.1. if 声明

也许最知名的语句类型是 if 语句。例如:

>>> x = int(input("Please enter an integer: "))
Please enter an integer: 42
>>> if x < 0:
...     x = 0
...     print('Negative changed to zero')
... elif x == 0:
...     print('Zero')
... elif x == 1:
...     print('Single')
... else:
...     print('More')
...
More

可以有零个或多个 elif 部分,else 部分是可选的。关键字“ elif ”是“else if”的缩写,并且有助于避免过多缩进。 if ... elif ... elif ...序列是用其他语言发现的 switchcase 语句的替代。

4.2. for 声明

Python中的 for 语句与C或Pascal中可能使用的语句略有不同。而不是总是迭代在数字的算术级数(如在Pascal),或者给用户定义迭代步骤和停止条件(作为C)的能力,Python的 for 语句迭代任何序列的项目(列表或一个字符串),按它们在序列中出现的顺序。例如(不是双关语):

>>> # Measure some strings:
... words = ['cat', 'window', 'defenestrate']
>>> for w in words:
...     print(w, len(w))
...
cat 3
window 6
defenestrate 12

如果需要修改序列,在循环内部迭代(例如复制选定项目),建议您首先复制。对序列进行迭代不会隐式地进行复制。切片符号使这特别方便:

>>> for w in words[:]:  # Loop over a slice copy of the entire list.
...     if len(w) > 6:
...         words.insert(0, w)
...
>>> words
['defenestrate', 'cat', 'window', 'defenestrate']

使用 for w in words:,该示例将尝试创建无限列表,一次又一次插入 defenestrate

4.3. range() 函数

如果你需要迭代一系列数字,内置函数 range() 就派上用场了。它生成算术进展:

>>> for i in range(5):
...     print(i)
...
0
1
2
3
4

给定的终点不是生成序列的一部分; range(10) 生成10个值,长度为10的序列的项目的法律索引。可以让范围从另一个数字开始,或者指定不同的增量(甚至是负数;有时这称为“步长”)。:

range(5, 10)
   5 through 9

range(0, 10, 3)
   0, 3, 6, 9

range(-10, -100, -30)
  -10, -40, -70

要迭代序列的索引,您可以如下组合 range()len():

>>> a = ['Mary', 'had', 'a', 'little', 'lamb']
>>> for i in range(len(a)):
...     print(i, a[i])
...
0 Mary
1 had
2 a
3 little
4 lamb

然而,在大多数这种情况下,使用 enumerate() 功能是方便的,参见 循环技术

一个奇怪的事情发生,如果你只打印一个范围:

>>> print(range(10))
range(0, 10)

在许多方面,range() 返回的对象的行为就像是一个列表,但实际上它不是。它是一个对象,当你迭代它的时候,它返回所需序列的连续项,但它并不真正使列表,从而节省空间。

我们说这样一个对象是 iterable,也就是说,适合作为一个功能和结构的目标,期望从它们可以获得连续的项目,直到供应用尽。我们已经看到 for 语句是这样的 iterator。函数 list() 是另一个;它从iterables创建列表:

>>> list(range(5))
[0, 1, 2, 3, 4]

后来我们将看到更多的函数返回iterables和接受iterables作为参数。

4.4. breakcontinue 语句,以及 else 循环中的条款

break 语句,如在C中,突破了最小的封闭 forwhile 循环。

循环语句可以有一个 else 子句;当循环通过列表耗尽(使用 for)或条件变为假(使用 while)时终止循环,而当循环终止于 break 语句时,循环终止。这通过以下循环来示例,其搜索素数:

>>> for n in range(2, 10):
...     for x in range(2, n):
...         if n % x == 0:
...             print(n, 'equals', x, '*', n//x)
...             break
...     else:
...         # loop fell through without finding a factor
...         print(n, 'is a prime number')
...
2 is a prime number
3 is a prime number
4 equals 2 * 2
5 is a prime number
6 equals 2 * 3
7 is a prime number
8 equals 2 * 4
9 equals 3 * 3

(是的,这是正确的代码。仔细观察:else 子句属于 for 循环,if 语句。

当与一个循环一起使用时,else 子句与 try 语句的 else 子句具有更多的共同点,而不是 if 语句:当没有异常发生时运行 try 语句的 else 子句,并且当没有 break 发生时运行循环的 else 子句。有关 try 语句和异常的更多信息,请参阅 处理异常

continue 语句,也从C借用,继续下一次循环的迭代:

>>> for num in range(2, 10):
...     if num % 2 == 0:
...         print("Found an even number", num)
...         continue
...     print("Found a number", num)
Found an even number 2
Found a number 3
Found an even number 4
Found a number 5
Found an even number 6
Found a number 7
Found an even number 8
Found a number 9

4.5. pass 声明

pass 语句什么也不做。它可以在语法需要语句但程序不需要操作时使用。例如:

>>> while True:
...     pass  # Busy-wait for keyboard interrupt (Ctrl+C)
...

这通常用于创建最少的类:

>>> class MyEmptyClass:
...     pass
...

pass 的另一个地方可以用作一个函数或条件体的占位符,当你在编写新代码时,允许你继续思考一个更抽象的层次。默认忽略 pass:

>>> def initlog(*args):
...     pass   # Remember to implement this!
...

4.6. 定义函数

我们可以创建一个函数,将Fibonacci系列写入任意边界:

>>> def fib(n):    # write Fibonacci series up to n
...     """Print a Fibonacci series up to n."""
...     a, b = 0, 1
...     while a < n:
...         print(a, end=' ')
...         a, b = b, a+b
...     print()
...
>>> # Now call the function we just defined:
... fib(2000)
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597

关键字 def 引入了一个函数 definition。它必须后跟函数名和形式参数的括号列表。形成函数体的语句从下一行开始,必须缩进。

函数体的第一个语句可以可选地是字符串字面量;这个字符串文字是函数的文档字符串,或者 docstring。 (有关docstrings的更多信息,请参见 文档字符串 部分。)有一些工具使用docstrings自动生成在线或打印文档,或让用户交互浏览代码;最好的做法是在你写的代码中包含docstrings,所以要养成习惯。

函数的 execution 引入用于函数的局部变量的新符号表。更确切地说,函数中的所有变量赋值将值存储在局部符号表中;而变量引用首先查看局部符号表,然后查找包含函数的局部符号表,然后查看全局符号表,最后查看内置名称表。因此,不能在函数内直接赋予全局变量(除非在 global 语句中命名),尽管它们可以被引用。

函数调用的实际参数(参数)在被调用函数的局部符号表中引入;因此,使用 按值调用 传递参数(其中 value 始终是对象 reference,而不是对象的值)。 [1] 当一个函数调用另一个函数时,为该调用创建一个新的局部符号表。

函数定义在当前符号表中引入函数名。函数名的值具有由解释器识别为用户定义函数的类型。该值可以分配给另一个名称,然后也可以用作一个函数。这用作一般的重命名机制:

>>> fib
<function fib at 10042ed0>
>>> f = fib
>>> f(100)
0 1 1 2 3 5 8 13 21 34 55 89

从其他语言,你可能会反对 fib 不是一个函数,而是一个过程,因为它不返回一个值。事实上,即使没有 return 语句的函数也返回一个值,尽管是一个相当无聊的。这个值被称为 None (它是一个内置的名称)。写入值 None 通常由解释器抑制,如果它是唯一的值写入。你可以看到它,如果你真的想使用 print():

>>> fib(0)
>>> print(fib(0))
None

很容易写一个返回Fibonacci系列数字列表的函数,而不是打印它:

>>> def fib2(n):  # return Fibonacci series up to n
...     """Return a list containing the Fibonacci series up to n."""
...     result = []
...     a, b = 0, 1
...     while a < n:
...         result.append(a)    # see below
...         a, b = b, a+b
...     return result
...
>>> f100 = fib2(100)    # call it
>>> f100                # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]

这个例子,像往常一样,演示了一些新的Python功能:

  • return 语句返回一个来自函数的值。没有expression参数的 return 返回 None。掉落函数的结尾也返回 None

  • 语句 result.append(a) 调用列表对象 resultmethod。一个方法是一个“属于”一个对象并被命名为 obj.methodname 的函数,其中 obj 是一些对象(这可能是一个表达式),methodname 是由对象类型定义的方法的名称。不同的类型定义不同的方法。不同类型的方法可以具有相同的名称而不引起歧义。 (可以使用 classes 定义自己的对象类型和方法,参见 )示例中显示的方法 append() 是为列表对象定义的;它在列表的末尾添加一个新元素。在这个例子中它相当于 result = result + [a],但更高效。

4.7. 更多关于定义函数

也可以定义具有可变数量参数的函数。有三种形式,可以组合。

4.7.1. 默认参数值

最有用的形式是为一个或多个参数指定默认值。这创建了一个可以使用比定义允许的参数少的参数进行调用的函数。例如:

def ask_ok(prompt, retries=4, reminder='Please try again!'):
    while True:
        ok = input(prompt)
        if ok in ('y', 'ye', 'yes'):
            return True
        if ok in ('n', 'no', 'nop', 'nope'):
            return False
        retries = retries - 1
        if retries < 0:
            raise ValueError('invalid user response')
        print(reminder)

此函数可以通过以下几种方式调用:

  • 只给出强制性论证:ask_ok('Do you really want to quit?')

  • 给出一个可选的参数:ask_ok('OK to overwrite the file?', 2)

  • 或甚至给出所有参数:ask_ok('OK to overwrite the file?', 2, 'Come on, only yes or no!')

此示例还介绍了 in 关键字。这将测试序列是否包含某个值。

默认值在 defining 作用域中的函数定义点进行求值,因此

i = 5

def f(arg=i):
    print(arg)

i = 6
f()

将打印 5

重要警告: 默认值仅计算一次。当默认值是一个可变对象(如列表,字典或大多数类的实例)时,这会产生不同。例如,以下函数累积在后续调用中传递给它的参数:

def f(a, L=[]):
    L.append(a)
    return L

print(f(1))
print(f(2))
print(f(3))

这将打印

[1]
[1, 2]
[1, 2, 3]

如果不希望在后续调用之间共享默认值,您可以写这样的函数:

def f(a, L=None):
    if L is None:
        L = []
    L.append(a)
    return L

4.7.2. 关键字参数

函数也可以使用形式 kwarg=value关键字参数 来调用。例如,以下函数:

def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
    print("-- This parrot wouldn't", action, end=' ')
    print("if you put", voltage, "volts through it.")
    print("-- Lovely plumage, the", type)
    print("-- It's", state, "!")

接受一个必需参数(voltage)和三个可选参数(stateactiontype)。可以通过以下任意方式调用此函数:

parrot(1000)                                          # 1 positional argument
parrot(voltage=1000)                                  # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM')             # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000)             # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump')         # 3 positional arguments
parrot('a thousand', state='pushing up the daisies')  # 1 positional, 1 keyword

但所有以下调用将无效:

parrot()                     # required argument missing
parrot(voltage=5.0, 'dead')  # non-keyword argument after a keyword argument
parrot(110, voltage=220)     # duplicate value for the same argument
parrot(actor='John Cleese')  # unknown keyword argument

在函数调用中,关键字参数必须遵循位置参数。所有传递的关键字参数必须匹配函数接受的参数之一(例如,actor 不是 parrot 函数的有效参数),并且它们的顺序并不重要。这也包括非可选参数(例如 parrot(voltage=1000) 也有效)。没有参数可以多次接收到值。这里有一个示例,由于这个限制失败:

>>> def function(a):
...     pass
...
>>> function(0, a=0)
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
TypeError: function() got multiple values for keyword argument 'a'

当存在形式 **name 的最终形式参数时,它接收包含除了对应于形式参数的那些之外的所有关键字参数的字典(参见 映射类型— dict)。这可以与形式 *name (在下一小节中描述)的形式参数组合,该形式参数接收包含形式参数列表之外的位置参数的元组。 (*name 必须在 **name 之前。)例如,如果我们定义一个这样的函数:

def cheeseshop(kind, *arguments, **keywords):
    print("-- Do you have any", kind, "?")
    print("-- I'm sorry, we're all out of", kind)
    for arg in arguments:
        print(arg)
    print("-" * 40)
    keys = sorted(keywords.keys())
    for kw in keys:
        print(kw, ":", keywords[kw])

它可以这样调用:

cheeseshop("Limburger", "It's very runny, sir.",
           "It's really very, VERY runny, sir.",
           shopkeeper="Michael Palin",
           client="John Cleese",
           sketch="Cheese Shop Sketch")

当然它会打印:

-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
client : John Cleese
shopkeeper : Michael Palin
sketch : Cheese Shop Sketch

注意,关键字参数名称的列表是通过在打印其内容之前对关键词字典的 keys() 方法的结果排序而创建的;如果不这样做,则打印参数的顺序未定义。

4.7.3. 任意参数列表

最后,最不常用的选项是指定可以使用任意数量的参数调用函数。这些参数将被包装成一个元组(参见 元组和序列)。在可变数量的参数之前,可能发生零个或多个正常参数。

def write_multiple_items(file, separator, *args):
    file.write(separator.join(args))

通常,这些 variadic 参数将是形式参数列表中的最后一个,因为它们会捡取传递给函数的所有其余输入参数。在 *args 参数之后发生的任何形式参数都是“仅关键字”参数,这意味着它们只能用作关键字而不是位置参数。

>>> def concat(*args, sep="/"):
...     return sep.join(args)
...
>>> concat("earth", "mars", "venus")
'earth/mars/venus'
>>> concat("earth", "mars", "venus", sep=".")
'earth.mars.venus'

4.7.4. 打开参数列表

相反的情况发生在参数已经在列表或元组中,但是需要为需要单独的位置参数的函数调用解包时。例如,内置的 range() 函数需要单独的 startstop 参数。如果它们不是单独可用的,请使用 * -operator写函数调用,以从列表或元组中解包参数:

>>> list(range(3, 6))            # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> list(range(*args))            # call with arguments unpacked from a list
[3, 4, 5]

以同样的方式,字典可以用 ** -operator传递关键字参数:

>>> def parrot(voltage, state='a stiff', action='voom'):
...     print("-- This parrot wouldn't", action, end=' ')
...     print("if you put", voltage, "volts through it.", end=' ')
...     print("E's", state, "!")
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !

4.7.5. Lambda表达式

可以使用 lambda 关键字创建小型匿名函数。此函数返回其两个参数的总和:lambda a, b: a+b。 Lambda函数可用于需要函数对象的任何地方。它们在语法上限于单个表达式。语义上,它们只是用于正常函数定义的语法糖。与嵌套函数定义类似,lambda函数可以引用包含作用域的变量:

>>> def make_incrementor(n):
...     return lambda x: x + n
...
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43

上面的例子使用lambda表达式来返回一个函数。另一个用途是传递一个小函数作为参数:

>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1])
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]

4.7.6. 文档字符串

下面是关于文档字符串的内容和格式的一些约定。

第一行应始终是对象的目的的简短摘要。为了简洁,它不应该显式地声明对象的名称或类型,因为这些可以通过其他方式获得(除非名称恰好是描述函数操作的动词)。此行应以大写字母开头,并以句点结尾。

如果文档字符串中有更多行,则第二行应为空白,将摘要与其余描述视觉上分开。以下行应该是描述对象的调用约定,其副作用等的一个或多个段落。

Python解析器不会在Python中从多行字符串文字中删除缩进,因此处理文档的工具必须剥离缩进。这是使用以下约定完成的。第一个非空白行 after 字符串的第一行确定整个文档字符串的缩进量。 (我们不能使用第一行,因为它通常与字符串的开头引号相邻,所以它的缩进在字符串文字中是不明显的)。然后,从该字符串的所有行的开始处剥离该缩进的空白“等价” 。缩进较少的行不应该出现,但如果它们出现,它们的所有前导空白都应该被删除。扩展标签(通常为8个空格)后,应测试空格的等效性。

这里是一个多行docstring的例子:

>>> def my_function():
...     """Do nothing, but document it.
...
...     No, really, it doesn't do anything.
...     """
...     pass
...
>>> print(my_function.__doc__)
Do nothing, but document it.

    No, really, it doesn't do anything.

4.7.7. 函数注释

函数注释 是关于用户定义函数使用的类型的完全可选的元数据信息(有关更多信息,请参阅 PEP 484)。

注释作为字典存储在函数的 __annotations__ 属性中,并且对函数的任何其他部分没有影响。参数注释由参数名称后面的冒号定义,后跟表达式求值到注释的值。返回注释由文字 -> 定义,后跟表达式,在参数列表和表示 def 语句结束的冒号之间。以下示例具有位置参数,关键字参数和注释的返回值:

>>> def f(ham: str, eggs: str = 'eggs') -> str:
...     print("Annotations:", f.__annotations__)
...     print("Arguments:", ham, eggs)
...     return ham + ' and ' + eggs
...
>>> f('spam')
Annotations: {'ham': <class 'str'>, 'return': <class 'str'>, 'eggs': <class 'str'>}
Arguments: spam eggs
'spam and eggs'

4.8. Intermezzo:编码风格

现在你将要编写更长,更复杂的Python部分,现在是讨论 编码风格 的好时机。大多数语言可以写成(或更简洁,formatted)在不同的样式;一些比其他更可读。让他人容易阅读你的代码总是一个好主意,并采用一个很好的编码风格有助于巨大的。

对于Python,PEP 8 已经成为大多数项目坚持的风格指南;它促进一种非常可读和令人愉快的编码风格。每个Python开发人员都应该在某个时候阅读它;这里是为你提取的最重要的点:

  • 使用4空格缩进,没有制表符。

    4个空格是小缩进(允许更大的嵌套深度)和大缩进(更容易阅读)之间的良好折衷。标签引入混乱,最好省略。

  • 换行,使其不超过79个字符。

    这有助于用户使用小显示器,并可以在较大的显示器上并排放置多个代码文件。

  • 使用空行来分隔函数和类,以及函数中更大的代码块。

  • 如果可能,在自己的行上放置注释。

  • 使用docstrings。

  • 使用运算符周围的空格和逗号后,但不直接在括号结构内:a = f(1, 2) + g(3, 4)

  • 一致地命名您的类和功能;惯例是使用 CamelCase 用于类和 lower_case_with_underscores 用于函数和方法。始终使用 self 作为第一个方法参数的名称(有关类和方法的更多信息,请参见 类的第一看)。

  • 如果您的代码是要在国际环境中使用,请不要使用花哨的编码。 Python的默认值,UTF-8,甚至纯ASCII在任何情况下工作的最好。

  • 同样,如果只有最少的机会,人们说不同的语言将读取或维护代码,不要在标识符中使用非ASCII字符。

脚注

[1]

实际上,通过对象引用调用 将是一个更好的描述,因为如果可变对象被传递,调用者将看到被调用者对它(插入到列表中的项目)所做的任何更改。