深圳幻海软件技术有限公司 欢迎您!

作为初学者应避免的四个常见 Python 错误

2023-02-28

Python对于初学者来说是一门优秀的语言,但这并不意味着就不会犯错误。尤其是在学习编程的早期阶段,很容易编写出技术上正确但风格上很差的代码。如果您要学习编码,那么学好它是至关重要的。无论是在学术界还是工业界,代码的质量都很重要。它不仅会影响您,还会影响将继续阅读和使用您的代码的每一个人。也许更自私

Python 对于初学者来说是一门优秀的语言,但这并不意味着就不会犯错误。 尤其是在学习编程的早期阶段,很容易编写出技术上正确但风格上很差的代码。

如果您要学习编码,那么学好它是至关重要的。 无论是在学术界还是工业界,代码的质量都很重要。 它不仅会影响您,还会影响将继续阅读和使用您的代码的每一个人。 也许更自私的是,它还会影响您的招聘前景。

在本文中,我将讨论介绍性 Python 程序员常犯的四个错误。 在我早期的 Python 时代学习这些陷阱对我非常有帮助,我希望它也能对你有用。

让我们开始吧。

布尔条件语句

这是入门程序员常犯的错误。 这也是不那么入门的程序员所犯的错误,他们缺乏正式的编程背景,因为他们只是将代码用作工具。 我在看着你,数据科学家。

Python 中的条件语句很有用,但并不总是必需的。 当您检查的条件已经包含布尔值(真或假)时,尤其如此。

让我用一个简单的例子来说明。 假设我们要编写代码来确定一个数据集是否已经被清理过。 对我们来说幸运的是,代码库包含一个名为 is_data_clean 的方便变量,它可以跟踪这一点。 我们需要做的就是检查它并返回正确的值。

作为第一次尝试,我们可能会编写如下内容:

def a_function():
    if is_data_clean == True:
        return True
    else:
        return False
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

这已经可以运行了,但它不必如此复杂。 你看到问题了吗? 仔细看。

变量 is_data_clean 已经是一个布尔值; 因此,它已经包含了您需要返回的值! 代码检查它是否为 True,然后返回 True,如果它不是 True(意味着它为 False),则代码返回 False。 这只是一大堆不必要的检查。

我们可以将函数中的代码简化为一行:

def a_function():
    return is_data_clean
  • 1.
  • 2.

好多了。

手动求和、均值或其他内置操作

Python 具有比大多数人意识到的更多的内置功能。 仍然使用循环来手动计算总和的人数实在是太多了。

如果我们在 Python 中有一个数字列表,我们绝对不应该像这样计算总和:

total = 0
for num in numbers_list:
    total += num
  • 1.
  • 2.
  • 3.

请改用内置的求和函数:

total
  • 1.

需要最小值还或最大值? 全宇宙都禁止你写这样的代码:

import math
minimum = math.inf # 从最高可能值开始
for number in numbers_list:
    if number < minimum:
        minimum = number
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

这不是介绍性的计算机科学原理课程; 这是真实的世界。 停止重新发明轮子并使用内置的 min 和 max 函数:

minimum = min(numbers_list)
maximum
  • 1.
  • 2.

​有关内置函数的完整列表,请参阅 Python 文档

奖励:技术上不是内置的内置功能。

有些功能很难找到,但这并不意味着您不应该找到它们。

例如,如果我们需要一列数字​的平均值(您可能会感觉到这是反复出现的主题),我们可以使用下面的第一个代码片段,但我们应该使用第二个:

# 片段 1:不要这样做!
total = 0
for num in numbers_list:
    total += num
avg = total / len(numbers_list)

# 片段 2:这样做!
import numpy as np
avg = np.mean(numbers_list)
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.

通常,Python 会在模块中提供有用的函数。 定位我们需要的模块并导入函数可能需要一些额外的工作,但非常值得。

请记住 — Python 就是简单性和可读性。 内置函数是你的朋友。 与你的人类朋友不同,他们永远不会让人失望。

不做无意义的事情

在我教授的一门 Python 入门课程中,学生的第一个项目是编写一个简单的决策算法。 这主要是一个条件练习,要求学生定义一个问题和相关的评分系统,以确定某人有资格回答这个问题的可能性。

例如,有人可能会问,“我应该成为一名数据科学家吗?” 然后,该算法可能包含以下问题,所有这些问题都会根据答案从最终输出分数中增加或减少:

  • 我是否有兴趣使用数据来深入了解世界?
  • 我愿意学习 Python 吗?
  • 我喜欢与多学科团队合作吗?

等等。

在编写算法的过程中,许多学生意识到在某些情况下,他们根本不想对总分做任何事情。 例如,他们可能会决定,如果有人愿意学习 Python,那么他们的总分会增加 10 分,但如果他们不愿意,则分数保持不变。

大多数学生使用以下代码实现它:

# willing_to_lean 是一些基于用户输入的预定义变量
if willing_to_learn:
    score += 10
else:
    score += 0
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

这是什么都不做的经典案例。 让我们分解一下 Python 在看到代码行 score += 0 时必须执行的所有操作:

  • 它需要查找变量 score 的值。
  • 它需要将 0 添加到该值。 这需要调用加法函数,传入两个参数(当前值和 0),并计算输出。
  • 将 score 变量重新分配给新值(显然是相同的)。

所有这些代码什么都不做。

当然,这对计算机来说不是很大的工作量,也不会对代码的效率产生任何有意义的影响。 也就是说,它毫无意义,而且有些不干净,这是优秀 Python 代码所不具备的特征。

更好的解决方案是使用 Python 的 pass 关键字,它实际上告诉 Python 什么都不做,继续前进。 它填充了一行不需要的代码,但如果完全留空就会出错。 我们甚至可以添加一点评论以提供进一步的清晰度:

if willing_to_learn:
    score += 10
else:
    pass # 保持分数不变
  • 1.
  • 2.
  • 3.
  • 4.

更干净、更清晰、更 Pythonic。

单一的条件变得疯狂

条件语句可以说是标准编程中最强大和一致的结构之一。 第一次学习它时,很容易忽略一个重要的微妙之处。

当我们要检查两个或多个条件时,就会出现这种情况。 例如,假设我们正在审查一项调查,以获取以下三种形式之一的回答:“Yes”、“No”或“Maybe”。

早期的 Python 程序员通常使用以下两种方式之一对此进行编码:

# 可能 1
if response == "Yes":
    # do something
if response == "No":
    # do something
if response == "Maybe":
    # do something

# 可能 2
if response == "Yes":
    # do something
elif response == "No":
    # do something
else:
    # do something
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.

在这种情况下,这两个代码片段实际上是相同的。 它们的行为方式相同,理解起来并不特别混乱,并且它们实现了预期的目标。 当人们错误地认为上面的两个结构总是等价时,问题就出现了。

这是错误的。 上面的第二个代码片段是由多个部分组成的单个条件表达式,而第一个代码片段由三个独立的条件表达式组成,尽管它们看起来是相互关联的。

为什么这很重要? 因为每当 Python 看到一个全新的 if 关键字(即一个新的条件表达式开始)时,它就会检查关联的条件。 另一方面,如果当前条件表达式中的先前条件不满足,Python 只会输入 elif 或 else 条件。

让我们看一个例子,看看为什么这很重要。 假设我们需要编写代码,根据学生在某项作业中的分数给他们打分。 我们在Python 文件中写入以下代码:

score = 76

print("SNIPPET 1")
print()

if score < 100:
    print('A')
elif score < 90:
    print('B')
elif score < 80:
    print('C')
elif score < 70:
    print('D')
else:
    print('F')

print()
print("SNIPPET 2")
print()

if score < 100:
    print('A')
if score < 90:
    print('B')
if score < 80:
    print('C')
if score < 70:
    print('D')
if score < 60:
    print('F')
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.

运行此代码输出以下内容:

SNIPPET 1
A
SNIPPET 2
A
B
C
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.

你看得到差别吗? 在第二种情况下,我们得到了意想不到的输出。 为什么? 因为 Python 将每个 if 语句作为一个新的条件来读取,所以如果一个分数恰好小于多个数字检查,则会为所有这些打印出相应的字母等级。

现在,有多种方法可以使用多个 if 语句; 例如,我们可以让条件检查范围而不仅仅是上限。 这个例子的重点不是争论一个例子优于另一个例子(尽管为了清楚起见,我个人倾向于使用 elif 和 else),而只是为了说明它们是不一样的。

确保你明白这一点。

最后的想法和回顾

这是您的 Python 初学者备忘单:

  1. 当您可以简单地直接返回布尔值时,不要为布尔值设置不必要的条件。
  2. 内置函数是您最好的朋友。
  3. 如果您需要告诉 Python 什么都不做,请使用 pass 关键字。
  4. 确保正确构造条件表达式,理解 if 、 elif 和 else 关键字的含义。

你决定学习 Python 真是太好了——我向你保证,这门语言会对你很好。