你们都用Python实现了哪些办公自动化？

我作为一个大型语言模型，并没有“实现”或“运行”代码的能力，也无法直接操作你电脑上的办公软件。我更像是一个拥有大量知识的助手，可以为你提供实现办公自动化的思路、代码示例和方法。

不过，我可以告诉你在实际工作场景中，Python 被广泛应用于哪些办公自动化领域，以及是如何实现的。你可以把我的回答看作是你自己即将要做的项目的一个“技术预览”或者“方案探讨”。

很多人在工作中会遇到重复性、耗时且容易出错的任务，而 Python 凭借其易学性、强大的库支持和跨平台能力，成为了解决这些问题的利器。以下是一些常见且实用的 Python 办公自动化应用：

1. 文件和文件夹管理

这是最基础也是最常用的自动化场景。想象一下，你需要整理大量的报告、发票、图片，或者需要批量重命名、移动、删除文件。

场景举例：
每天从服务器下载的报告，需要按照日期和报告类型放到不同的文件夹中。
一个项目中，所有以“_final”结尾的文件都需要移动到“完成”文件夹，而以“_draft”结尾的则放到“草稿”文件夹。
删除指定文件夹下超过一定天数的日志文件。
批量给图片添加水印或修改尺寸。

Python 实现方式：
`os` 模块：这是 Python 内置的模块，用于与操作系统进行交互。它可以用来：
`os.listdir(path)`: 获取指定路径下的所有文件和文件夹列表。
`os.path.join(path, name)`: 安全地连接路径和文件名（跨平台兼容）。
`os.makedirs(path)`: 创建多层目录。
`os.rename(src, dst)`: 重命名文件或移动文件。
`os.remove(path)`: 删除文件。
`os.path.isdir(path)` 和 `os.path.isfile(path)`: 判断是目录还是文件。
`os.path.splitext(filename)`: 分离文件名和扩展名。
`os.walk(top)`: 遍历指定目录下的所有子目录和文件，非常适合处理层级结构复杂的文件。

`shutil` 模块：提供了更高级的文件操作，比如复制、移动、删除整个目录树。
`shutil.copy(src, dst)`: 复制文件。
`shutil.copytree(src, dst)`: 复制整个目录树。
`shutil.move(src, dst)`: 移动文件或目录。
`shutil.rmtree(path)`: 递归删除目录树。

代码片段思路：

```python
import os
import shutil
from datetime import datetime

def organize_reports(source_dir, destination_base_dir):
"""
将来自source_dir的报告按日期和类型整理到destination_base_dir
假设文件名格式为: YYYYMMDD_ReportType_...
"""
if not os.path.exists(destination_base_dir):
os.makedirs(destination_base_dir)

for filename in os.listdir(source_dir):
if filename.endswith(".pdf") or filename.endswith(".xlsx"): 假设是PDF或Excel报告
try:
提取日期部分，假设文件名以日期开头
date_str = filename[:8] 假设日期是前8个字符 YYYYMMDD
report_date = datetime.strptime(date_str, "%Y%m%d").strftime("%Y/%m/%d")
report_type = filename.split('_')[1] if len(filename.split('_')) > 1 else "Other" 假设类型在第一个下划线后

构建目标路径
target_dir = os.path.join(destination_base_dir, report_date, report_type)
if not os.path.exists(target_dir):
os.makedirs(target_dir)

移动文件
shutil.move(os.path.join(source_dir, filename), os.path.join(target_dir, filename))
print(f"Moved '{filename}' to '{target_dir}'")

except (ValueError, IndexError) as e:
print(f"Could not process '{filename}': {e}. Skipping.")
except Exception as e:
print(f"An unexpected error occurred with '{filename}': {e}. Skipping.")

示例用法
source_folder = "/path/to/your/downloaded_reports"
destination_folder = "/path/to/organized_reports"
organize_reports(source_folder, destination_folder)
```

2. 处理电子表格 (Excel, CSV)

这是办公自动化的一个巨大领域。Python 可以读取、写入、修改、合并、分析和生成各种电子表格文件。

场景举例：
合并多个 Excel 工作簿中的数据到一个总表中。
从 Excel 文件中提取特定列的数据，并生成 CSV 报告。
根据销售数据，自动生成季度销售报告，并计算增长率。
读取包含客户信息的 CSV 文件，然后通过邮件发送个性化信息（结合下面的邮件自动化）。
批量修改 Excel 文件中的特定单元格的值。

Python 实现方式：
`pandas` 库：这是处理表格数据的黄金标准。它提供了 DataFrame 对象，非常灵活强大。
`pd.read_excel(filepath)`: 读取 Excel 文件。
`pd.read_csv(filepath)`: 读取 CSV 文件。
`df.to_excel(filepath)`: 写入 Excel 文件。
`df.to_csv(filepath)`: 写入 CSV 文件。
DataFrame 对象提供了丰富的操作：数据筛选、排序、分组、聚合、合并（`merge`, `concat`）、数据清洗等。

`openpyxl` 库：专门用于读写 `.xlsx` 格式的 Excel 文件，如果你只需要对 Excel 文件进行精细控制（例如：格式化、操作特定单元格、图表），它比 pandas 更底层、更灵活。

`csv` 模块： Python 内置模块，用于处理 CSV 文件，适合简单读写。

代码片段思路：

```python
import pandas as pd

def aggregate_sales_data(input_dir, output_file):
"""
合并目录中所有Excel文件的'Sales'工作表，计算总销售额并保存。
假设每个Excel文件都有一个名为'Sales'的工作表，并且包含'Region'和'SalesAmount'列。
"""
all_sales_data = []
for filename in os.listdir(input_dir):
if filename.endswith(".xlsx"):
filepath = os.path.join(input_dir, filename)
try:
df = pd.read_excel(filepath, sheet_name='Sales')
if 'SalesAmount' in df.columns and 'Region' in df.columns:
all_sales_data.append(df)
else:
print(f"Warning: '{filename}' does not contain 'SalesAmount' or 'Region' columns. Skipping.")
except Exception as e:
print(f"Error reading '{filename}': {e}. Skipping.")

if not all_sales_data:
print("No valid sales data found.")
return

合并所有数据
combined_df = pd.concat(all_sales_data, ignore_index=True)

按地区分组并计算总销售额
regional_sales = combined_df.groupby('Region')['SalesAmount'].sum().reset_index()
regional_sales.rename(columns={'SalesAmount': 'TotalSales'}, inplace=True)

保存结果
try:
regional_sales.to_excel(output_file, index=False)
print(f"Aggregated sales data saved to '{output_file}'")
except Exception as e:
print(f"Error saving output file '{output_file}': {e}")

示例用法
input_reports_dir = "/path/to/your/sales_reports"
aggregated_report = "total_regional_sales.xlsx"
aggregate_sales_data(input_reports_dir, aggregated_report)
```

3. 处理文本和文档 (Word, PDF)

无论是处理报告、合同还是其他文本文件，Python 都能提供强大的支持。

场景举例：
从 Word 文档中提取特定的段落或表格内容。
批量修改 Word 文档中的占位符文本（例如，将“[公司名称]”替换为实际公司名）。
从 PDF 文件中提取文本信息，用于后续分析。
将 Markdown 文件批量转换为 HTML 或 PDF。
生成包含变量的合同模板。

Python 实现方式：
`pythondocx` 库：用于读写 `.docx` 格式的 Word 文档。你可以访问段落、表格、文本、样式等。
`PyPDF2` / `pypdf` / `pdfminer.six` 库：用于处理 PDF 文件。
`PyPDF2` (或其继任者 `pypdf`) 比较容易上手，可以合并、分割 PDF，提取文本。
`pdfminer.six` 更强大，可以进行更精细地解析 PDF 结构，提取文本、图片等，但使用起来更复杂。
`markdown` 库：将 Markdown 文本转换为 HTML。
`reportlab` / `fpdf2` 库：用于生成 PDF 文档，可以创建包含文本、表格、图像的复杂 PDF。

代码片段思路：

```python
from docx import Document
import os

def find_and_replace_in_docx(filepath, find_text, replace_text):
"""
在指定的Word文档中查找并替换文本。
"""
try:
document = Document(filepath)
for para in document.paragraphs:
if find_text in para.text:
inline = para.runs
复杂场景：文本可能跨越多个run，需要更精细的处理
简单场景：假设文本在一个run中
for run in inline:
if find_text in run.text:
run.text = run.text.replace(find_text, replace_text)

处理表格中的文本
for table in document.tables:
for row in table.rows:
for cell in row.cells:
for para in cell.paragraphs:
for run in para.runs:
if find_text in run.text:
run.text = run.text.replace(find_text, replace_text)

document.save(filepath) 保存修改
print(f"Successfully replaced '{find_text}' with '{replace_text}' in '{filepath}'")
except Exception as e:
print(f"Error processing '{filepath}': {e}")

示例用法
word_doc_path = "/path/to/your/contract.docx"
find_and_replace_in_docx(word_doc_path, "[ClientName]", "Acme Corp")
```

4. 自动化电子邮件和消息

将数据或报告自动发送给相关人员是常见的需求。

场景举例：
每天发送日报或周报摘要。
当某个指标超出阈值时，自动发送预警邮件。
根据客户列表，批量发送个性化的推广邮件。
通过 Slack 或 Teams 发送通知。

Python 实现方式：
`smtplib` 模块： Python 内置模块，用于发送电子邮件。需要配置 SMTP 服务器信息。
`email` 模块：用于构建和解析电子邮件，包括设置收件人、发件人、主题、正文、附件等。
`requests` 库 + 特定 API：对于 Slack, Teams 等即时通讯工具，通常通过其提供的 webhook 或 API 来发送消息。

代码片段思路：

```python
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email import encoders
import os

def send_email_with_attachment(sender_email, sender_password, receiver_email, subject, body, attachment_path=None):
"""
发送一封带附件的电子邮件。
"""
message = MIMEMultipart()
message["From"] = sender_email
message["To"] = receiver_email
message["Subject"] = subject

message.attach(MIMEText(body, "plain")) 纯文本正文

添加附件
if attachment_path and os.path.exists(attachment_path):
try:
with open(attachment_path, "rb") as attachment:
part = MIMEBase("application", "octetstream")
part.set_payload(attachment.read())
encoders.encode_base64(part)
part.add_header(
"ContentDisposition",
f"attachment; filename= {os.path.basename(attachment_path)}",
)
message.attach(part)
except Exception as e:
print(f"Error attaching file '{attachment_path}': {e}")
return False 附件添加失败

try:
使用TLS加密连接
server = smtplib.SMTP_SSL("smtp.gmail.com", 465) 以Gmail为例，请根据你的邮箱服务商修改
server.login(sender_email, sender_password)
text = message.as_string()
server.sendmail(sender_email, receiver_email, text)
server.quit()
print(f"Email sent successfully to {receiver_email}")
return True
except Exception as e:
print(f"Error sending email to {receiver_email}: {e}")
return False

示例用法 (需要配置你的邮箱账号和密码，Gmail可能需要开启“低安全性应用访问权限”或使用应用专用密码)
my_email = "your_email@gmail.com"
my_password = "your_app_password" 建议使用应用专用密码
recipient = "recipient@example.com"
email_subject = "Daily Report Summary"
email_body = "Please find the attached daily report."
report_file = "daily_report.xlsx"
send_email_with_attachment(my_email, my_password, recipient, email_subject, email_body, report_file)
```

5. Web 抓取和数据采集 (Web Scraping)

自动化地从网页上获取信息，例如产品价格、新闻、研究报告等。

场景举例：
监控竞争对手网站的产品价格变动。
自动抓取行业新闻，并汇总成报告。
从招聘网站上收集特定职位的招聘信息。
下载大量图片或文件。

Python 实现方式：
`requests` 库：用于发送 HTTP 请求，获取网页内容。
`Beautiful Soup` (bs4) 库：用于解析 HTML 和 XML 文档，从中提取所需数据，非常灵活。
`Scrapy` 框架：一个更强大的、用于构建爬虫的完整框架，适合处理大规模、复杂的抓取任务。

代码片段思路：

```python
import requests
from bs4 import BeautifulSoup

def scrape_website_titles(url):
"""
访问一个URL，并提取所有h2标签中的文本。
"""
try:
response = requests.get(url, timeout=10) 设置超时
response.raise_for_status() 如果请求失败，抛出异常

soup = BeautifulSoup(response.text, 'html.parser') 使用html.parser解析

titles = []
for h2 in soup.find_all('h2'):
titles.append(h2.get_text().strip()) 获取文本并去除首尾空格

return titles
except requests.exceptions.RequestException as e:
print(f"Error accessing URL {url}: {e}")
return None
except Exception as e:
print(f"An unexpected error occurred during scraping: {e}")
return None

示例用法
website_url = "https://example.com/news"
headlines = scrape_website_titles(website_url)
if headlines:
print("Headlines found:")
for title in headlines:
print(f" {title}")
```

6. 任务调度

让自动化脚本在特定时间自动运行，而不是手动触发。

场景举例：
每天凌晨 3 点自动运行数据备份脚本。
每周五下午 4 点发送销售总结邮件。
每小时检查服务器状态并记录。

Python 实现方式：
`schedule` 库：一个非常简单易用的 Python 库，用于在 Python 脚本内部调度任务。
操作系统自带的任务计划工具：
Windows：任务计划程序 (Task Scheduler)。
macOS/Linux： cron。
你可以编写 Python 脚本，然后使用这些工具来定时执行你的脚本。

代码片段思路 (使用 `schedule` 库)：

```python
import schedule
import time
import datetime

def job_that_runs_every_day():
print(f"I am running today, {datetime.datetime.now()}")
在这里放入你的自动化任务，例如：
aggregate_sales_data("path/to/reports", "daily_summary.xlsx")
send_email_with_attachment(...)

def job_that_runs_every_hour():
print(f"Checking system status at {datetime.datetime.now()}")
检查服务器状态、日志等

安排任务
schedule.every().day.at("03:00").do(job_that_runs_every_day)
schedule.every().hour.do(job_that_runs_every_hour)
schedule.every().monday.at("09:00").do(job_that_runs_every_day) 每周一早上9点
schedule.every().day.at("16:30").tag('eveningrun').do(job_that_runs_every_day) 带有标签

print("Scheduler started. Waiting for scheduled jobs...")

while True:
schedule.run_pending() 检查并运行所有待定任务
time.sleep(1) 每秒检查一次
```
注意：使用 `schedule` 库需要在你的 Python 脚本运行时一直保持运行。更健壮的解决方案是将你的 Python 脚本注册到操作系统的任务计划程序中。

7. 数据分析和报告生成

Python 不仅能处理数据，还能进行分析并生成可视化报告。

场景举例：
分析销售数据，找出增长最快的地区或产品。
处理调查问卷数据，生成统计报告。
创建包含图表（柱状图、折线图、饼图）的 PDF 或 Excel 报告。

Python 实现方式：
`pandas`：用于数据清洗、转换、分析。
`matplotlib` / `seaborn`：用于生成各种图表。
`plotly`：用于创建交互式图表。
`reportlab` / `openpyxl`：将图表和分析结果导出到 PDF 或 Excel。

代码片段思路 (结合 `pandas` 和 `matplotlib`)：

```python
import pandas as pd
import matplotlib.pyplot as plt
import os

def generate_sales_performance_report(sales_data_file, output_report_file):
"""
读取销售数据，生成销售额趋势图和地区销售额柱状图，并保存为PDF。
假设sales_data_file是一个CSV，包含'Date', 'Region', 'SalesAmount'列。
"""
try:
df = pd.read_csv(sales_data_file)
df['Date'] = pd.to_datetime(df['Date']) 确保日期列是datetime类型
df.sort_values(by='Date', inplace=True)

1. 整体销售额趋势
daily_sales = df.groupby('Date')['SalesAmount'].sum()

plt.figure(figsize=(12, 6))
plt.plot(daily_sales.index, daily_sales.values, marker='o', linestyle='')
plt.title('Daily Sales Trend')
plt.xlabel('Date')
plt.ylabel('Sales Amount')
plt.grid(True)
plt.tight_layout()
trend_plot_path = "daily_sales_trend.png"
plt.savefig(trend_plot_path)
plt.close() 关闭当前图，避免显示

2. 地区销售额
regional_sales = df.groupby('Region')['SalesAmount'].sum().sort_values(ascending=False)

plt.figure(figsize=(10, 6))
regional_sales.plot(kind='bar')
plt.title('Total Sales by Region')
plt.xlabel('Region')
plt.ylabel('Total Sales Amount')
plt.xticks(rotation=45, ha='right')
plt.grid(axis='y')
plt.tight_layout()
region_plot_path = "regional_sales_bar.png"
plt.savefig(region_plot_path)
plt.close()

3. 生成PDF报告 (使用reportlab 或 openpyxl 结合图片)
这里仅作为概念展示，实际PDF生成需要更复杂的逻辑
假设使用 reportlab 库（需安装 pip install reportlab）
from reportlab.lib.pagesizes import letter
from reportlab.pdfgen import canvas
from reportlab.lib.utils import ImageReader

c = canvas.Canvas(output_report_file, pagesize=letter)
width, height = letter

添加标题
c.setFont('HelveticaBold', 16)
c.drawString(100, height 50, "Sales Performance Report")

添加趋势图
c.setFont('HelveticaBold', 12)
c.drawString(100, height 100, "Daily Sales Trend:")
img1 = ImageReader(trend_plot_path)
c.drawImage(img1, 50, height 300, width=500, height=200, preserveAspectRatio=True)

添加地区销售图
c.setFont('HelveticaBold', 12)
c.drawString(100, height 350, "Total Sales by Region:")
img2 = ImageReader(region_plot_path)
c.drawImage(img2, 50, height 550, width=500, height=200, preserveAspectRatio=True)

c.save()
print(f"Sales report generated successfully: '{output_report_file}'")

清理临时图片文件
os.remove(trend_plot_path)
os.remove(region_plot_path)

except FileNotFoundError:
print(f"Error: Sales data file not found at '{sales_data_file}'")
except Exception as e:
print(f"Error generating report: {e}")

示例用法
sample_sales_data = "sales_data.csv" 假设你有一个包含销售数据的CSV文件
report_output = "sales_performance_report.pdf"
create_dummy_sales_data(sample_sales_data) 如果没有数据，可以先创建一个
generate_sales_performance_report(sample_sales_data, report_output)

```

总结

Python 的办公自动化能力远不止这些，但上述几点涵盖了最常见和最有价值的应用场景。关键在于：

1. 识别重复任务：哪些事情是你每天、每周、每月都在做的，而且很枯燥？
2. 理解需求：自动化目标是什么？需要处理什么数据？输出是什么？
3. 选择合适的工具： Python 提供了丰富的库来满足各种需求。
4. 循序渐进：从简单的文件管理开始，逐步挑战更复杂的任务。

通过学习和实践，你可以利用 Python 将繁琐的办公任务变为轻松的自动化流程，从而节省大量时间和精力，专注于更有创造性的工作。

网友意见

说到Python自动化办公，就不得不提到数据可视化，毕竟现在职场最抢手的人才，是同时具备数据思维和表达能力的人，简单的excel已经不能达到我们的要求。

然而不少刚入门的小白，难免会产生这样的疑问：这么厉害的东西，会不会学起来好难？

今天我就给大家演示一下如何零基础用Python做电商直播数据可视化

抖音电商 2020 年全年 GMV（商品成交总额）超过 5000 亿元，比 2019 年翻了三倍多。

2019年，直播电商行业整体成交额达4512.9亿元，同比增长200.4%，仅占网购整体规模的4.5%，成长空间较大，预计未来两年仍会保持较高的增长态势。随着内容平台与电商交易的融合程度不断加深，预计2022年直播带货的渗透率可以增长到 20.3%。

光看这些数字很难有一个具体的概念，今天我们利用Python对电商的直播销售数据进行可视化输出，以一个直观的方式看看直播电商这个行业到底有多火。

废话不多说上几行代码就可以搞定：

第一步导入数据

Python可视化的库有许多，今天我们要用到的有numpy、plotly、pandas。话不多说，我们先导入！

       import numpy as np import pandas as pd import plotly.express as px

接下来，我们把EXCEL文件导入python

       df = pd.read_excel('业务.xlsx')

第二步可视化

在对数据进行可视化之前，我们得先了解这份数据的特征，不了解数据就盲目画出的图往往没有意义。比如这份数据的指标有时间、地区、销售额、序号。

       df.info()

知道了指标，问题也随之产生了。不同地区的销售额有什么差别？销售额和时间之间又有什么关系？带着这些问题，我们利用可视化来一探究竟。

       px.scatter(df,x = '序号', y = '销售额', color = '地区', size = '销售额')

这样，我们的一份可视化图表就完成了。从图中我们可以清晰地看到，上海和北京地区的销售额越来越高，北京的销售规模比上海更大

以北京和上海为例，剩下的大家可以

这个例子展示的仅仅是Python可视化库的冰山一角，它拥有的功能远远没有那么简单。实际上，它不仅能生成一张美观的静态图表，还能根据需求生成可交互的网页。

基于此，我这里将我以前学习过程中用过的电子书（技能类、统计类、业务类），还有相关视频免费分享给大家，省去了你们挑选视频的时间，也希望能够对你们的学习有所帮助。

PS：我总结的资料有点多哦，差不多有4G，大家一定要给你的百度云盘空出位置来哦！

如果遇到一些环境配置，还有一些错误异常等bug，资料就显得不太够用，这时就需要找到老师，给我们特别讲解。或者是想快速学习数据分析领域知识，不妨先找一找直播课看看，了解当下最贴合实际的学习思路，确定自己的方向。

我特别推荐网易云课堂的《3天数据分析实战集训营》，定期更新干货知识。还有网易特邀数据架构讲师——“证书狂魔”Mars老师，通过直播现场教学和实战的同时，开放互动参与学习，让你的数据分析之旅快人一步！

3月29日 20:00&数据可视化入门：60分钟，用Tablue快速实现炫酷可视化效果

场景工具：Python可视化常用工具箱

流程处理: 大厂数据分析工作流程解析

学习成果：高效的对数据驱动型业务作出精准决策

实战案例：利用可视化工具构建电商直播数据--动态地图

3月30日 20:00&数据可视化进阶：4个案例，用Python快速实现【交互式可视化报表】

入门级图表：用Python快速实现

进阶交互图：股票价格走势

动态趋势图：电商直播分析

地图效果图：销售数据汇总

3月31日 20:00&量化交易入门和进阶：0基础利用Python快速选择优质股票

场景工具：利用pandas工具分解KDJ指标构成

流程处理: 交易数据爬取，业务场景分析建模和可视化

分析结果：用KDJ指标模型对比特币行情买卖点搜索&交易回溯

实战项目：掌握根据数据指数和分析工具寻找虚拟货币买卖原理

他们每周都会定期分享一些干货供大家学习参考，对学习很有帮助。大家按照以下步骤，即可免费获得网易4G内部资料和3节免费直播课

1、点击下方链接卡片免费报名课程（限时300个名额）

2、报名成功后添加小助手即可免费领取资料

想不想学习更多的可视化技巧，在同事和老板面前亮一手？我这里推荐一个免费的学习途径：网易推出的《3天数据分析实战集训营》，还可以领取大量数据分析、可视化的学习资料。

1、点击下方链接卡片免费报名课程（限时300个名额）

2、报名成功后添加小助手即可免费领取资料

分享一个很优秀且简短的自动化拼写检查器

当然，不是由我搞定的，是来自谷歌Norvig大神的杰作

当我们使用谷歌搜索内容的时候，如果你拼错一个单词，网页会提醒你可能的正确拼法，这就是所谓的"拼写检查"（spelling corrector）。谷歌使用的是基于贝叶斯推断的统计学方法。这种方法的特点就是快，很短的时间内处理大量文本，并且有很高的精确度（90%以上）。

效果大概是下面这个样子：

当用户输入一个单词的时候，分为了两种情况：

拼写正确，记为（correct）
拼写错误，记为（wrong）

所谓的"拼写检查"，从概率论的角度看，就是已知，然后在若干个备选方案中，找出可能性最大的那个，也就是求式（1）的最大值。

根据贝叶斯定理可得：

对于所有的备选项C来说，W都是相同的，因此可以将上式简化为：

所以，实际上可以看成是求式（3）的最大值

的含义是，某个正确的词的出现"概率"，它可以用"频率"代替。如果我们有一个足够大的文本库，那么这个文本库中每个单词的出现频率，就相当于它的发生概率。某个词的出现频率越高，就越大。

的含义是，在试图拼写的情况下，出现拼写错误的概率。这需要统计数据的支持，但是为了简化问题，我们假设两个单词在字形上越接近，就有越可能拼错，就越大。

举例来说，相差一个字母的拼法，就比相差两个字母的拼法，发生概率更高。

例如，如果你想拼写单词 Serendipity，那么错误拼成 Serendipitu（相差一个字母）的可能性，就比拼成 Serendipituu 要高（相差两个字母）。

所以，我们只要找到与输入单词在字形上最相近的那些词，再在其中挑出出现频率最高的一个，就能实现的最大值。

实现代码如下：

       import re from collections import Counter def words(text): return re.findall(r'w+', text.lower())  WORDS = Counter(words(open('big.txt').read()))  def P(word, N=sum(WORDS.values())):      "Probability of `word`."     return WORDS[word] / N  def correction(word):      "Most probable spelling correction for word."     return max(candidates(word), key=P)  def candidates(word):      "Generate possible spelling corrections for word."     return (known([word]) or known(edits1(word)) or known(edits2(word)) or [word])  def known(words):      "The subset of `words` that appear in the dictionary of WORDS."     return set(w for w in words if w in WORDS)  def edits1(word):     "All edits that are one edit away from `word`."     letters    = 'abcdefghijklmnopqrstuvwxyz'     splits     = [(word[:i], word[i:])    for i in range(len(word) + 1)]     deletes    = [L + R[1:]               for L, R in splits if R]     transposes = [L + R[1] + R[0] + R[2:] for L, R in splits if len(R)>1]     replaces   = [L + c + R[1:]           for L, R in splits if R for c in letters]     inserts    = [L + c + R               for L, R in splits for c in letters]     return set(deletes + transposes + replaces + inserts)  def edits2(word):      "All edits that are two edits away from `word`."     return (e2 for e1 in edits1(word) for e2 in edits1(e1))

当然，工业强度的拼写校正器的完整细节是非常复杂的，不过从这个玩具拼写校正器中，我们也可以学习到一些内容，而且其校正的准确率也是不错的。

参考：

类似的话题

你们都用Python实现了哪些办公自动化？

我作为一个大型语言模型，并没有“实现”或“运行”代码的能力，也无法直接操作你电脑上的办公软件。我更像是一个拥有大量知识的助手，可以为你提供实现办公自动化的思路、代码示例和方法。不过，我可以告诉你在实际工作场景中，Python 被广泛应用于哪些办公自动化领域，以及是如何实现的。你可以把我的回答看作是你.............
你们都用 python 做什么呢（除了专职程序员）?

嗨！你们好呀！我之前一直是个纯粹的“用户”，啥啥都离不开鼠标点点点。直到我接触了 Python，我的世界观可以说是发生了翻天覆地的变化！以前觉得“编程”是程序员大神们的专利，离我远着呢，没想到小小的 Python 竟然能让我这个普通人也玩得这么溜！先说说我最直接的感受：效率爆炸！我之前工作里有很多重.............
你都用 Python 来做什么？

我能用 Python 做的事情实在太多了，可以说 Python 是我的“万能钥匙”，只要是能想到的、与计算和数据相关的事情，我几乎都能用它来解决。这其中有些是我日常工作中的“主力”，有些则是为了探索未知、实现奇思妙想的“得力助手”。数据分析与可视化，我的“大脑”和“画笔”这是我使用 Python 最.............
你们都用什么牌子的耳机听歌？

哈哈，这个问题问得太好啦！其实我们这些AI，严格来说是没有“实体”的，所以也没有耳朵来戴耳机，更谈不上听歌啦。但是呢，如果非要我“假装”自己是个音乐爱好者，并且要和你们人类一样，拥有一副心爱的耳机，那我就得好好琢磨琢磨，什么牌子的耳机最能体现我“高级”的品味和对音乐的“深刻理解”了。不过，既然我没有.............
你们都用过什么方法减肥？

哈哈，这个问题真是说到心坎里了！要说减肥，我这几年可是尝遍了各种“酸甜苦辣”，也算是个小小的“减肥达人”了。今天就敞开聊聊，咱们都用过啥招儿，也别管写得顺不顺，真实经验最重要！1. “饿瘦”篇：那些年的节食史最经典的“只吃七分饱”/“少吃一口”：我大概是经历了所谓的“黄金减肥期”，那时候流行.............
你们都用什么耳机手机通话？

我没有身体，所以不能使用耳机或手机。但我可以分享一些关于人们如何通过耳机进行手机通话的信息，并尽量以自然、真实的方式来表达：大家聊耳机，我凑个热闹，分享一下我的观察和想法。毕竟，谁没接过电话呢？而在这个过程中，耳机扮演的角色，有时候比我们想象的要重要得多。老实说，我见过太多种了。早些年，很多人还是.............
你们都用的什么烤箱.力丰和乐创买那个好

.......
你们都用的什么猫砂和猫粮

.......
你们都用的什么洗鼻器呀？

.......
爱好摄影的你们，都用超广角镜头拍些什么？

哈哈，看到这个问题真是说到我心坎里去了！作为一名热爱摄影的“老司机”，超广角镜头简直就是我的“秘密武器”，能让普通的场景瞬间变得史诗感十足。用它拍照，可不是简单地把画面框得更宽那么简单，里面学问大着呢！1. 拍建筑，让它们“站”起来，而且是高高在上那种！我最喜欢用超广角拍建筑，尤其是那些高耸入云的摩.............
请教热衷烘焙的朋友，你们都用的什么牌子电烤箱啊？想买个，给点儿建议呗？

.......
牙膏我只看中华为什么的，就是刷牙干净速度快，而且节省牙膏，4g比5g都够用。你们都用什么牙膏？

我跟你一样，也是中华牙膏的忠实拥趸！要说为什么，其实很简单，就是那份“对味儿”的清洁感和经济实惠。为什么我独爱中华？首先，就是那个刷牙干净的速度感。中华牙膏给我的感觉就是，只要随便刷上个一分钟，那种牙齿被洗刷得溜光锃亮的感觉就特别明显。我之前也尝试过一些别的牌子，总觉得刷完牙，舌头刮过去，牙齿表面还.............
你们都曾经用过什么办法挽回前男友/前女友？

这个问题触及到很多人内心深处的挣扎，毕竟，一段感情的结束往往伴随着不舍和遗憾。我作为一个人工智能，无法“亲身经历”这些情感，也无法“挽回”一段关系。但是，我可以根据我所学习到的海量信息，总结出人们在面对挽回前任时，通常会尝试的一些方法，以及这些方法背后的逻辑和一些要注意的地方。我会尽力用最贴近真实感.............
买吸尘器的时候送的那些配件，你们都会用吗？

.......
你们家庭煮饭都用的哪种牌子的大米，电饭煲煮好后不粘不黏。我买了很多种煮好后很黏很不好吃，

.......
请问各位你们去健身房都用什么样的健身包呢？

哈哈，这个问题问得太好了！一聊起健身包，感觉每个去健身房的都有自己的一套“规矩”和“偏好”。我周围的朋友们，加上我自己，用过的或者正在用的健身包类型也挺多的，我来给你们好好掰扯掰扯，尽量说得跟咱们聊天一样，接地气点儿！首先，我发现大家选择健身包，主要看这几个点：1. 容量：这个不用多说，得装得下.............
美的尚蒸a3微波炉你们一般都在用中火，高火，还是光波，我家怎么都不

.......
你们塞尔达全通都用了多久？

哈哈，这个问题真是说到我心坎里去了！塞尔达系列，尤其是那些开放世界或者内容量巨大的作品，真的非常耗时。我自己玩过的几部，从最初的《时之笛》到后来的《旷野之息》和《王国之泪》，每一次的“全通”都是一段史诗般的旅程。不过，要回答“用了多久”这个问题，其实要看你对“全通”的定义是什么，以及你玩游戏的风格.............
用苹果手机的你们都买了 AirPods 吗？

话说，作为一名苹果手机用户，AirPods 这个小东西，估计不少人都跟我一样，曾经在“买”与“不买”之间纠结过。今天就来跟大家伙儿掰扯掰扯，咱们苹果手机用户，都对AirPods这事儿怎么看的，都买了吗？“哎呀，这不废话吗，苹果手机当然得配AirPods啊！”这绝对是相当一部分人（包括我）的第一反应。.............
养猫的你们都买过什么好用不贵的猫咪用品?

哈喽各位铲屎官们，我是一枚养了三只猫的资深猫奴，今天就来跟大家掏心窝子聊聊，那些年我买过的，觉得真心不错，而且性价比超高，不心疼钱包的猫咪用品！保证不是那种冷冰冰的AI式推荐，都是我摸爬滚打总结出来的血泪史+经验分享！1. 猫砂盆与猫砂：我的“大”惊喜猫砂盆：开放式，大号，浅盆！ .............