利用python解决的第一个实际问题

错误的认知

Python 作为一门成熟的语言功能很全面且具有大量的第三方库。库指的是别人已经写好的代码用户可以直接调用。因此学习Python的周期会比较长这就导致学习者比如我感觉自己会的东西很少还不足以解决实际问题。在这种认知下不断的学习但是总是学不完由此产生了一丝焦虑感。在意识到这一问题后我开始思索就目前已经学习的知识可以帮助我解决哪些实际问题。

利用openpyxl 解决的第一个实际问题

我的实际需求就是把第一张图中的数据转化为第二张图中的数据。

第一张照片

第二张照片

艰难的编码过程将range()函数的用法与列表切片的方式相混合

由于需要对Excel 表格多行和多列进行操作因此需要进行循环操作。我写的前几行代码如下

import openpyxl
f openpyxl.load_workbook( 1.xlsx )
sheet1 f.active
for i in range(1:51):
输出

根据输出的指示我误以为是因为我在中文状态下输入了冒号因此会报错。在确定确实在英文状态输入的冒号后我怀疑是不是输入法有问题于是我换了另一个输入法结果还是报错。我想可能是Python解释器出现了问题于是我安装了最新版的解释器但是问题依然存在。那时我想可能是系统坏了现在回想起来这是多么疯狂的想法但是当时就是这么想的。还好装系统比较麻烦我没有采取这步行动。在压抑之中我看了一部电影放松了一下。看完电影后我突然发现range()函数的上下界是用英文状态下的逗号连接而不是用冒号连接。这在心理学上称之为酝酿效应。酝酿效应指的是在长期思考某一问题而又百思不得其解时如果停下对这个问题思考去做别的事情过一顿时间后可能会突然想到解决问题的办法。这听起来好像有点玄学的感觉。其本质原因是因为我们在一条行不通的道路上越陷越深。这时候如果停下来做其它的事情当我们再回头看这个未解决的问题时我们可能会意识到自己选择了一条错误解决问题的路径。

在发现问题后我意识到我是将列表切片的操作方式与range()函数的上下界方式搞混淆了。

编码过程注意事项

用openpyxl 进行数据写出的时候一定要注意复制原始数据。当然也可以将数据写出到一个新的Excel表格中。

以一列的一个条件为基础检查代码的运行效果

在第一行代码中我们导入了openpyxl 库在第二行代码中我们加载了名字为‘1’ 文件拓展名为‘xlsx 的Excel表格在第二行代码中我们调用了表格的活动工作表即上一次关闭软件前保存的工作表。

在第四行代码中我们使用了一个for 循环在第五行代码中我们使用了一个if 条件从句判断第一行第一列 i 第一次进入for 循环的值是否小于20 如果小于20 那么将该值改为1。

import openpyxl
f openpyxl.load_workbook( 1.xlsx )
sheet1 f.active
for i in range(1,51):
 if sheet1.cell(row i,column 1).value 20:
 sheet1.cell(row i,column 1).value 1
f.save( 1.xlsx )

以一列的所有条件为基础检查代码的运行效果

在确定第一个条件运行成功后接下来就是补全其它的条件看看第一列的整体运行结果是不是和预期一样。

import openpyxl
f openpyxl.load_workbook( 1.xlsx )
sheet1 f.active
for i in range(1,51):
 if sheet1.cell(row i,column 1).value 20:
 sheet1.cell(row i,column 1).value 1
 elif sheet1.cell(row i,column 1).value 40:
 sheet1.cell(row i,column 1).value 2
 elif sheet1.cell(row i,column 1).value 60:
 sheet1.cell(row i,column 1).value 3
 elif sheet1.cell(row i,column 1).value 80:
 sheet1.cell(row i,column 1).value 4
 elif sheet1.cell(row i,column 1).value 100:
 sheet1.cell(row i,column 1).value 5
f.save( 1.xlsx )

对整个表格进行操作

在解决了一列的问题后我们需要另一个for循环使得所有的列都能得到遍历。通过观察我们发现需要改变的行的数据在1,3 5,7 等。因此我们可以给for 循环加第三个参数即步幅来解决这一问题。

import openpyxl
f openpyxl.load_workbook( 1.xlsx )
sheet1 f.active
for i in range(1,51):
 for j in range(1,43,2):
 if sheet1.cell(row i,column j).value 20:
 sheet1.cell(row i,column j).value 1
 elif sheet1.cell(row i,column j).value 40:
 sheet1.cell(row i,column j).value 2
 elif sheet1.cell(row i,column j).value 60:
 sheet1.cell(row i,column j).value 3
 elif sheet1.cell(row i,column j).value 80:
 sheet1.cell(row i,column j).value 4
 elif sheet1.cell(row i,column j).value 100:
 sheet1.cell(row i,column j).value 5
f.save( 1.xlsx )

到这里问题就得到解决了。

迁移到其它场景

读者可能会想这个操作可以迁移到其它类似的场合吗答案是肯定。比如教育部规定小学阶段只能以等级的方式呈现学生的成绩。但是在实际阅卷的过程中教师需要先打出具体的分数然后再转化为相应的等级。在这种情况下就可以完全借鉴上一段代码的思路。

能运行的代码就是好的代码

作为学习者不需要在开始学习的阶段对自己所写的代码要求过高。因为代码的使用者是自己所以只要代码能够达到预期的目标就是好的代码。当然后续随着学习更多的知识可以对现有的代码进行完善。比如在我的这段代码中由于我知道数据有多少行、多少列所以我直接填入了数字。如果不知道表格有多少行或多少列就需要对代码进行改进了。当然还是可以通过数的方式获得具体的行列数只是容易出错且耗时。

import openpyxl
f openpyxl.load_workbook( 1.xlsx )
sheet1 f.active
for i in range(1,sheet1.max_row 1):
 for j in range(1,sheet1.max_column 1,2):
 if sheet1.cell(row i,column j).value 20:
 sheet1.cell(row i,column j).value 1
 elif sheet1.cell(row i,column j).value 40:
 sheet1.cell(row i,column j).value 2
 elif sheet1.cell(row i,column j).value 60:
 sheet1.cell(row i,column j).value 3
 elif sheet1.cell(row i,column j).value 80:
 sheet1.cell(row i,column j).value 4
 elif sheet1.cell(row i,column j).value 100:
 sheet1.cell(row i,column j).value 5
f.save( 1.xlsx )

需要注意range()函数是左开右闭所以需要在最大行列数的基础上加1 才能获得所有的行列数的数据。

利用python解决的第一个实际问题

Python相关栏目本月热门文章