百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Python其实很简单 第二十三章 全校学生成绩统计的完整实例

csdh11 2025-03-04 11:40 12 浏览

下面是用DataFrame改写第十七章介绍的程序(p23-1.py):

from warnings import simplefilter

simplefilter(action='ignore', category=FutureWarning)

# simplefilter用于忽略第三方警告

import numpy as np

import pandas as pd

from pandas import read_excel


file='d:/student.xlsx'

#Excel文件地址,student.xlsx内容详见表18-1

df=read_excel(file,sheet_name=0,converters={'学号':str})

#将Excel文件读入DataFrame数据框架df中

df['年级']=df['学号'].str.slice(0,2)

#用slice()函数实现切片并赋值给'年级'字段

df['班级']=df['学号'].str.slice(0,4)

#用slice()函数实现切片并赋值给'班级'字段

df.总分=df.语文+df.数学+df.英语

#列求和,列赋值

df['名次']=df['总分'].rank(method='min',ascending=False)

#rank()函数当method='min'时与Excel中完全相同,ascending=False为升序排序

df.to_excel('d:/test1.xlsx',sheet_name='Sheet1',index=False)

#将DataFrame数据框架df中的数据保存到Excel文件中

#至此,完成了新建Excel文件中Sheet1工作表数据的填充工作。


dfpj=df.groupby('班级')['语文','数学','英语','总分'].mean()

#依据'班级'列进行分组,求语文、数学、英语、总分的平均值,保存到数据框架dfpj中

dfrs=df.groupby('班级')['学号'].agg({'人数':np.size})

#依据'班级'列进行分组,对'学号'列计数,并以'人数'为别名保存到数据框架df人数中

jg72=72

#设置以72分为及格分数线,用于语文、数学科目

jg60=60

#设置以60分为及格分数线,用于英语科目

yx96=96

#设置以96分为优秀分数线,用于语文、数学科目

yx80=80

#设置以96分为优秀分数线,用于英语科目

df['语及']=df['语文']

#增加新的列'语及',并将'语文'列的值对应赋给

df['数及']=df['数学']

#增加新的列'数及',并将'数学'列的值对应赋给

df['英及']=df['英语']

#增加新的列'英及',并将'英语'列的值对应赋给

df['语优']=df['语文']

#增加新的列'语优',并将'语文'列的值对应赋给

df['数优']=df['数学']

#增加新的列'数优',并将'数学'列的值对应赋给

df['英优']=df['英语']

#增加新的列'英优',并将'英语'列的值对应赋给

#以上六列目前都为成绩值,后续将用来单科及格率和优秀率

#函数fun(x,y)用于判断x>=y是否成立,成立返回1;不成交返回0

def fun(x,y):

if x>=y:

return 1

else:

return 0


df['语及']=df['语及'].apply(lambda x:fun(x,jg72))

#前面已经给'语及'赋值为'语文'的值,此语句相当于判断语文>=72是否成立

#若成立则'语及'赋值为1,否则赋值为0

df['数及']=df['数及'].apply(lambda x:fun(x,jg72))

#同上,判断数学成绩是否及格

df['英及']=df['英及'].apply(lambda x:fun(x,jg60))

#同上,判断英语成绩是否及格

df['语优']=df['语优'].apply(lambda x:fun(x,yx96))

#同上,判断语文成绩是否优秀

df['数优']=df['数优'].apply(lambda x:fun(x,yx96))

#同上,判断数学成绩是否优秀

df['英优']=df['英优'].apply(lambda x:fun(x,yx80))

#同上,判断英语成绩是否优秀

df['合格']=df['语及']+df['数及']+df['英及']

#'语及'、'数及'、'英及'的值均为0或1,故'合格'的值在0~3之间

df['优秀']=df['语优']+df['数优']+df['英优']

#'语优'、'数优'、'英优'的值均为0或1,故'优秀'的值在0~3之间

df['合格']=df['合格'].apply(lambda x:fun(x,3))

#若'合格'的值>=3(其实不可能大于),给'合格'赋值为1;否则赋值为0

df['优秀']=df['优秀'].apply(lambda x:fun(x,3))

#若'优秀'的值>=3(其实不可能大于),给'优秀'赋值为1;否则赋值为0

dfjgyx=df.groupby('班级')['语及','语优','数及','数优','英及','英优','合格','优秀'].sum()

#按照'班级'分组统计'语及'等项的和,实际上就是各个单科和三科合格、优秀的人数

dftj=pd.merge(dfpj,dfjgyx,on='班级')

#将dfpj(包含有平均分)和dfjgyx(及格、优秀人数)按照'班级'关键字连接,保存到dftj

dftj=pd.merge(dftj,dfrs,on='班级')

#将dfrs连接到dftj

dftj['语文']=round(dftj['语文'],2)

#班级语文平均分保留两位小数

dftj['数学']=round(dftj['数学'],2)

#班级数学平均分保留两位小数

dftj['英语']=round(dftj['英语'],2)

#班级英语平均分保留两位小数

dftj['总分']=round(dftj['总分'],2)

#班级每个学生的三科总分的平均值保留两位小数

dftj['语及']=round((dftj['语及']/dftj['人数'])*100,2)

#语文及格人数/班级人数*100,保留两位小数,即为语文及格率,保存到'语及'列

dftj['语优']=round((dftj['语优']/dftj['人数'])*100,2)

#语文优秀人数/班级人数*100,保留两位小数,即为语文优秀率,保存到'语优'列

dftj['数及']=round((dftj['数及']/dftj['人数'])*100,2)

#数学及格人数/班级人数*100,保留两位小数,即为数学及格率,保存到'数及'列

dftj['数优']=round((dftj['数优']/dftj['人数'])*100,2)

#数学优秀人数/班级人数*100,保留两位小数,即为数学优秀率,保存到'数优'列

dftj['英及']=round((dftj['英及']/dftj['人数'])*100,2)

#英语及格人数/班级人数*100,保留两位小数,即为英语及格率,保存到'英及'列

dftj['英优']=round((dftj['英优']/dftj['人数'])*100,2)

#英语优秀人数/班级人数*100,保留两位小数,即为英语优秀率,保存到'英优'列

dftj['合格']=round((dftj['合格']/dftj['人数'])*100,2)

#三科合格人数/班级人数*100,保留两位小数,即为三科合格率,保存到'合格'列

dftj['优秀']=round((dftj['优秀']/dftj['人数'])*100,2)

#三科优秀人数/班级人数*100,保留两位小数,即为三科优秀率,保存到'优秀'列

dftj=dftj[['人数','语文','语及','语优','数学','数及','数优','英语','英及','英优','总分','合格','优秀']]

#重新调整dftj的各个字段的次序,为输出到Excel做准备

dftj.to_excel('d:/test2.xlsx',sheet_name='Sheet1',index=True)

#将数据框架dftj的数据保存到Excel文件中,索引列'班级'也一并写入


P23-1运行后生成如下两个表格:

解决写入Excel文件的内容不被覆盖的方法

在上面的代码中,to_excel()方法将DataFrame中的数据写入了某个指定的Excel文件的指定工作表中,第二次运行程序时会将Excel中以前保存的内容覆盖掉,若要想写入到新的工作表中,可在程序中添加如下代码,它利用了openpyxl的特点,它会自动新建一个以sheet_name为名后缀序号的新工作表:

# p23-2.py:

import openpyxl

#导入openpyxl模块

#以下为自定义函数add_sheet()

def add_sheet(data, excel_writer, sheet_name):

book = openpyxl.load_workbook(excel_writer.path)

#为openyxl方法指定要打开的Excel文件地址

excel_writer.book = book

#为excel_writer方法指定工作簿

data.to_excel(excel_writer=excel_writer, sheet_name=sheet_name, index=True, header=True)

#将data数据框中的数据写入Excel文件,index为真表示添加索引列,header为真表示添加标题行

excel_writer.close()

excel_writer = pd.ExcelWriter(r"d:\test.xlsx", engine='openpyxl')

#指明用openpyxl操作Excel文件

add_sheet(dftj, excel_writer, 'bjtj')

这样,就可以在test.xlsx文件中每次都新建一个名为“bjtj+n”的工作表,而不覆盖原有的工作表。

在前述的p23-1.py中,为了获取三科成绩全部及格的人数,使用了一个自定义函数fun(x,y),用该函数先判断每一科成绩是否及格,若及格则写入一个标识值为1,若不及格则写入一个标识值为0,然后再用fun(x,y)这个函数判断三科是否全部及格。这个方法显得比较繁琐,下面给出了另一种解决方法,它通过条件筛选出三科全部及格的学生并添加到一个新的数据框架中。如下代码p22-3.py只实现了p23-1.py中的部分功能,没有计算单科及格率、优秀率等。

Py23-3.py代码:

from warnings import simplefilter

simplefilter(action='ignore', category=FutureWarning)

import numpy as np

import pandas as pd

from pandas import read_excel #导入read_execel


file='d:/student.xlsx'

df=read_excel(file,sheet_name=0,converters={'学号':str})

df['年级']=df['学号'].str.slice(0,2)

df['班级']=df['学号'].str.slice(0,4)

df.总分=df.语文+df.数学+df.英语

dfhg=df[(df['语文']>=72) & (df['数学']>=72) & (df['英语']>=60)]

#将df中符合合格标准(三科都及格)的记录保存到dfhg中

dfyx=df[(df['语文']>=96) & (df['数学']>=96) & (df['英语']>=80)]

#将df中符合优秀标准(三科都优秀)的记录保存到dfhg中

dfpj=df.groupby('班级')['语文','数学','英语','总分'].mean()

#求班级单科平均值和总分平均值保存到dfpj中

dfrs=df.groupby('班级')['学号'].agg({'人数':np.size})

#dfrs中保存各班总人数

dfhg=dfhg.groupby('班级')['学号'].agg({'合格':np.size})

#dfhg中保存各班合格人数

dfyx=dfyx.groupby('班级')['学号'].agg({'优秀':np.size})

#dfhg中保存各班优秀人数

dftj=pd.merge(dfpj,dfhg,on='班级',how='left')

#以dfpj为基础,以'班级'为连接键,将dfhg连接到dfpj上,生成dftj

dftj=pd.merge(dftj,dfyx,on='班级',how='left')

#以dftj为基础,以'班级'为连接键,将dfyx连接到dftj上

dftj=pd.merge(dftj,dfrs,on='班级',how='left')

#以dftj为基础,以'班级'为连接键,将dfrs连接到dfpj上

dftj['语文']=round(dftj['语文'],2)

dftj['数学']=round(dftj['数学'],2)

dftj['英语']=round(dftj['英语'],2)

dftj['总分']=round(dftj['总分'],2)

dftj['合格']=round((dftj['合格']/dftj['人数'])*100,2)

dftj['优秀']=round((dftj['优秀']/dftj['人数'])*100,2)

dftj=dftj.fillna(0)

#用0填充NaN值

dftj.to_excel('d:/test3.xlsx',sheet_name='Sheet1',index=True)

#将数据框架dftj的数据保存到Excel文件中,索引列'班级'也一并写入

P23-3.py运行后生成的excel表格(test3.xlsx):

相关推荐

OKHttp原理解析(okhttp的作用)

Okhttp应该是Android目前非常流行的第三方网络库,尝试讲解他的使用以及原理分析,分成几个部分:...

快速教会你优雅的解决TCP客户端端口耗尽的问题

Hello,我是Henry,相信各位开发老爷在使用大并发网络连接的时候,可能都遇到过TCP客户端端口耗尽的问题,这是一个常见问题,以下是系统性的解决方案及技术细节:1.理解端口限制的本质...

这3个接口基础知识,产品经理需要知道

产品经理在工作中,避免不了要阅读接口文档,希望本文能够帮助大家更好的了解接口。接口,即客户端(浏览器)向服务器提交请求,服务器向客户端返回响应。本质就是数据的传输与接收。本文主要介绍接口相关的基础知识...

Java 11新特性对开发者的影响:让编程更高效、更自由

Java11新特性对开发者的影响:让编程更高效、更自由在这个瞬息万变的编程世界里,每一代Java的更新都承载着无数开发者对性能优化、生产力提升以及代码美感追求的期望。作为继Java8之后的首个长期...

干货-okHttp的优点-收藏了(okhttp的好处)

OkHttp相较于其它的实现有以下的优点.支持SPDY,允许连接同一主机的所有请求分享一个socket。如果SPDY不可用,会使用连接池减少请求延迟。使用GZIP压缩下载内容,且压缩操作对用...

如何在 Java 项目中集成 DeepSeek

一、使用官方SDK基础集成1.添加依赖(Maven)<dependency><groupId>com.deepseek</groupId>...

spring cloud gateway 性能优化思路

SpringCloudGateway是一个高性能的API网关,但在实际的生产环境中,可能会遇到一些性能瓶颈。以下是一些SpringCloudGateway的性能优化方面:调整线程池...

你对Android中的okHttp的使用真的了解吗

框架下载地址:https://github.com/square/okhttp今天给大家讲解下网络框架okhttp的使用,这个框架非常强大,很多框架都用它来加载网络资源,目前很多开发者还在用As...

京东大佬问我,Nginx并发连接如何设置?详细说明

京东大佬问我,Nginx并发连接如何设置?详细说明首先,我需要回忆一下Nginx的并发模型。Nginx是基于事件驱动的异步架构,所以它的并发处理能力和配置参数有很大关系。主要的参数应该包括worker...

如何实现一个连接池?一文带你深入浅出,彻底搞懂

-前言-【2w1h】是技术领域中一种非常有效的思考和学习方式,即What、Why和How;坚持【2w1h】,可以快速提升我们的深度思考能力。...

Golang 网络编程(golang 系统编程)

TCP网络编程存在的问题:拆包:对发送端来说应用程序写入的数据远大于socket缓冲区大小,不能一次性将这些数据发送到server端就会出现拆包的情况。通过网络传输的数据包最大是1500字节,当TCP...

Spring6|Spring Boot3有哪些HTTP客户端可以选择

个人博客:无奈何杨(wnhyang)个人语雀:wnhyang...

10. 常用标准库(标准库有哪些)

本章深入解析Go语言核心标准库的关键功能与生产级应用技巧,结合性能优化与安全实践,提供高效开发指南。10.1fmt/io/os10.1.1fmt高级格式化...

Nginx之连接池(nginx 长连接 连接复用)

我们知道Nginx利用连接池来增加它对资源的利用率。下面我们一起来看看Nginx是如何使用连接池的。从上一节模块开始已经慢慢会接触一些Nginx的源码部分来。每个worker进程都有一个独立的ngx...

开发者必备的Android开发资源之OkHttp

小编在这里给各位Android开发者介绍的资源包括工具、库和网站等。有效地利用它们,将有助于减轻我们的工作量,提高我们的工作效率。为什么需要一个HTTP库Android系统提供了两种HTTP通信类,H...