课堂教学语言智能化评价: 效用、应用与优化

冯秀梅; 蒋雨辰; 王依婷

doi:10.13718/j.cnki.jsjy.2025.04.006

课堂教学语言智能化评价: 效用、应用与优化

华中师范大学物理科学与技术学院, 湖北武汉 430079

基金项目: 华中师范大学2025年度数智赋能教育教学创新专项教学改革项目“AI赋能师范生教学能力培养的实践探索”(202525)，项目负责人：冯秀梅

详细信息

作者简介:
冯秀梅，教育学博士，华中师范大学物理科学与技术学院教授，博士生导师;

蒋雨辰，华中师范大学物理科学与技术学院硕士研究生;

王依婷，华中师范大学物理科学与技术学院硕士研究生 .

中图分类号: G40-057

Intelligent Evaluation of Classroom Teaching Language: Effectiveness, Application, and Optimization

College of Physics Science and Technology, Central China Normal University, Wuhan 430079, China

摘要:
课堂教学语言量化分析多以人工编码为主, 存在内容复杂、工作量大等困难, 难以满足大规模课堂评价的实际需求, 近年来迅速发展的人工智能技术恰为这些问题带来了新的解决思路。研究以助力培养高质量师范生为导向, 从效用评估、具体应用与智能优化三个层面出发, 为实现智能化课堂教学语言评价提供技术路径与实证依据。首先, 基于师范生教学语言特点构建编码系统, 开发自动编码模型, 验证其在教学语言编码任务中的可行性与有效性。其次, 将自动编码模型应用于师范生实训视频与优质视频的教学语言对比分析, 梳理教学语言存在的问题, 提出具有普适性的优化建议。最后, 结合大语言模型初步构建教学语言优化助理, 并基于优化建议为师范生提供个性化的教学语言指导。研究结果表明, 人工智能技术有助于摆脱课堂教学语言量化分析的困境, 在自动化、个性化教育评价上具有潜力。
- 教育评价 /
- 课堂教学语言评价 /
- 人工智能 /
- 自动化
Abstract:
Quantitative analysis of classroom teaching language traditionally relies on manual coding, presenting significant challenges such as complexity and labor-intensive workloads, which hinder its applicability to large-scale classroom evaluations. Rapid advancements in artificial intelligence technology have recently offered promising solutions to these issues. Therefore, this study aims to foster the development of high-quality pre-service teachers by providing a technical pathway and empirical evidence for intelligent classroom language evaluation from three key dimensions: effectiveness evaluation, practical application, and intelligent optimization. Initially, an encoding system specifically tailored to the instructional language characteristics of pre-service teachers was developed. Then, an automated encoding model was constructed and tested for feasibility and effectiveness in language coding tasks. Subsequently, this automated encoding model was applied to analyze instructional language differences between pre-service teachers' training videos and exemplary teaching videos, systematically identifying problems and proposing generalized optimization recommendations. Finally, an instructional language optimization assistant was preliminarily established using large language models, offering personalized language guidance to pre-service teachers based on identified optimization strategies. The findings demonstrate that artificial intelligence technologies effectively address the challenges of quantitative instructional language analysis and show significant potential in automation and personalized educational evaluation.
- educational evaluation /
- evaluation of classroom teaching language /
- artificial intelligence /
- automation .

图 1 课堂教学语言智能化评价研究设计

下载: 全尺寸图片幻灯片

图 2 准确率随特征向量数变化趋势

下载: 全尺寸图片幻灯片

图 3 模型评估参数：以反馈类为例

下载: 全尺寸图片幻灯片

图 4 机器学习混淆矩阵

下载: 全尺寸图片幻灯片

图 5 不同课堂阶段教学语言比例差异

下载: 全尺寸图片幻灯片

表 1 课堂教学语言编码系统

编码	类别	说明	示例
1	反馈	教师对学生的行为进行评价，属于积极影响	这三位同学发表的言论都非常好
2	提问	教师对单个或所有学生提出问题	那么你知道电和磁之间有联系吗
3	讲授	教师表达观点，陈述知识，围绕相关知识进行讲解、讲评	气球从静止向上飞起，说明它一定是受到了一个向上的合力
4	指令	教师利用语言承转课程环节，或要求、建议学生作出行为、进行思考、解决问题	接下来我们就用实验来求证一下，老师这里邀请一位同学跟我一起做实验
5	批评或维护权威	批评、责备学生，维护教师权威	看来WQ同学课前要好好预习

下载: 导出CSV

表 2 数据集各类别统计数量表

类别	训练集(2020级)/句	测试集(2019级)/句
反馈	562	122
提问	2 443	283
讲授	3 672	270
指令	1 276	229
批评或维护权威	2	1
总计	7 955	905

下载: 导出CSV

表 3 n元语法模型选择指标数值

指标	一元语法模型	一二元语法模型	一二三元语法模型
准确率	0.909	0.913	0.914
Kappa值	0.862	0.869	0.871
特征向量/个	2 095	7 759	11 985

下载: 导出CSV

表 4 四个类别下高度影响分类结果的特征向量

反馈	提问	讲授	指令
(开头)对	？	叫作	一下
觉得	？(结尾)	。	请
谢谢	什么	叫	今天
听到	呢	等于	思考
是的	呢？	注意，	(开头)请
说	呢？(结尾)	也	好，
(开头)很好	什么？	物体	接下来
(开头)很	什么？(结尾)	力	时间到
(开头)我	的?	读数	(开头)注意
同学	的?(结尾)	就是	尝试

下载: 导出CSV

表 5 机器学习各项指标结果

类别	精确率/%	召回率/%	F₁值/%
反馈	92.63	72.13	81.10
提问	98.19	96.11	97.14
讲授	71.54	97.78	82.63
指令	88.34	62.88	73.47
平均值	87.68	82.23	83.59

下载: 导出CSV

[1]	王金羽, 詹逸思, 冯起, 等. 教育质性研究中人机协同文本挖掘技术的运用——以某高校教学评估中文文本数据为例[J]. 清华大学教育研究, 2022(2): 56-63.
[2]	FLANDERS N A. Intent, action and feedback: a preparation for teaching[J]. Journal of Teacher Education, 1963, 14(3): 251-260. doi: 10.1177/002248716301400305
[3]	顾小清, 王炜. 支持教师专业发展的课堂分析技术新探索[J]. 中国电化教育, 2004(7): 18-21.
[4]	高瑛, 林康立, 马宏佳. 研究现代化学课堂教学行为的量化工具——3C-FIAS[J]. 化学教育, 2016(5): 18-24.
[5]	陈珍国, 邓志文, 于广瀛, 等. 基于FIAS分析模型的翻转课堂师生互动行为研究——以中学物理课堂为例[J]. 全球教育展望, 2014(9): 21-33.
[6]	HOWE C, HENNESSY S, MERCER N, et al. Teacher-student dialogue during classroom teaching: does it really impact on student outcomes?[J]. Journal of the Learning Sciences, 2019, 28(4/5): 462-512.
[7]	穆肃, 左萍萍. 信息化教学环境下课堂教学行为分析方法的研究[J]. 电化教育研究, 2015(9): 62-69.
[8]	孙众, 吕恺悦, 施智平, 等. TESTⅡ框架: 人工智能支持课堂教学分析的发展走向[J]. 电化教育研究, 2021(2): 33-39, 77.
[9]	国务院关于印发新一代人工智能发展规划的通知[EB/OL]. [2017-07-20]. https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[10]	孙众, 吕恺悦, 骆力明, 等. 基于人工智能的课堂教学分析[J]. 中国电化教育, 2020(10): 15-23.
[11]	JACOBS J, SCORNAVACCO K, CLEVENGER C, et al. Automated feedback on discourse moves: teachers'perceived utility of a professional learning tool[J]. Educational Technology Research and Development, 2024, 72(3): 1307-1329. doi: 10.1007/s11423-023-10338-6
[12]	罗恒, 廖小芳, 茹琦琦, 等. 生成式人工智能支持的教师评语研究: 基于初中数学课堂的实践探索[J]. 电化教育研究, 2024(5): 58-66.
[13]	郑永和, 周丹华, 张永和, 等. 计算教育学视域下的ChatGPT: 内涵、主题、反思与挑战[J]. 华东师范大学学报(教育科学版), 2023(7): 91-102.
[14]	叶立军, 李燕, 斯海霞. 初中数学新老教师课堂教学语言比较研究[J]. 数学教育学报, 2015(4): 40-43.
[15]	FLANDERS N A. Analyzing teacher behavior[M]. ReadingMA: Addison-Wesley Publishing Company, 1970: 34.
[16]	黄焕, 刘清堂, 朱晓亮, 等. 不同教学风格的课堂话语特征分析及应用研究[J]. 现代教育技术, 2013(2): 27-30, 36.
[17]	凤丽洲, 杨贵军, 徐雪, 等. 基于N-gram的双向匹配中文分词方法[J]. 数理统计与管理, 2020(4): 633-643.
[18]	顾鑫, 曹丹华, 吴裕斌, 等. 基于逻辑回归的多任务域快速分类学习算法[J]. 计算机工程与应用, 2017(15): 47-56, 205.
[19]	LANDIS J R, KOCH G G. The measurement of observer agreement for categorical data[J]. Biometrics, 1977, 33(1): 159-174. doi: 10.2307/2529310
[20]	杨晓哲, 王晴晴, 蒋佳龙. 基于人工智能的课堂师生对话分析: IRE的自动分类与分水平构建[J]. 电化教育研究, 2023(10): 79-86.
[21]	SOKOLOVA M, LAPALME G. A systematic analysis of performance measures for classification tasks[J]. Information Processing & Management, 2009, 45(4): 427-437.
[22]	宋宇, 许昌良, 穆欣欣. 生成式人工智能赋能的新型课堂教学评价与优化研究[J]. 现代教育技术, 2024(12): 27-36.
[23]	WAN T, CHEN Z. Exploring generative AI assisted feedback writing for students'written responses to a physics conceptual question with prompt engineering and few-shot learning[J]. Physical Review Physics Education Research, 2024, 20(1): 010152. doi: 10.1103/PhysRevPhysEducRes.20.010152
[24]	吴立宝, 曹雅楠, 曹一鸣. 人工智能赋能课堂教学评价改革与技术实现的框架构建[J]. 中国电化教育, 2021(5): 94-101.
[25]	炕留一, 叶海智, 张瑾, 等. 基于多维数据的课堂教学行为评价研究[J]. 现代教育技术, 2022(4): 68-77.
[26]	赵明明, 周森. 如何分析课堂发言: 人工智能与统计方法的结合[J]. 北京大学教育评论, 2019(4): 35-44, 184-185.
[27]	骆祖莹, 张丹慧. 课堂教学自动评价及其初步研究成果[J]. 现代教育技术, 2018(8): 38-44.
[28]	李英哲, 刘剑玲. 新课标背景下ChatGPT在初中数学备课中的创新功能与价值定位[J]. 中国电化教育, 2024(3): 109-114.

图( 5) 表( 5)

计量

文章访问数: 37
HTML全文浏览数: 37
PDF下载数: 12
施引文献: 0

全文HTML

针对课堂教学进行及时、全面、有效的评价能快速提升教师教学能力，促进高素质专业化教师队伍的建设。传统课堂教学评价多以定性课堂观察为主，对评审者的专业性要求较高。往往由多个专家同时评价以克服定性评价主观性较强的问题，但同时也消耗了大量的专家资源^[1]。事实上，课堂教学的结构化特征为量化评价提供了空间。自20世纪60年代弗兰德斯建立课堂语言互动分析系统(FIAS)，按照固定时间单位对课堂教学进行切片，开创了对课堂定量结构化评价的先河以来^[2]，多种改进的互动分析系统不断涌现，以适应信息时代教学改革和特定学科特点的需要。如基于信息技术的互动分析编码系统(ITIAS)^[3]、凸显科学课堂操作行为特征的现代化学课堂互动分析系统(3C-FIAS)^[4]、中学物理弗兰德斯互动分析编码系统(PFIAS)^[5]等。按照固定时间单位切割课堂可能割裂课堂的结构，为弥补这种不足，量化评价也从课堂对话^[6]、教学活动^[7]和教学事件^[8]等视角对课堂进行分析，对课堂结构进行精细化理解。课堂量化评价通过分类统计课堂行为、关键事件和教学活动，并分析其演化特征，提升了评价的客观性，降低了对评价者专业性的要求，但同时也大大增加了评价内容的复杂度和评价的工作量。目前，课堂教学量化分析以人工编码为主，对人工消耗过大，导致课堂中隐含信息没有被充分挖掘，无法满足大量课堂及时反馈的需求，不利于课程改革的快速推进。实际上，课堂量化评价面临的困境恰为智能化教学评价的引入提供了现实契机。

随着《新一代人工智能发展规划》^[9]等系列文件的出台，人工智能技术在课堂教学评价领域的应用成为研究热点。例如，基于GRU循环神经网络自动分析课堂教学事件^[10]，以Bi-LSTM神经网络为核心实现教师课堂对话自动标注^[11]，这些方法均能有效提高课堂教学结构的识别效率与分析精度。借助自动量化分析结果所揭示的课堂教学结构特征，得以深入探索教学存在的问题，提炼课堂教学改进策略^[10]。此外，大语言模型的发展为课堂教学内容智能优化提供了新路径，预训练—提示机制对用户输入的文本实现内容生成^[12]，进一步支持课堂教学内容的智能优化^[13]。因此，本研究根据师范生提升教学技能的现实需求，使用人工智能技术对模拟课堂教学语言进行自动编码，对比分析师范生实训视频和优质视频语言结构上存在的差异。在此基础上，构建融合大语言模型的教学语言智能优化助理，为师范生提供个性化的教学语言优化策略。

四. 人工智能技术优化师范生教学语言

师范生在完成模拟授课后，通常需要专家对师范生的模拟课堂进行点评，帮助他们快速成长，但由于专家资源的紧缺，不能做到为每名师范生的教学语言提供持续个性化指导。基于课堂教学语言优化建议，利用大语言模型构建的课堂教学语言智能优化助理，能打破时间地点和资源的限制，支持师范生在课堂实践中优化教学语言表达^[22]。

为验证其可行性，选择师范生A讲解“平抛运动”课题时导入的教学语言作为优化对象，原文如下：同学们好，在上节课中我们提出了一个关于平抛运动的猜想，那就是平抛运动可以分解为水平方向上的匀速直线运动和竖直方向上的自由落体运动，并且通过观看演示实验验证了我们的猜想。那么我们这节课将亲自做实验，通过实验来验证我们的猜想。这是老师上节课最后留下来的第二种验证平抛运动的方法，平抛运动的闪光照相。我们通过记录做平抛运动的小球，在不同的时间点和位置得到了平抛运动的图像，然后我们再通过平抛运动水平方向上的位移和竖直方向上的位移，看是否与我们预期符合，来验证我们的猜想。那么具体要怎么做？请同学们观看一个演示实验，并且找一下演示实验仪都由哪些部分组成。以上师范生A的导入片段能代表师范生教学语言存在的普遍问题，即讲授内容过长，指令表达不够清晰，针对学生的提问少且指向性不强，这导致学生不明白观看演示视频的具体目的，教学语言需要进一步优化。

在使用大语言模型时，提问的方式将极大影响输出的结果^[23]。因此，逐步优化提问的方式，最终形成的提示信息包含角色情境、教学语言优化建议、优质视频教学语言和师范生原始教学语言四个部分。在角色情境部分说明此时的角色情景和应完成的优化教学语言任务，再将前文基于教学语言结构数据对比分析所得到的优化建议输入到提示信息中。优化建议是面向两个群体分析提出的，虽有普遍适用性，但针对性较差。因此，在保留优化建议的基础上，在提示信息中增加相同课题的优质视频教学语言作为模板，让大语言模型自动学习其语言结构和内容后，优化师范生原始教学语言。最终优化结果如下：同学们好！上节课我们提出了一个关于平抛运动的猜想，即平抛运动可以分解为水平方向上的匀速直线运动和竖直方向上的自由落体运动。通过观看演示实验，我们初步验证了这个猜想。今天，我们将亲自做实验，通过实验进一步验证这一猜想。我们将使用平抛运动的闪光照相法来记录小球在不同时间点的位置，并生成平抛运动的图像。然后，我们会分析小球在水平方向和竖直方向的位移，看看是否与我们的预期相符，从而验证我们的猜想。现在，请大家完成以下步骤。(1)观看演示实验：请大家集中注意力，观察实验中使用的各个仪器部件。(2)提问环节：思考并回答，哪些仪器部件对记录小球运动轨迹至关重要？为什么？你认为实验中的关键步骤有哪些？(3)实验指导：分成小组，每组两人。讨论并设计一个简单的实验，用来记录平抛运动的轨迹。使用实验室中的仪器进行实验，记录数据并生成图像。请大家先观看演示实验，现在开始。大语言模型的优化结果使整个教学语言更加精练并富有逻辑，点明学生观看演示实验时的具体要求，并明确说明在观看过程中所应思考的问题，切实增加了指令和反馈类型的教学语言。同时模仿优质视频的教学内容，在观看实验的过程中加入了分组讨论，并要求设计实验，增加了更为丰富多样的自主活动，这也能为师范生的课堂设计提供有效的灵感。未来可以考虑建立优质视频教学语言模板库，只需专家将优化要求和建议输入大语言模型中，即可实时为每位师范生提供个性化的教学指导。师范生则能在不断交互过程中，反思个人教学语言存在的问题，迅速调整语言表达和教学方法，从而逐步提升教育教学能力。

五. 总结与讨论

在人工智能技术融合教育蓬勃发展的背景下，本研究立足于当前教学评价存在的问题和需求，从效用、应用和优化三个方面探讨课堂教学语言智能评价的可行性。

当前智能课堂教学评价的开发和实施仍处于起步阶段，构建专业化、智能化的评价框架，使其针对性地指向智能化课堂教学评价是现实急需^[24]。本研究基于弗兰德斯互动分析系统，把握模拟课堂教学特点，形成课堂教学语言编码系统。该编码系统定义清晰，可操作性强，切片方式确保了教学语言的完整语义，可针对课堂教学语言进行类别判定与质量分析。训练得到的自动编码模型结果表现优异，具有较好的泛化能力，初步实现黄焕等对于课堂话语分析应用探索的设想^[16]，能协助实现多维数据课堂教学行为指标体系中话语数据的自动量化分析^[25]，共同探索和丰富在不同框架理论下课堂教学智能化评价的实践结果^[26]。这将大大节省研究人员人工编码所需的人力和时间，切实解决当前量化分析教学课堂存在的问题，满足大规模课堂评价需求^[27]。

在对比分析中，利用自动编码结果分析师范生实训视频与优质视频在教学语言结构和内容上的差异，揭示师范生在教学语言方面存在的具体问题，提出针对师范生教学语言优化的改进策略。这一过程不仅为编码模型在教育场景中的具体应用提供了范式，也为智能化教学助手的构建提供了方向指引和实证依据。基于大语言模型的智能化教学助手有望成为师范生专业发展的重要支持工具，推动教育领域的持续创新与优化，助力精准化、个性化的教师培养^[28]。本研究初步验证了大语言模型作为师范生教学语言优化助手的可行性，展示了其在提升教学语言质量、促进教学改进中的应用潜力，为个性化教育与智能化教学评价提供了新的思路和实践路径。

本研究充分利用人工智能在大数据处理、语言学习和文本生成方面的技术优势，实现了课堂教学语言的高效自动编码，并为师范生提供个性化反馈建议，为后续构建更完善的智能化教学评价体系奠定了基础。然而研究仍存在一定局限性，对于需要更精细颗粒度分析课堂特征的场景，还需丰富编码类别，并在每一个类别下进行水平划分，以实现对课堂教学的质量水平判定。此外，研究仅聚焦于教学语言的分析优化，暂未收集其他模态教学信息。未来可以补充其他模态信息，丰富当前数据集，构建课堂教学智能化评价平台，为师范生课堂教学技能的发展提供立体化的智能支持。

参考文献 (28)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

课堂教学语言智能化评价: 效用、应用与优化

华中师范大学物理科学与技术学院, 湖北武汉 430079

作者简介:
冯秀梅，教育学博士，华中师范大学物理科学与技术学院教授，博士生导师;

蒋雨辰，华中师范大学物理科学与技术学院硕士研究生;

王依婷，华中师范大学物理科学与技术学院硕士研究生 .

Intelligent Evaluation of Classroom Teaching Language: Effectiveness, Application, and Optimization

College of Physics Science and Technology, Central China Normal University, Wuhan 430079, China

计量

课堂教学语言智能化评价: 效用、应用与优化

English Abstract

Intelligent Evaluation of Classroom Teaching Language: Effectiveness, Application, and Optimization

全文HTML

一. 课堂教学语言编码系统

二. 人工编码过程

三. 机器学习形成自动编码模型

四. 自动编码结果评估

1. 模型量化评估指标

2. 自动编码结果评估

一. 教学语言类型分布特征

二. 教学语言转换特征

三. 师范生课堂教学语言优化建议

目录

留言板

课堂教学语言智能化评价: 效用、应用与优化

华中师范大学 物理科学与技术学院, 湖北 武汉 430079

作者简介: 冯秀梅，教育学博士，华中师范大学物理科学与技术学院教授，博士生导师; 蒋雨辰，华中师范大学物理科学与技术学院硕士研究生; 王依婷，华中师范大学物理科学与技术学院硕士研究生 .

Intelligent Evaluation of Classroom Teaching Language: Effectiveness, Application, and Optimization

College of Physics Science and Technology, Central China Normal University, Wuhan 430079, China

计量

出版历程

课堂教学语言智能化评价: 效用、应用与优化

English Abstract

Intelligent Evaluation of Classroom Teaching Language: Effectiveness, Application, and Optimization

全文HTML

一. 课堂教学语言编码系统

二. 人工编码过程

三. 机器学习形成自动编码模型

四. 自动编码结果评估

1. 模型量化评估指标

2. 自动编码结果评估

一. 教学语言类型分布特征

二. 教学语言转换特征

三. 师范生课堂教学语言优化建议

目录

华中师范大学物理科学与技术学院, 湖北武汉 430079

作者简介:
冯秀梅，教育学博士，华中师范大学物理科学与技术学院教授，博士生导师;

蒋雨辰，华中师范大学物理科学与技术学院硕士研究生;

王依婷，华中师范大学物理科学与技术学院硕士研究生 .