RNF框架:动态协商视角下学生AI使用行为的诊断与干预
1. 项目概述:从静态标签到动态协商
在高等教育领域,尤其是写作课程中,大语言模型(LLM)的普及已经从一个“是否允许”的辩论,演变为一个“如何引导”的实践难题。我们常常看到这样的现象:同一个学生,在面对一篇期末论文和一个随堂小作业时,对AI工具的使用程度和方式可能截然不同;一个在课程初期对AI依赖严重的学生,到了后期可能变得极为审慎;而一些看似“自律”地完全不使用AI的学生,其背后的动机却可能千差万别——有的是出于深刻的伦理信念,有的仅仅是害怕被检测到。
传统的分析框架,无论是基于技术接受模型(TAM)的“感知有用性/易用性”,还是基于期望价值理论(EVT)的“动机-能力”分析,往往将学生的AI使用行为视为一种相对稳定的“类型”或“特质”。我们会给学生贴上“依赖型用户”、“策略型用户”或“拒绝型用户”的标签。然而,这种静态的归类在解释上述复杂、动态的现象时显得力不从心。它无法回答一个核心问题:为什么学生的行为会随着时间、任务和情境的变化而波动?
这正是“协商框架”(Reliance Negotiation Framework, RNF)试图破解的困局。RNF的核心洞见在于,它不再将学生对LLM的依赖视为一个固定的“状态”或“类型”,而是将其理解为一个持续的、动态的协商过程。这个过程就像学生内心的一场微型议会,每当你面对一项写作任务,决定是否、以及如何使用AI时,四个“议员”就会开始激烈辩论并最终达成一个决议。这四个“议员”就是RNF框架的四个核心输入:感知收益、感知风险、伦理承诺和情境需求。你的每一次AI使用决策,都是这四个因素在特定时刻、特定任务背景下相互博弈、权衡后的“输出”。
这个视角的革命性在于,它将解释的重点从“学生是什么样的人”转移到了“学生正在经历什么样的情境”。对于教育者而言,这意味着干预的靶点从模糊的“改变学生”变成了清晰的“调整协商过程中的某个输入”。RNF框架的价值,正是为我们提供了一张精细的“协商过程地图”,让我们能够理解学生行为背后的动态机制,并据此设计出更精准、更有效的教育干预措施。
2. RNF框架的核心架构与运作机制
要理解RNF如何工作,我们必须深入其内部,看看这场“内心议会”是如何召开的。框架认为,学生的每一次LLM使用决策,都是四个输入变量实时协商的结果。这四个输入并非独立存在,它们相互影响,并且决策的结果会反过来重塑输入本身,形成一个递归循环。
2.1 四大核心输入详解
2.1.1 感知收益:效率红利与能力补偿
这是推动学生使用AI最直接的动力。感知收益不仅包括“节省时间”、“减轻认知负荷”这类普遍性认知,更关键的是其情境特异性。对于一个正在与复杂文献综述搏斗的研究生来说,AI帮助梳理文献脉络的收益是巨大的;而对于一个只需写一封简单邮件的大学生来说,收益可能微乎其微。
实操心得:教育者需要警惕的是“感知收益通胀”。学生可能高估AI的能力,尤其是在不熟悉的领域。例如,学生可能认为AI能生成一个逻辑严密、论据充分的论证段落,而实际上它只能产出表面流畅但内容空洞的文本。这种 inflated utility value 是导致“依赖性使用”的主要驱动力之一。
2.1.2 感知风险:三重维度的顾虑
学生感知到的风险是多元的,主要可分为三类:
- 诚信风险:最直接的风险,即使用行为是否会被识别为学术不端,导致处罚。
- 认知风险:也称为“技能替代风险”或“萎缩风险”。学生是否担心过度依赖AI会导致自身写作、批判性思维等核心能力的退化?这种风险感知往往是隐性的,需要特定事件(如一次糟糕的考试表现)来激活。
- 发展性风险:更长远的风险,关乎个人智力成长和学术身份认同。例如,如果我的论文思想都来自AI,那“我”是谁?
不同发展阶段的学生对这三类风险的敏感度不同。低年级学生可能只关注诚信风险,而高年级或研究生则可能更担忧认知和发展性风险。
2.1.3 伦理承诺:从服从到原则的三层演进
这是RNF框架中极具特色的部分,它借鉴了伦理推理的发展阶段理论,将学生的伦理立场分为三个层级:
- 第一层:服从:行为动机是避免惩罚或遵守权威制定的规则(“因为教授说不能用,所以我不用”)。
- 第二层:认同社会规范:行为动机是维护社会关系或机构声誉(“大家都诚实写作,我也应该这样,否则对其他人不公平”)。
- 第三层:内化的伦理原则:行为基于自主选择的、普适的伦理原则(“我坚信知识建构的过程具有内在价值,外包这一过程损害了我的学术完整性”)。
一个学生的伦理承诺层级,深刻影响其风险感知和行为稳定性。处于第一层的学生,其“诚实”行为高度依赖于监督环境;而处于第三层的学生,其行为则具有跨情境的稳定性。
2.1.4 情境需求:被忽视的关键变量
这是传统模型最常忽略的部分,却是RNF解释行为变动的关键。情境需求包括:
- 任务特征:截止日期紧迫吗?任务复杂度高吗?评分标准明确吗?(例如,塔里克在夏季课程中面临时间压缩和严格的引用规范,这直接推高了他的AI使用强度。)
- 制度环境:课程政策是否清晰?检测工具是否被使用?教师对AI的态度是开放还是禁止?
- 社会比较:同伴都在用吗?用的程度如何?
情境需求像一个调节器,实时改变着其他三个输入的“权重”。在高压情境下,感知收益的权重可能急剧放大,压倒伦理承诺和风险感知。
2.2 递归循环:行为如何塑造未来的自己
RNF框架不是静态的。一次协商产生的“输出”(即实际使用行为),会通过一个反馈环路,反过来校准未来的“输入”。这就是递归机制。
例如,一个学生因为高估AI收益(感知收益通胀)而进行了依赖性使用,导致作业质量不佳(遭遇“学习贫乏化”经历)。这次失败的经历会激活并强化他之前未曾察觉的认知风险。在下一次协商时,感知风险的权重就会增加,他可能转向更审慎、更具策略性的使用,甚至辅以人工验证。反之,如果一次成功的依赖性使用未被发现且获得了不错分数,则可能强化其收益感知,使其在类似情境下更倾向于重复该行为,从而陷入“技能替代”的恶性循环。
这个递归循环解释了为什么简单的“经验”不一定带来“成熟”。如果早期使用没有触发对风险的重新校准,经验只会导致习惯化甚至依赖加深。
2.3 双模式架构:协商者与戒绝者
RNF框架的一个关键理论贡献是提出了双模式架构,区分了“协商模式”和“戒绝模式”的学生。
- 协商模式学生:绝大多数学生属于此类。他们的行为是上述四个输入协商的结果,会随着情境变化。即使他们某次完全不用AI,也是基于当前情境下风险大于收益的判断(情境性戒绝),而非绝对的伦理反对。
- 戒绝模式学生:约13%的学生(基于原始研究)属于此类。他们的行为由绝对的、分类学的伦理约束驱动(例如,“在任何情况下,使用AI生成文本都是错误的”)。他们的输入协商中,伦理承诺的权重是压倒性和不可谈判的,因此其行为(戒绝)在不同情境下高度一致。
这一区分至关重要。将戒绝模式学生与那些仅仅因为风险高(如害怕检测)或收益低而暂时不用的协商模式学生混为一谈,会严重误导教育干预的设计。针对前者的干预需要伦理对话,而针对后者则需要调整情境或提升AI素养。
3. 从理论到诊断:应用RNF分析学生案例
理论的价值在于解释现实。让我们通过深化原始研究中的两个典型案例——塔里克和德斯蒂尼——来演示如何运用RNF进行动态行为诊断。这比静态贴标签能提供更丰富的干预线索。
3.1 案例深度剖析:塔里克的“合规性计算”与德斯蒂尼的“觉醒之路”
3.1.1 塔里克:在制度压力下的策略演变
塔里克是一名研究生,在夏季高强度课程中面临巨大时间压力和严格的全文披露要求。
- 输入分析:
- 感知收益:极高。“更重的框架”下,AI是应对时间压力的救命稻草。
- 感知风险:诚信风险(主动的、第一层级)和认知风险(抽象的)被意识到,但发展性风险未被感知。
- 伦理承诺:处于第一/二层,主要是合规和对规范的遵从。
- 情境需求:夏季课程时间压缩,且要求全文披露AI生成内容。
- 协商输出与递归循环:
- 夏季:高收益 + 高制度压力 + 中低风险感知 + 合规性伦理 = 重度使用。他生成了87页的AI内容并按要求披露。这次披露行为带来了“成本”:大量的标注工作、可能面临的审视。这重新校准了他对“披露”这一情境需求的感知。
- 秋季:当课程政策变为“比例性引用”时,塔里克在新的协商中,调整后的“披露成本”输入促使他转向选择性、比例性的披露。他的行为从“重度使用+全文披露”演变为“策略性使用+选择性披露”。
- 发展轨迹:从合规性判断走向比例性判断。他的伦理推理仍在一、二层,但通过递归学习,他发展出了在规则框架内优化自身行为的策略能力。干预的关键在于改变情境需求输入,例如制定更清晰、一致的使用和披露政策,引导其计算向更符合学术目标的方向发展。
3.1.2 德斯蒂尼:从依赖到策略的“学习冲击”
德斯蒂尼是一名本科生,最初为提升成绩而使用AI。
- 输入分析(第一年):
- 感知收益:高,且被初步的成绩提升所证实。
- 感知风险:认知风险低,发展性风险完全不可见。
- 伦理承诺:从第一层向第二层萌芽,开始有初步的智力成长关切。
- 情境需求:低风险任务。
- 协商输出与递归循环:
- 第一年:高收益 + 低风险感知 + 低阶伦理 = 依赖性使用。
- 转折点:在后续课程中,她遭遇了一次严重的“学习贫乏化”经历——她发现自己无法独立完成一项本应掌握的任务,因为之前的AI依赖导致相关技能未能发展。这次经历剧烈地激活并显化了她之前不可见的发展性风险。
- 第二年及以后:被激活的高发展性风险输入,压倒性地改变了协商方程。她的输出转变为策略性克制,只在必要时辅助使用,并伴有严格的验证。
- 发展轨迹:从第一层经第二层向第三层萌芽。她的伦理关切因真实的学习挫折而内化。干预的关键在于加速“学习冲击”的递归通道,通过教学设计(如要求分析AI错误、对比AI与人类文本的作业)让她提前、安全地认识到发展性风险,而不是等到在真实评估中失败。
注意事项:这两个案例揭示了“效率-萎缩悖论”的同一机制(认知风险在即时协商中不可见),但通过不同通道激活递归循环:塔里克是通过制度政策遭遇(披露成本),德斯蒂尼是通过学习经历遭遇。单一案例分析会模糊这一区别,而RNF的对比诊断则能指出截然不同的干预路径:对塔里克需调整政策环境,对德斯蒂尼则需设计能触发风险意识的学习活动。
3.2 诊断工具与实操步骤
作为教育者或研究者,如何应用RNF分析学生?
- 信息收集:不要只问“你用不用AI?”,要通过访谈、反思日志或情境问卷,收集四方面信息:
- 收益感知:“你觉得AI在完成XX任务时,最能帮到你什么?节省了多少时间/精力?”
- 风险感知:“使用AI时,你主要担心什么?(可提示:被抓住、自己变懒、学不到东西、论文不代表自己)”
- 伦理立场:“你为什么认为在作业中使用AI是合适/不合适的?”(分析其回答属于服从、规范还是原则层次)。
- 情境压力:“当时这项任务的截止日期、难度、评分标准是怎样的?你知道其他同学是怎么用的吗?”
- 构建输入配置:像填写表格一样,梳理该学生在特定任务下的四大输入状态。
- 分析输出与递归:观察其实际行为(使用频率、方式、是否验证、是否披露),并推测哪些输入在本次协商中占主导。追问:“这次经历(比如得了低分或高效完成)会如何改变你下次对AI的看法或用法?”
- 识别模式与干预点:判断学生处于“协商模式”还是“戒绝模式”。对于协商模式学生,识别哪个输入是导致非理想输出(如依赖或欺骗)的关键杠杆点。是收益评估不准?风险意识不足?伦理层次低?还是情境压力畸高?
4. 基于RNF的教育干预设计指南
RNF框架的价值最终要落到“怎么办”上。它告诉我们,一刀切的政策或笼统的素养培训效果有限,必须进行精准干预。
4.1 针对四大输入的干预策略矩阵
| 干预目标(输入) | 核心问题 | 具体干预策略示例 | 预期效果 |
|---|---|---|---|
| 校准感知收益 | 学生是否高估或低估了AI在特定任务中的真实能力? | 1. “AI vs. 专家”对比练习:让学生用AI完成一部分任务,再与高质量范例或自己后期修改的版本对比,具体分析AI的局限(如论据肤浅、逻辑跳跃)。 2. 元认知提示:在任务前让学生预估AI能帮到什么程度,任务后复盘验证。 |
减少“自我效能感通胀”,促使依赖型用户向策略型用户转变。 |
| 显化感知风险 | 学生是否意识到,尤其是认知与发展性风险? | 1. 结构化反思:在允许使用AI的作业后,强制要求学生撰写短文,描述AI的贡献与局限,并反思此过程对自己学习的帮助与潜在损害。 2. “技能审计”作业:设计一项后续任务,明确考察之前AI辅助过的技能,检验其独立掌握程度。 |
激活学生的风险感知,特别是“技能替代风险”,预防“效率-萎缩悖论”。 |
| 提升伦理承诺 | 学生的伦理推理处于哪个层次?如何促进其发展? | 1. 案例讨论:使用真实或虚构的学术不端案例(包括AI滥用),引导学生讨论不同行为的伦理依据,推动思考从“怕惩罚”(第一层)向“公平性”(第二层)和“学术诚信价值”(第三层)演进。 2. 角色扮演与辩论:让学生扮演教授、学生、期刊编辑等角色,就AI使用的边界进行辩论。 |
培养内化的、原则性的伦理推理,产生不依赖于外部监督的、稳定的负责任使用行为。 |
| 管理情境需求 | 课程政策、任务设计是否在无意中鼓励了不当使用? | 1. 清晰、分层的政策:明确不同作业类型下AI的使用规则(如: brainstorming允许,草稿生成限制,最终论证禁止),并解释其教育学理由。 2. 过程性评估设计:增加草稿、大纲、文献笔记等过程性考核,降低对最终成品的一次性压力。 3. 调整任务本质:设计无法由AI直接完成的任务,如基于本地课堂讨论的反思、分析特定数据集、连接个人经验等。 |
创造一种“支持性压力”环境,使合规、高质量的学习行为成为学生的理性选择。 |
4.2 整合干预:从“素养中心”到“伦理中心”的课程重塑
最有效的干预不是单一策略,而是将上述策略整合到课程设计中,实现从“合规中心”到“素养中心”,最终迈向“伦理中心”的转变。
- 合规中心模式:主要依赖检测工具和惩罚性政策。它针对的是伦理承诺输入的第一层(服从)。效果是局部的、监督依赖的。一旦监督消失,行为可能反弹。这是最初级、也是问题最多的模式。
- 素养中心模式:重点教授AI的工作原理、能力边界、提示技巧和验证方法。它针对的是感知收益和感知风险输入的准确性。效果是学生能更精准地使用AI,但未必减少使用频率,也未必提升其行为的伦理稳定性。
- 伦理中心模式:这是RNF框架倡导的深层目标。它将AI使用视为一个发展性、道德领域的实践,通过持续的伦理对话、反思性作业和原则性政策,促进学生伦理推理向更高层次发展。这种模式效果最持久,但也最难实施,需要长期的课程文化浸润。
一个理想的课程设计应包含三者:用清晰的政策(合规)设定底线和初始框架;用系统的AI素养训练(素养)提升工具使用质量;用嵌入课程的伦理讨论和反思任务(伦理)促进内在动机和发展。例如,一门写作课可以:
- 开学初明确AI使用政策(合规)。
- 安排一次工作坊,教授如何用AI进行头脑风暴和修改语法,同时通过练习展示其编造参考文献的倾向(素养)。
- 在完成一篇允许使用AI辅助研究的论文后,要求学生提交一份“使用说明与伦理反思”,说明如何使用的、为何这样用是恰当的、以及此过程对其自身思考的帮助与挑战(伦理)。
4.3 针对MSI(少数族裔服务机构)学生的公平性干预设计
RNF框架的诞生背景使其对资源不均等的教育环境有特别深刻的启示。对于MSI中大量存在“准备差距”的第一代大学生,AI的“效率红利”被放大,而“技能替代风险”也更高。
- 挑战:这些学生更可能因补偿心理而过度依赖AI,且他们通过“遭遇式学习”(试错)积累AI素养的路径更慢、成本更高。
- 干预设计必须超越简单的“限制使用”:
- 前置补偿,而非事后惩罚:在课程初期就提供强化的学术写作基础支持和AI素养正式培训,弥补准备差距,而不是在他们因差距而依赖AI后再处罚。
- 设计“安全失败”的体验:在低风险作业中,故意设计需要学生识别和纠正AI错误的任务,让他们在分数安全的情况下,提前、深刻地认识到AI的风险和局限,激活其风险感知。
- 明确的价值引导:向学生清晰传达:本课程的目标是帮助你发展不可被替代的核心能力(批判性思维、深度分析、创造性表达)。AI是辅助你达成这一目标的工具之一,而不是替代你达成目标的捷径。将AI使用与学生的长期学术发展和职业成功直接关联。
5. 研究前沿与框架验证:RNF的四个可检验预测
一个优秀的理论框架必须能做出可被证伪的预测。RNF框架提出了四个核心预测,它们共同构成了一个完整的研究议程。
5.1 预测一:学生内部的行为变异性
预测:同一学生在同一门课程的不同任务中,其LLM依赖行为会表现出显著的内部变异。当以学生为单位聚类分析时,依赖决策的组内相关系数(ICC)将低于0.50。
检验方法:需要在单门课程中,采用经验取样法(ESM),通过屏幕录制、数字修订日志等过程可见的数据,收集每名学生至少5次作业中的依赖行为数据。
理论与实操意义:如果ICC≥0.50,则说明依赖行为更像一种稳定的个人特质,RNF强调“情境”核心性的主张就需要修正。这对教学意味着,如果行为高度稳定,干预就应更侧重改变个人(如动机、能力);如果行为高度可变,干预则应更侧重优化任务设计和情境。
5.2 预测二:伦理层级的提升与监督无关的稳定性
预测:通过结构化的学术诚信干预(如伦理推理课程)提升了伦理层级的学生,其依赖行为对监督的敏感性会降低。即,在高监督和低监督条件下,其行为一致性差异的效应量(Cohen‘s d)将≥0.40。
检验方法:需要进行随机对照试验(RCT),比较伦理课程组与对照组,并在干预前后分别测量学生在明确监控和独立作业条件下的AI使用行为。
理论与实操意义:如果伦理层级的提升未能带来行为稳定性的变化(d < 0.20),则说明学生“宣称的伦理”与“实践中的伦理”是脱节的。这要求我们在教学中,不能只看学生怎么说,更要设计能观察其跨情境行为的评估。
5.3 预测三:AI素养干预对协商输出质量的影响
预测:旨在提升收益与风险评估准确性的AI素养干预,将改变协商输出的质量。具体表现为:在依赖型用户中减少“自我效能感通胀”(其调节系数β值发生至少0.05的显著变化),并在先前不审慎的用户中增加伴有验证的依赖行为。
检验方法:实施经过验证的AI素养课程的前后测设计,重新评估学生的依赖类型,并测量其验证行为(如要求标注信息来源)。
理论与实操意义:如果干预后,依赖类型分布和调节模式均无变化,则说明AI素养可能只是一个静态的前置因素,而非RNF所认为的、能实时校准其他输入的动态协商要素。这将迫使我们对素养培训的内容和方式进行反思。
5.4 预测四:机构类型对“效率-萎缩”临界点的调节作用
预测:协商结果受机构类型和学生准备背景的调节。在MSI就读的学生,其依赖强度与技能替代结果之间的正相关关系(即“效率-萎缩”临界点效应)会比在选择性更高的院校中更陡峭。
检验方法:需要在至少4所不同机构(MSI vs. 非MSI)进行多站点比较研究,使用一致的依赖测量和写作质量评估工具,并进行纵向跟踪。
理论与实操意义:如果MSI的调节效应不显著,那么“MSI学生面临更陡峭的技能替代风险”这一公平性论断就缺乏普遍依据。这提醒我们,任何基于特定情境(如顶尖大学)发展出的AI使用理论或政策,在推广到资源不均等的环境时,必须经过严格的本地化验证和调整。
6. 常见问题与实施挑战
在实际应用RNF框架进行教学或研究时,你可能会遇到以下问题。
6.1 如何区分“戒绝模式”学生和只是“暂时不用”的协商者?
这是实施中最棘手的诊断问题。仅凭使用频率无法区分。关键在于探究其动机结构:
- 可用的诊断问题:
- “如果有一项作业,教授明确允许且鼓励使用AI来激发灵感,你会用吗?为什么?”(测试是否受情境约束)
- “你认为在学术工作中使用AI,本质上是否存在对错?还是取决于具体情况?”(测试伦理原则的绝对性)
- “如果你确定使用AI绝对不会被发现,你会改变现在的使用方式吗?”(测试对监督的依赖程度)
- 行为指标:戒绝模式学生的行为在不同课程、不同任务类型、不同政策下都表现出高度一致性(接近零使用)。而协商模式学生的“不用”往往伴随特定情境(如高风险考试、个人重视的创作)。
6.2 学生的自我报告不可信怎么办?
确实,社会赞许性偏差会影响自我报告数据的真实性。RNF框架鼓励采用多源数据三角验证:
- 行为数据:利用支持过程追踪的教育技术工具(如Google Docs版本历史、特定写作软件的日志)。分析其写作过程中的“粘贴”模式、修改轨迹。
- 过程性产出:要求学生提交使用AI的“过程记录”,如与AI的对话记录、AI生成文本与最终文本的对比标注。
- 设计“不可伪造”的任务:如前所述,设计必须基于本地化、个性化信息的任务,使AI直接生成高质量答案变得困难。
6.3 在资源有限的课堂中,如何落地这些复杂的干预?
不需要一步到位。可以从最小可行改变开始:
- 从一次反思作业开始:在一项允许使用AI的作业后,增加一个简短的、不计分的反思环节,提出RNF式的问题(“你从AI那里得到了什么帮助?它有什么局限?这个过程如何影响了你自己的思考?”)。
- 明确并沟通你的政策:即使只是简单的三层分类(禁止、允许但需标注、鼓励),清晰沟通本身就能显著影响学生的“情境需求”和“伦理承诺”输入。
- 利用同伴学习:组织小组讨论,让学生分享各自使用AI的策略和遇到的坑。同伴经验是最有力的“风险显化”和“素养校准”工具之一。
- 关注“临界点”学生:将更多精力放在那些表现出“依赖性使用”苗头或正处于“技能替代”边缘的学生身上,通过一对一谈话,运用RNF框架分析其输入配置,提供个性化指导。
6.4 RNF框架是否意味着要完全接受AI,放弃学术诚信标准?
恰恰相反。RNF提供了一个更精细、更有效的维护学术诚信的路线图。它指出,单纯依靠检测和惩罚(针对第一层伦理)是脆弱且不公平的。它主张通过教育来提升学生的伦理推理层次(达到第二、三层)和AI素养(校准收益与风险),从而培养出能够在内、外部任何环境下都做出负责任决策的学习者。这不是降低标准,而是追求更高、更稳固的诚信标准——一种由内而外、基于理解的诚信,而非由外而内、基于恐惧的合规。最终,RNF框架邀请教育者共同思考:我们究竟希望培养出什么样的学习者?是善于规避检测的“策略家”,还是能够与智能工具共舞、同时牢牢掌控自己智力主权的“深思熟虑的实践者”?框架给出的路径,指向的是后者。