精选文章
发布时间:刘召华 李建良
  |  
字数:2853
  |  
阅读量:

摘 要:随着计算机技术的发展,利用计算机存储大量的试题信息并结合数据库技术实现试题的自动组卷功能已成为一项实际可行且应用性广泛的课题。本文就试题组卷遗传算法进行了论述和总结。

关键词:自动组卷;遗传算法;试题库

随着信息技术不断发展,传统考试方式已经不能适应现代化考试需求,设计开发和应用计算机考试管理系统成为现代教育教学改革的一项重要任务。计算机技术不断发展,并结合现有成熟的数据库技术,为计算机考试管理系统开发提供了可靠保证。考试管理系统设计中,建立一个好的试题库尤为重要,而良好的组卷方法却是核心。如何保证生成的试卷能最大程度地满足用户的不同需求,并具有随机性、科学性、合理性;尤其在交互环境下,对组卷速度要求较高,而一个在理论上能搜索到全局最优的算法可能会以牺牲时间为代价,往往达不到预期的效果。因此,选择一个高效、科学的算法是自动组卷的关键。以往具有自动组卷功能的考试系统大多采用随机选取法和回溯试探法。在限制条件状态空间的控制下,随机选取法有时能够抽取出一组令用户满意的试题,但由于它随机选取试题的范围太大,有可能在无法抽取合适试题的区域内反复选题,进入死循环,最终导致组卷失败。回溯试探法组卷成功率高,却以牺牲大量的时间为代价。遗传算法(Genetic Algorithms)以其全局寻优和智能搜索技术,及收敛性好的特性能很好地满足自动组卷的要求。

1. 遗传算法原理

遗传算法(Genetic Algorithm,GA)是模拟自然界自然选择遗传机制进行搜索寻优的方法,通过模拟生物在染色体层面的各种遗传优化作用而设计人工寻优方法,GA本质上是一个群体迭代过程,从一个随机的初始群体出发,依据优胜劣汰原则.通过竞争、选择、繁衍、变异等遗传操作,产生性能更优的下一代群体。直到满足环境约束的优良体或合乎具体的应用准则为止。遗传算法的这种特点使其很适合解决多重条件最优解的问题。

2. 组卷问题的数学模型建立

通过实际组卷分析,组卷约束条件主要有知识点,题型,章节,认知层次,题量,分值,答题时间,难度,区分度,曝光度等10个方面。根据对上述组卷约束条件的分析,可以构建组卷问题的数学模型。由于一张试卷存在10个约束变量,所以针对于整个试卷所有的题目构成了一个10维度变量的空间:知识点,题型,章节,认知层次,题量,分值,答题时间,难度,区分度,曝光度。为了减小组卷算法的复杂度,提高组卷算法的效率,需要对这个10维空间进行化简处理。一般而言,要出一份试卷,我们总是先确定试题难度、试卷的满分值和所用的题型以及各种题型的题目和分数以及知识点分布,而且对一种考试而言,这种难度分布常保持相对稳定。不同难度试题的分数分布通常成正态分布,我们可以根据难度系数、各知识点分数、各题型分数来约束将要被选中的试题个数以及试题难度分布,计算出不同难度级别的题目在试卷中所占的比例。再结合各知识点、各题型的分数在试卷中所占的比例,可将10维空间简化为一个5维的空间——试卷(知识点,章节,题型,分值,难度),在这个5维空间里对试题进行操作来完成组卷。不同的计算机系统通常采用不同的二进制文件格式。

3. 遗传算法在自动组卷中的应用

遗传算法模拟达尔文的自然界遗传学:继承(基因遗传)、进化(基因突变)和优胜劣汰(优的基因大量被遗传复制,劣的基因较少被遗传复制)。其实质就是一种把自然界有机体优胜劣汰的自然选择、适者生存的进化机制与同一群体中个体与个体间的随机信息交换机制相结合的搜索算法。运用遗传算法求解问题,首先需将所要求解的问题表示成二进制编码,然后根据环境循环进行基本的操作:selection(选择)、crossover(交叉)、mutation(变异),最后收敛到一个最适应环境条件的个体上,得到问题的最优解。算法步骤如下:

(1)染色体的编码:假设试题库中有m道题,可用一个m位的二进制串来表示,形式为:a1,a2,a3 ,...am,,其中若ai为1,则表示该题被选中;若ai 为0,则表示该题未被选中,即ai=1,第i道题被选中;ai=0,第i道题未被选中。

(2)初始化群体:通过随机的方法生成初始化的串群体,在串群体中,串的长度是相同的,群体的大小按需要根据经验或实验给出。

(3)计算当前种群每个个体的目标函数:本问题的目标函数可定义为

F=

Fi表示第i个属性指标与用户要求的误差的绝对值,Wi表示第i个指标对组卷重要程度的权值,F是所有指标与用户要求的误差绝对值之和。该目标函数越大,则适应度越小,被淘汰的概率越大。

相关文档:
简述一种新型的机械自动泡茶杯
发电机同期并网调试经验谈
本土文化认同与回归的价值思考
由纸媒到网媒:英国《独立报》的转型之路
基于云服务的图书馆信息检索服务探微
浅谈高中排列与组合的有效教学
浅析文书档案管理工作的创新