什么是遗传算法?

遗传算法是使用遗传过程的数学结构。它们已成功用于各种分析问题。数据挖掘可以将人类的理解与信息的自动分析联系起来,以找到设计或关键关系。

给定一个由多个变量表示的大型数据库,目标是有效地找到数据库中最有趣的设计。遗传算法已被用于识别某些软件中的有趣设计。它们通常用于数据挖掘以增强其他算法的执行,例如决策树算法,另一种关联规则。

遗传算法需要特定的数据结构。他们在具有分类结构中定义的特征的总体上工作。与遗传学的类比是种群(基因)包括特征。有一种实现遗传算法的方法是使用具有变异特征的算子(繁殖、交叉、选择)来改进可能更好的组合的生成。

遗传算法程序如下 -

  • 它可以随机选择父母。

  • 它用于通过交叉重新创建。

  • 复制是选择哪个单个实体来处理它。换句话说,需要一些客观的服务或选择特征来确定生存。Crossover 描述了未来实体生产的变化。

  • 它可以通过健身服务为下一代选择幸存者。

  • 变异是在以下操作中对随机选择的实体的随机选择的属性进行转换的服务。

  • 它可以重复直到达到给定的适应度水平,或者达到当前的迭代次数。

  • 遗传算法参数包括种群大小、交叉率和变异率。

遗传算法的优势

遗传算法的优点如下 -

  • 遗传算法很容易创建和验证,如果使用的话,这会使它们非常有吸引力。

  • 该算法是并行的,定义它可以有效地用于高种群。该算法的另一个有效之处在于,如果它从一个糟糕的原始解决方案开始,它可以迅速发展到最佳解决方案。

  • 即使在非常非线性的问题规则中,变异的使用也创造了足以识别全局最优的方法。该方法不需要关于信息分布的知识。

遗传算法的缺点

  • 遗传算法需要将数据集映射到属性具有遗传算法要使用的离散值的位置。这通常是可能的,但在处理连续变量时可能会丢失大量详细数据。

  • 它用于将信息编码为可能不由自主地导致记录偏差的分类形式。

  • 还可以检查可以使用遗传算法考虑的数据集的大小。

  • 对于非常庞大的数据集,采样将很重要,这会导致在对等数据集的多次运行中产生多个结果。