Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

软件系统和计算方法
正确的文章链接:

搜索字母归一化的方法,通过其数据的频率特性来提高实体的识别质量

注解: 使用数据的频率分布作为它们的"标识符",可以在用于交互的其他系统中检测来自一个系统的数据,从而协调它们的工作。 在这种情况下,主题区域的实体的识别使用搜索字母表发生-一组令牌,其在实体数据中的使用频率位于应用软件的关系数据库的记录中。 该研究的主题是一种对搜索字母表进行归一化的方法,通过其数据的频率特性来提高主题区域实体的识别质量,该方法包括去除实体数据中重复频率相似的其他字母表标记中包含的字母表标记。 采用的研究方法有系统分析、信息论、算法理论、逻辑代数、集合论、比较分析、数据挖掘方法以及软件和数据库开发方法。 通过实验(使用178个实体的例子),证明这种技术允许平均5次减少搜索字母表的体积,这显着增加了通过其数据的频率特性识别实体的速度。 通过减少较短令牌的数量,归一化技术减少了识别误差,正如实验所示,对于每个识别平均为0.02036。



This article can be downloaded freely in PDF format for reading. Download article