Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

软件系统和计算方法
正确的文章链接:

Word2vec在聚类操作子任务中的应用

Romashko Dmitrii Aleksandrovich

远东联邦大学研究生

690091, Russia, Primorskii krai, g. Vladivostok, o. Russkii, poselok Ayaks - 10, kampus DVFU, Korpus D

wintor20@gmail.com
Medvedev Aleksandr Yur'evich

远东联邦大学研究生

690091, Russia, Primorskii krai, g. Vladivostok, o. Russkii, poselok Ayaks - 10, kampus DVFU, Korpus D

rf_alexmedvedev@mail.ru

DOI:

10.7256/2454-0714.2018.1.25297

评审日期

27-01-2018


出版日期

11-02-2018


注解: 本文解决了聚类操纵子(遗传信息的特殊单位)的问题,并描述了其用于识别具有相似功能的操纵子组。 考虑了用作研究初始数据来源的开放操纵子数据库的特异性。 它描述了聚类数据的选择和准备、聚类过程的特点及其与传统上用于分析自然语言的方法的关系。 基于所进行的聚类,分析所获得的组的质量和组成。 为了将源数据转换为向量,使用了word2vec算法的经典实现和源数据的一些特征。 通过基于余弦距离的DBScan算法对所得表示进行聚类。 所提出的方法的新颖性与使用对于源数据不是标准的算法相关联。 使用的方法在处理大量数据时有效地表现出来,不需要额外的数据标记并且独立地产生用于聚类的因子。 获得的结果显示了使用所提出的方法实施允许对细菌基因组进行比较分析的服务的可能性。


出版日期:

算法, 方法, 机器学习, word2vec, 词的向量表示, DBScan,DBScan, 聚类;聚类, 操纵子, 自然语言分析, 开放数据库