Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

利特拉
正确的文章链接:

使用大型语言模型确定项目名称和购买相似度的传统方法的优化

Golikov Aleksei Aleksandrovich

喀山(伏尔加地区)联邦大学(叶拉布加研究所)俄语语言文学系语言学与文学系研究生

109316, Russia, Moscow, Volgogradsky Ave., 42

ag@mastercr.ru
Akimov Dmitrii Andreevich

ORCID: 0009-0004-2800-4430

博士学位 技术科学

数码解决方案工作坊有限公司分析员

109316, Russia, Moscow, Volgogradsky ave., 42

akimovdmitry1@mail.ru
Danilova Yuliya

ORCID: 0000-0001-5736-0590

博士学位 语言学



89 Kazanskaya str., Yelabuga, Republic of Tatarstan, 423604, Russia

danilovaespu@mail.ru

DOI:

10.25136/2409-8698.2024.4.70455

EDN:

FRZANS

评审日期

09-04-2024


出版日期

16-04-2024


注解: 研究的主题是分析和改进使用大型语言模型确定项目名称与采购信息内容相关性的方法。 该研究的对象是一个数据库,其中包含从公开来源收集的电力行业领域的项目和采购名称。 作者详细考察了主题中使用TF-IDF和余弦相似性度量进行初级数据过滤等方面,并详细描述了GigaChat、GPT-3.5和GPT-4等大型语言模型在文本数据匹配任务中的 特别注意基于引入到大型语言模型的prompta中的反射来澄清名称相似性的方法,这使得可以增加数据比较的准确性。  该研究使用TF-IDF和余弦相似性方法进行初级数据分析,以及大型GigaChat,GPT-3.5和GPT-4语言模型,用于详细验证项目名称和购买的相关性,包括模型prompta中的反 该研究的新颖之处在于开发了一种确定项目名称和购买相关性的组合方法,将处理文本信息的传统方法(TF-IDF,余弦相似性)与大型语言模型的能力相 作者对该主题研究的一个特殊贡献是通过使用具有优化prompta的gpt-3.5和GPT-4模型澄清初级选择的结果来提高数据比较准确性的拟议方法,包括反射。 该研究的主要结论是确认在采购过程和项目实施的信息支持任务中使用已开发方法的前景,以及将所获得的结果用于发展经济各部门的文本数据挖掘系统的可能性。 该研究表明,使用语言模型可以将F2度量值提高到0.65,这表明与基本方法相比,数据比较质量有显着提高。


出版日期:

TF-IDF, 余弦相似性, 大型语言模型, 吉加卡特, GPT-4, 文本数据分析, 普罗普塔的反思, 确定相关性, 项目和采购, 优化业务流程