论文部分内容阅读
近年来,国内外贸企业充分利用国际互联网(Internet)查找世界各地的外贸需求信息和开展外贸业务,促进了对外贸易规模和水平的持续提升。然而,当前外贸企业主要依靠人工从互联网上爬取和识别外贸客户信息,其成本高、识别效率低、准确度差已严重限制了外贸企业的高速发展和规模的可持续性发展,急需采用新一代人工智能技术替代传统基于人工的客户信息识别流程。论文关注外贸客户智能化识别方法,在深入调研当前外贸客户识别技术需求的基础上,引入新一代人工智能技术和机器学习方法,研究对从互联网上爬取的海量潜在客户信息进行准确、高效识别。为解决传统基于单模型的客户智能识别算法中文本语义信息表示不准确的问题,首先,论文创新提出了一种基于多文本表示模型的客户智能识别算法,采用基于加权改进的GloVe(Global Vectors for Word Representation,GloVe)模型与BERT(Bidirectional Encoder Representations from Transformers,BERT)模型,并行的对文本数据进行向量化表示,从而使得语境信息得到增强。同时,改进的GloVe模型相比传统模型能够更好地捕捉词的语法和语义信息。论文将两种模型的文本表示结果进行融合,并利用随机森林对其进行分类,从而获得客户信息识别结果。然后,论文对所提出的基于多文本表示模型的客户智能识别算法性能进行了深入的对比测试和评估。实验结果表明,相比应用GloVe模型和BERT模型的单模型识别算法,本文所提多模型识别算法能够有效的对客户进行识别,同时性能评估指标都要优于单模型识别算法。最后,论文按照软件工程理念设计和实现了外贸客户数据识别原型系统,并展示了所提出算法的实际效果。本项研究能够有效节省人力成本,对于当前人工智能时代背景下的对外贸易技术研究具有重要的理论和实践意义。