一种长文本实体识别方法、装置、计算机设备及介质

    公开(公告)号:CN116702787A

    公开(公告)日:2023-09-05

    申请号:CN202310981548.8

    申请日:2023-08-07

    摘要: 本发明涉及数据处理技术领域,尤其涉及一种长文本实体识别方法、装置、计算机设备及介质,方法包括:获取N个长文本数据作为训练样本,每个长文本数据的实体内容均有标注实体类型;将每个长文本数据截取为M个文段;将每个长文本数据的M个文段输入改进的Roberta模型中进行训练,得到识别模型,改进的Roberta模型包括编码层、加性注意力层以及分类层,编码层用于对每个文段进行编码,得到每个文段的编码信息,加性注意力层用于基于每个文段的编码信息,得到每个文段的编码矩阵,使得每个文段的编码矩阵包含当前文段的编码信息和之前文段的编码信息;获取待识别文本,并基于该识别模型,得到待识别文本的实体内容及实体类别;提高了长文本实体识别的准确性。

    基于工程三维模型的投标报价预测方法、装置及存储介质

    公开(公告)号:CN115619423A

    公开(公告)日:2023-01-17

    申请号:CN202211275836.3

    申请日:2022-10-18

    摘要: 本发明公开了一种基于工程三维模型的投标报价预测方法、装置及存储介质,一方面,通过建立BIM和GIS模型,来实现基于工程模型的工程总成本的计算;另一方面,本发明可基于与目标工程的相似工程来进行目标工程总造价的预测;另外,本发明还可得到在本次招标时,具有竞争资格的企业在以往类似工程中的投标报价,以便基于总造价和各个竞争企业的历史报价,来进行招标过程中合理低价的预测;最后,即可利用计算出的合理低价和标定报价,来调整工程总造价,使其既在合理预测低价附近,又能获得预期利润;由此,本发明摒弃了基于人工经验对投标报价计算的方法,在提高效率的同时,保证了报价的准确率,可辅助企业进行投标决策,大幅提高企业的中标率。

    一种应用于招投标的数据挖掘方法、系统及设备

    公开(公告)号:CN114648393A

    公开(公告)日:2022-06-21

    申请号:CN202210541741.5

    申请日:2022-05-19

    摘要: 本发明涉及一种应用于招投标的数据挖掘方法、系统及设备,该方法包括:采集第一招投标数据;对第一招投标数据进行预处理;对预处理后的第一招投标数据进行数据挖掘以形成第二招投标数据,所述数据挖掘包括关键数据的提取、关键信息的清洗和已清洗数据的加工处理;对第二招投标数据进行分析处理并对其结果进行可视化处理。解决了现有技术中存在的数据采集缺乏全面性、关键数据的挖掘缺乏准确性和缺乏数据的分析与应用等问题,同时基于消息推送技术对招投标数据进行流水线的处理,实现了数据的实时动态解析,大大地提升了程序的可维护性;在编程的实现上把处理数据的代码进行了工具类化的封装,具备良好的扩展性和组件的复用性。

    一种预测基建病害的维养系统及方法

    公开(公告)号:CN115454978A

    公开(公告)日:2022-12-09

    申请号:CN202210990568.7

    申请日:2022-08-18

    摘要: 本发明提供了一种预测基建病害的维养系统及方法,系统包括算法层、数据库、应用层、监控模块以及数据采集模块;数据采集模块与监控模块、数据库和算法层进行数据交互;数据库与应用层进行数据交互;数据采集模块存储有数据采集程序,用于获取设定平台的基建数据,监控模块通过消息队列监听消费采集的数据信息;算法层存储有数据处理和分析的程序算法,数据采集模块通过对应的接口进行调用;应用层用于将数据库中的数据进行输出,并提供应用接口,通过在界面上操作实现对数据的统计分析。本发明针对基建维养数据构建数据采集及病害预测、解决方案推荐的一体化系统,降低对数据多样性的依赖,实现低成本的精准维养,提高效率,减少资源的浪费。

    前馈全连接神经网络预测工程项目投标报价的方法

    公开(公告)号:CN113298624A

    公开(公告)日:2021-08-24

    申请号:CN202110686641.7

    申请日:2021-06-21

    IPC分类号: G06Q30/06 G06N3/04 G06N3/08

    摘要: 本申请提供了一种前馈全连接神经网络预测工程项目投标报价的方法。该方法包括将原始数据分成训练数据和测试数据两部分,对训练数据中的限价数据进行标准化处理;以训练数据中的项目限价为输入,训练数据中的项目报价为输出,建立前馈全连接神经网络回归模型;选用k折交叉验证对模型进行评估,得到k折交叉验证结果,并在每次评估后调整模型的参数以重新进行评估;绘制准确率图像,找出拐点,进行早停,其中准确率图像是以模型训练的轮次为横坐标,各轮次中的k折交叉验证结果为纵坐标绘制的;用调整好的模型对测试数据进行测试,并对实际工程项目的报价做预测。本申请提供的方法可对工程项目的报价进行准确预测。

    一种用于高精度识别中标金额的LSTM模型单元训练方法及装置

    公开(公告)号:CN110738182A

    公开(公告)日:2020-01-31

    申请号:CN201911001371.0

    申请日:2019-10-21

    摘要: 本发明公开了一种用于高精度识别中标金额的LSTM模型单元训练方法,包括:获取标注有中标金额信息的判别二值或三值表;生成字符向量训练素材;初始化LSTM模型单元;将所述字符向量训练素材按正序排列输入到当前LSTM模型单元中进行训练,得到对应字符向量训练素材的前向运行预测值;计算与该对应字符向量训练素材的实际类别之间的差距;判断所述差距是否持续震荡下降;通过链式法则,得到当前LSTM模型单元中每个参数应该变化的数值大小;通过梯度下降优化算法,得到当前LSTM模型中每个参数的变化方向和变化值,进而修正LSTM模型中每个参数。