-
公开(公告)号:CN118708223A
公开(公告)日:2024-09-27
申请号:CN202410945420.0
申请日:2024-07-15
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F8/70 , G06F40/284 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及软件工程领域,提供一种软件成本度量方法、装置、电子设备及存储介质。所述方法包括:基于目标软件的需求文件,确定所述目标软件的需求文本数据,所述需求文本数据包括所述需求文件中表征所述目标软件的开发成本的词语;使用BERT模型对所述需求文本数据进行识别,得到所述需求文本数据对应的需求文本类别数据,所述需求文本类别数据包括各所述词语所属的功能点类型;基于所述需求文本类别,确定所述目标软件的功能点总数;基于所述功能点总数,确定所述目标软件的软件成本。本申请提供的软件成本度量方法、装置、电子设备及存储介质可以降低软件度量成本,并提高软件成本度量的准确性。
-
公开(公告)号:CN117744623A
公开(公告)日:2024-03-22
申请号:CN202211115787.7
申请日:2022-09-14
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F40/194 , G06F18/22
Abstract: 本发明实施例涉及自然语言处理技术领域,公开了一种文本相似度计算方法,该方法包括:计算待测文本中待测句子和对比文本中对比句子的字面相似度;计算待测句子中各个待测单词在待测文本中的待测单词权重,以及对比句子中各个对比单词在对比文本中的对比单词权重;计算待测单词与所述对比单词的词义相似度、词性相似度及语境相似度;根据字面相似度、待测单词权重、对比单词权重、语义相似度、词性相似度、语境相似度、待测句子长度及对比句子长度计算得到待测句子与对比句子的句子相似度。通过上述方式,本发明实施例实现了用多维度特征综合计算文本相似度,避免文本相似度受某个维度特征影响较大,提升了文本相似度计算的准确率。
-
公开(公告)号:CN118798155A
公开(公告)日:2024-10-18
申请号:CN202410522464.2
申请日:2024-04-28
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Inventor: 张建强 , 宋功鹏 , 王方旭 , 马超 , 张熙 , 陈彬 , 杜飞 , 马福坛 , 赵洁 , 韩鑫鑫 , 姜彤彤 , 张波 , 张梦 , 王见雷 , 杨合林 , 王星 , 刘泽宇
IPC: G06F40/194 , G06F16/35
Abstract: 本公开涉及文本查重方法、装置、电子设备和计算机程序产品。该文本查重方法包括:获取文本样本数据,从文本样本数据中提取多种初始词汇,并获取多种初始词汇分别对应的词汇数量和空间分布数据;对多种初始词汇进行聚类处理,得到多个初始词汇聚簇;基于各初始词汇聚簇中每种初始词汇对应的词汇数量和空间分布数据,对多个初始词汇聚簇进行调整,得到多个目标词汇聚簇;利用基于多个目标词汇聚簇确定的多个目标词汇,对待测文本进行查重。本公开能够在对多种初始词汇进行聚类处理时,考虑多种初始词汇分别对应的词汇数量和空间分布数据,提高了聚类结果的准确性,进而提高文本查重结果的准确性。
-
-