发明公开
- 专利标题: 一种业务语义识别方法及装置
-
申请号: CN202211428321.2申请日: 2022-11-15
-
公开(公告)号: CN115618883A公开(公告)日: 2023-01-17
- 发明人: 朱艺媛 , 章剑涛 , 苏志勇 , 何秋芸 , 董璐 , 谢宏宇 , 郑炜 , 许熠 , 曾荣甫 , 陈思泓
- 申请人: 国网信通亿力科技有限责任公司
- 申请人地址: 福建省厦门市软件园二期观日路36号402室
- 专利权人: 国网信通亿力科技有限责任公司
- 当前专利权人: 国网信通亿力科技有限责任公司
- 当前专利权人地址: 福建省厦门市软件园二期观日路36号402室
- 代理机构: 广州京诺知识产权代理有限公司
- 代理商 轩青涛
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F40/289
摘要:
本发明涉及一种业务语义识别方法,包括以下步骤:步骤S1:接收待识别语义的英文字符串及其他上下文信息;步骤S2:对待识别字段进行预处理;步骤S3:切分待识别字段,得到若干种分词方案;步骤S4:对每个分词方案,使用转移概率矩阵计算词切分点处的概率得分;步骤S5:对方案中的每个词,通过拼音语义DFA树判断为非拼音,则与词库中的词条进行逐个匹配,并计算相似得分;步骤S6:取相似得分最高的词条的语义,计算整个匹配方案语义间的关联得分;步骤S7:提取综合得分最高的匹配方案,拼接作为推荐标注;步骤S8:输出推荐的中文业务语义及推荐指标等相关信息。本发明提升元数据梳理工作的效率。