一种语料处理方法、装置、设备及介质

    公开(公告)号:CN118839690A

    公开(公告)日:2024-10-25

    申请号:CN202410838507.8

    申请日:2024-06-26

    发明人: 谢鸣晓 杨雷 张圳

    摘要: 本申请涉及自然语言处理技术领域,具体涉及一种语料处理方法、装置、设备及介质,用于解决语料筛选判别效率较低的问题。该方法包括:获取第一语料,第一语料包括从预设文本库中进行问答语句抽取得到的问答对。通过句法分析确定第一语料中的问答对的核心词和各个语法成分,获得第一语料中的问答对的语法结构,核心词指示第一业务的名称,各个语法成分包括主语、谓语、宾语、定语、状语、补语中的至少一种。将语法结构与第一规则库中的预设语法结构进行比对确定第一语料中的问答对是否表意完整,若表意不完整,则删除第一语料中表意不完整的问答对,获得第二语料,其中,第一规则库中包括多种表意完整的语法结构。

    银行网点布局规划方法、装置、设备及存储介质

    公开(公告)号:CN116957650A

    公开(公告)日:2023-10-27

    申请号:CN202310692068.X

    申请日:2023-06-12

    摘要: 本申请提供一种银行网点布局规划方法、装置、设备及存储介质。涉及资源管理技术领域。该方法包括:确定预设区域内所有网点和栅格对应的第一空间映射关系;确定每一栅格对应的市场资源禀赋评分;根据第一空间映射关系和每一栅格对应的市场资源禀赋评分确定每一网点对应的周边区域的市场资源禀赋评分;确定每一网点的网点效能评分;分别对每一网点对应的周边区域的市场资源禀赋评分和网点效能评分进行划分并排序,并结合交叉分析法,得到第一网点调整方案;确定网点中的聚簇网点;基于聚簇网点的网点效能评分和业务服务范围对第一网点调整方案进行优化,得到网点的拆、迁和/或并的规划方案。本申请的方法,可以有序地对存量网点进行布局。

    一种搜索对象的方法、装置、电子设备及存储介质

    公开(公告)号:CN115357685A

    公开(公告)日:2022-11-18

    申请号:CN202211014052.5

    申请日:2022-08-23

    发明人: 谢鸣晓 李斌 张圳

    IPC分类号: G06F16/33

    摘要: 本发明公开一种搜索对象的方法、装置、电子设备及存储介质,应用于数据挖掘技术领域。该方法为:接收对待搜索对象的搜索请求,搜索请求中携带有搜索指示信息和待搜索对象的标识信息和请求触发时刻;搜索指示信息为内容搜索信息、内容组搜索信息,以及内容和内容组搜索信息中的任一种;搜索指示信息用于指示对多种非结构化数据的单一搜索和/或组合搜索;基于与搜索指示信息对应的目标搜索规则和待搜索对象的关联信息,确定目标搜索结果;目标搜索结果包括从预设数据库中确定的,与待搜索对象相关联的至少两种非结构化数据。可见,本发明可以获得与待搜索对象相关联的至少两种非结构化数据,例如图文、视频以及资讯等非结构化数据。

    一种对象的等级评估方法、装置、设备及介质

    公开(公告)号:CN118779707A

    公开(公告)日:2024-10-15

    申请号:CN202410935559.7

    申请日:2024-07-12

    摘要: 本申请涉及数据处理技术领域,公开了一种对象的等级评估方法、装置、设备及介质,用于解决相关技术中无法对涉绿企业进行评估以及无法对企业涉绿程度进行分析的问题。将待评估对象的特征向量输入到预设分类模型,以确定待评估对象是否为可评估等级对象,在确定待评估对象为可评估等级对象后,将待评估对象的多维对象信息分成多个用于评估待评估对象是否属于预设评估等级的信息集合,并将任意一个信息集合与预设的对象评估指导目录中的指标信息集合进行匹配,确定待评估对象的评估等级为任意一个信息集合对应的预设评估等级,由此,实现对待评估对象是否为可评估等级对象的判断以及确定了待评估对象的评估等级。

    一种绿色产业项目识别方法、装置及存储介质

    公开(公告)号:CN117033634A

    公开(公告)日:2023-11-10

    申请号:CN202311014625.9

    申请日:2023-08-11

    摘要: 本申请公开了一种绿色产业项目识别方法、装置及存储介质,涉及数据处理技术领域。该方法可应用于电子设备,该方法包括:电子设备获取待识别项目。电子设备根据待识别项目的关键词对待识别项目进行分类,确定待识别项目在绿色产业指导目录中的项目类别,其中,绿色产业指导目录包括为绿色产业项目的多种项目类别。电子设备根据待识别项目所属的项目类别对应的判断标准集合确定待识别项目是否为绿色产业项目,判断标准集合包括判断指标及判断指标对应的取值,若待识别项目的判断指标满足项目类别对应的判断标准集合的条件则待识别项目为绿色产业项目。该方法可以提高对绿色产业项目的识别效率。

    检测敏感字符串的方法、装置、设置及存储介质

    公开(公告)号:CN116756382A

    公开(公告)日:2023-09-15

    申请号:CN202310780376.8

    申请日:2023-06-29

    摘要: 本发明提供一种检测敏感字符串的方法、装置、设置及存储介质,涉及文本处理领域,该方法包括:获取待检测文本及前缀树;其中,所述前缀树包括目标路径,所述目标路径的起点为所述前缀树的根节点的子节点,所述目标路径的终点为含目标标识的节点;响应于所述待检测文本中目标字符串与所述目标路径的节点字符串匹配,确定所述目标字符串为所述敏感字符串;其中,所述节点字符串中的节点字符与所述目标路径上的所述节点一一对应。在检测待检测文本的敏感字符串的过程中,通过先在前缀树中根节点的子节点中进行遍历,降低待检测字符所需遍历的数据量,并以前缀树中目标路径为匹配单元,实现提升文本中检测敏感词效率的目的。

    内容推荐方法、系统、终端设备、介质及产品

    公开(公告)号:CN115374363A

    公开(公告)日:2022-11-22

    申请号:CN202211085362.6

    申请日:2022-09-06

    摘要: 本申请涉及推荐系统领域,提供一种内容推荐方法、系统、终端设备、介质及产品。该方法包括:在接收到待推荐内容之后,对每一待推荐内容进行识别,以获取每一待推荐内容对应的内容信息和标签信息,并获取目标用户对应的用户信息和历史行为信息;根据目标用户对应的用户信息和历史行为信息,以及每一待推荐内容对应的内容信息和标签信息生成推荐数据集;根据推荐数据集确定目标用户对应的规则图谱;根据规则图谱确定目标用户对每一待推荐内容的点击概率,并向目标用户输出最大点击概率对应的目标推荐内容。本申请的方法,可以提高了内容推荐的准确性,从而提升用户使用体验。

    网点容量的预估方法、装置、设备及存储介质

    公开(公告)号:CN116739379A

    公开(公告)日:2023-09-12

    申请号:CN202310721011.8

    申请日:2023-06-16

    IPC分类号: G06Q10/0637 G06Q40/02

    摘要: 本申请提供一种网点容量的预估方法、装置、设备及存储介质,属于资源管理技术领域,该方法包括获取待评估的网点容量的待测区域;将待测区域划分为多个决策单元,决策单元用于表示评估网点容量的单位区域;构建影响每一决策单元的网点容量的投入指标数据和产出指标数据;确定每一决策单元内的住户的区域储蓄能力系数,区域存储能力系数用于表示其所在的决策单元内的住户的整体储蓄能力与当前经营数据之间的正比关系;基于每一决策单元对应的投入指标数据、产出指标数据和区域储蓄能力系数评估当前决策单元对应的综合技术效益值;基于综合技术效益值确定网点数量。本申请实施例的方法,从宏观角度确定网点容量,提高了评估结果的准确性和全面性。