-
公开(公告)号:CN118916564A
公开(公告)日:2024-11-08
申请号:CN202411045093.X
申请日:2024-07-31
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/958
Abstract: 本申请提供一种新闻站点的解析方法和装置,该方法包括:获取新闻网站的站点列表,站点列表中包括多个链接;根据多个链接的链接结构,从多个链接中提取新闻链接;根据新闻链接的html页面源码以及html页面源码中各html节点的属性信息,提取新闻链接的新闻数据,新闻数据包括新闻正文、新闻发布时间和新闻标题中的至少一项。由于新闻链接的链接结构与其他链接的链接结构不同,因此,通过分析新闻站点中多个链接的链接结构,可以从新闻站点中有效提取得到新闻链接;由于可以根据新闻链接的html页面源码和html页面源码中各html节点的属性信息对新闻链接进行分析,因此,可以有效提取得到新闻数据,提高新闻数据的解析准确率。
-
公开(公告)号:CN116976361A
公开(公告)日:2023-10-31
申请号:CN202310690301.0
申请日:2023-06-12
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本发明涉及机器翻译领域,提供了一种基于RLHF的自适应机器翻译方法及存储介质。解决现有方法在处理多义词和歧义词时存在不足、没有考虑上下文语境的影响导致翻译结果不准确,难以进一步提高翻译质量和准确性。主要方案包括设计RLHF算法,选择针对翻译任务改进的PPO算法作为RLHF策略,用于中根据用户反馈调整和改进翻译系统的神经机器翻译模型;设计改进后的多语言机器翻译网络,构建自适应机器翻译模型根据用户反馈调整和改进其翻译,收集用户反馈,根据用户反馈利用强化学习策略更新自适应机器翻译模型参数,利用收集到的用户反馈,根据改进的PPO算法,再次更新自适应机器翻译模型的参数,以达到提升翻译准确性的目的。
-
公开(公告)号:CN116843410A
公开(公告)日:2023-10-03
申请号:CN202310690252.0
申请日:2023-06-12
Applicant: 北京百分点科技集团股份有限公司
IPC: G06Q30/0601 , G06F16/9535 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于大小数据融合的商品推荐方法及系统,属于自然语言处理技术领域,解决现有技术无法有效对购买行为进行深度与宽度分析,从而易造成分析结果不准确的问题。本发明采用两种编码器对用户画像进行编码融合,得到用户画像编码;对用户的浏览历史和购买历史类商品的文本信息进行编码,得到商品文本信息编码;融合用户画像编码和商品文本信息编码,得到融合向量;将融合向量分别输入指针解码网络和LSTM中进行解码,得到各商品的分数;将两个不同源的商品进行相同商品项归并,归并后取不同源中值最大的分数作为此商品的最终得分,并根据得到对所有商品进行排序,排序后将结果反馈给用户。本发明用于向用户进行商品推荐。
-
公开(公告)号:CN116306595A
公开(公告)日:2023-06-23
申请号:CN202310193394.6
申请日:2023-02-24
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F40/232 , G06F40/289 , G06F40/126 , G06N3/04
Abstract: 本申请公开了一种文本纠错方法、装置、电子设备及存储介质,方法包括:获取待纠错的中文文本;通过预先训练的中文纠错编码模型对所述中文文本进行向量化处理,得到文本向量,其中所述中文纠错编码模型中的嵌入层包括字音嵌入层和字形嵌入层;将所述文本向量和所述文本向量对应的分词,按照所述文本向量的位置编码以及所述分词对应的起始位置编码和终止位置编码,输入至预先训练的中文纠错模型中,得到纠错结果,其中所述纠错结果包括每个字向量对应的纠错动作以及所述纠错动作对应的纠错词。本实施例提高了文本纠错的准确率。
-
公开(公告)号:CN116244309A
公开(公告)日:2023-06-09
申请号:CN202310140615.3
申请日:2023-02-13
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本申请实施例提供了一种数据获取的方法、装置、电子设备和计算机可读介质,涉及大数据技术领域。所述方法包括:确定用于表示数据仓库中数据流转情况的图谱结构,所述图谱结构包括用于表示数据从源数据库接入到所述数据仓库的数据接入节点;根据所述图谱结构,确定目标数据的所述数据接入节点;获取与所述数据接入节点对应的数据源信息。
-
公开(公告)号:CN116226680A
公开(公告)日:2023-06-06
申请号:CN202310126666.0
申请日:2023-02-16
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F18/22 , G06N3/0464 , G06N3/045
Abstract: 本申请实施例提供了一种数据处理方法及装置,包括:接收对数据集成中业务数据的分析指令;响应于所述分析指令,获取所述业务数据的元数据和所述业务数据的数据内容,所述元数据指示所述业务数据的数据属性;将所述元数据输入到第一模型中进行第一处理,得到第一处理结果,所述第一处理用于计算所述元数据与参考元数据之间的相似度;将所述数据内容输入到第二模型中进行第二处理,得到第二处理结果,所述第二处理用于计算所述数据内容与参考数据内容之间的相似度;根据所述第一处理结果和所述第二处理结果确定所述业务数据的第三处理结果。
-
公开(公告)号:CN116089610A
公开(公告)日:2023-05-09
申请号:CN202310043528.6
申请日:2023-01-29
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/35 , G06F18/2415 , G06N3/0464
Abstract: 本发明涉及计算机领域,提供了一种基于行业知识的标签识别方法及装置。主旨在于在于通过本技术来解决标准标签识别问题。主要方案包对原始数据进行采样,获取业务系统中数据,并依据标准对标准标签构建层级关系,获得数据以及标准库中数据对应的标准标签;数据预处理,对采集到的数据表、字段以及字段下的样例数据附加上对应的标准标签;对数据向量化,将给定的数据经过预训练模型训练后获取向量化表示;对向量进行特征向量提取,使用深度神经网络,通过设置不同大小的过滤器和池化操作选择适合数据分类的特征向量,全连接层通过在融合层之后加入隐含层和最后的Softmax层充当一个分类器,对文本进行最终的分类,将得到的标准类别标签。
-
公开(公告)号:CN115563285A
公开(公告)日:2023-01-03
申请号:CN202211379070.3
申请日:2022-11-04
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/35 , G06F40/154 , G06N20/20 , G06V30/14
Abstract: 本公开涉及一种文本处理的方法、装置、电子设备及存储介质,涉及文本处理领域。本公开首先获取目标应急预案对应的预案文本,其次将所述预案文本进行划分,得到至少一个目标子文本,然后针对至少一个目标子文本中的每个目标子文本,将所述目标子文本作为预先训练的预案提取模型的输入,得到所述预案提取模型输出的所述目标子文本对应的至少一个目标预案数据,最后根据至少一个目标子文本中的每个目标子文本分别对应的所述目标预案数据,生成所述预案文本对应的目标预案。这样,通过预先训练的预案提取模型生成目标预案,能够提升应急预案数字化过程中的对不同应急预案文本的适应能力,有利于提升应急预案数字化的效率。
-
公开(公告)号:CN111861759B
公开(公告)日:2022-12-23
申请号:CN202010542093.6
申请日:2020-06-15
Applicant: 北京百分点科技集团股份有限公司
IPC: G06Q40/08 , G06F16/9535
Abstract: 本发明公开了一种产品与客户群体的匹配方法和系统,该方法包括:获取用户输入的标签集合;计算所述标签集合对应的效用矩阵得到结果矩阵,其中,所述效用矩阵基于标签集合矩阵和偏好系数矩阵确定,所述标签集合矩阵表示对象与对象标签集合的对应关系,所述对象包括产品或者客户群体,所述偏好系数矩阵表示客户群体与产品之间的偏好度;根据所述结果矩阵的元素的值确定与所述标签集合匹配的目标标签集合;根据所述目标标签集合确定匹配的目标对象,所述目标对象包括目标产品或者目标客户群体。本实施例可以基于产品确定匹配的客户群体以及根据客户群体确定匹配度产品,提高产品与客户群体的匹配精度。
-
公开(公告)号:CN115357750A
公开(公告)日:2022-11-18
申请号:CN202210988027.0
申请日:2022-08-17
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/61 , G06F16/632 , G06F16/65
Abstract: 本公开涉及一种语音通话处理方法、装置、电子设备和存储介质,该语音通话处理方法包括:获取应用组数据集,该应用组数据集包括多个应用组数据,每个应用组数据包括同一应用下的多条通话记录,并确定每个应用组数据中的多条通话记录之间的距离,并基于距离得到标记结果,再根据标记结果,对通话记录进行关联。以便将属于同一通话的多条通话记录进行关联,从而能够根据关联结果确定参与同一通话的多个参与方,以便支持调查分析工作。
-
-
-
-
-
-
-
-
-