一种数据可视化处理方法、装置及存储介质

    公开(公告)号:CN111026895B

    公开(公告)日:2023-04-28

    申请号:CN201911212122.6

    申请日:2019-12-02

    Abstract: 本申请实施例提供一种数据可视化处理方法、装置及存储介质,所述方法包括:对初始网络中各层位图的节点进行重叠去除,得到待处理网络;分别对所述待处理网络中的每层位图进行切片,得到各层位图的至少两个切片,所述至少两个切片均分布在预设窗口内,所述切片包括至少两个节点;在各切片上设置节点信息以及节点间的关联信息,得到多层切片;将所述多层切片保存为至少两个图片,对所述至少两个图片进行分层加载,以展示各图片对应的图形界面。本方案能够提高网络的绘制效率和网络的缩放效率。

    语言模型训练方法、装置、设备及存储介质

    公开(公告)号:CN113515948A

    公开(公告)日:2021-10-19

    申请号:CN202110031416.X

    申请日:2021-01-11

    Abstract: 本申请实施例提供了一种语言模型训练方法、装置、设备及存储介质,涉及机器学习技术领域。所述方法包括:基于全量预训练语料对初始的学生语言模型进行全量预训练,得到全量预训练后的学生语言模型;基于增量预训练语料对全量预训练后的学生语言模型进行增量预训练,得到增量预训练后的学生语言模型;其中,增量预训练语料是在全量预训练语料的基础上新增的预训练语料;采用教师语言模型对增量预训练后的学生语言模型进行知识蒸馏处理,得到蒸馏后的学生语言模型;采用目标任务的第二训练样本集,对蒸馏后的学生语言模型进行参数调整处理,得到完成训练的学生语言模型。采用本申请实施例提供的技术方案,能够节省语言模型训练的时间。

    一种数据可视化处理方法、装置及存储介质

    公开(公告)号:CN111026895A

    公开(公告)日:2020-04-17

    申请号:CN201911212122.6

    申请日:2019-12-02

    Abstract: 本申请实施例提供一种数据可视化处理方法、装置及存储介质,所述方法包括:对初始网络中各层位图的节点进行重叠去除,得到待处理网络;分别对所述待处理网络中的每层位图进行切片,得到各层位图的至少两个切片,所述至少两个切片均分布在预设窗口内,所述切片包括至少两个节点;在各切片上设置节点信息以及节点间的关联信息,得到多层切片;将所述多层切片保存为至少两个图片,对所述至少两个图片进行分层加载,以展示各图片对应的图形界面。本方案能够提高网络的绘制效率和网络的缩放效率。

    文本处理方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN115827884B

    公开(公告)日:2024-08-23

    申请号:CN202210903474.1

    申请日:2022-07-27

    Abstract: 本申请实施例公开了一种文本处理方法、装置、电子设备、介质及程序产品,应用于自然语言处理技术领域。其中方法包括:获取文本句集合,并基于分割字符对文本句集合中的文本句进行分割,得到多个子文本句,根据多个子文本句确定至少一个第一关系元组,根据多个子文本句确定至少一个第二关系元组,根据至少一个第一关系元组和至少一个第二关系元组构建文本句集合对应的关系知识图谱。采用本申请实施例,可以较为全面地获取到文本句中具有指定关系的分词组合,以及提高所构建的知识图谱的准确性。

    文本处理方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN115827884A

    公开(公告)日:2023-03-21

    申请号:CN202210903474.1

    申请日:2022-07-27

    Abstract: 本申请实施例公开了一种文本处理方法、装置、电子设备、介质及程序产品,应用于自然语言处理技术领域。其中方法包括:获取文本句集合,并基于分割字符对文本句集合中的文本句进行分割,得到多个子文本句,根据多个子文本句确定至少一个第一关系元组,根据多个子文本句确定至少一个第二关系元组,根据至少一个第一关系元组和至少一个第二关系元组构建文本句集合对应的关系知识图谱。采用本申请实施例,可以较为全面地获取到文本句中具有指定关系的分词组合,以及提高所构建的知识图谱的准确性。

    基于GCNDT-MacBERT神经网络框架的话语关系识别方法及系统

    公开(公告)号:CN113609267B

    公开(公告)日:2023-11-07

    申请号:CN202110826586.7

    申请日:2021-07-21

    Inventor: 江浩 傅洛伊

    Abstract: 本发明提供了一种基于GCNDT‑MacBERT神经网络框架的话语关系识别方法及系统,包括如下步骤:步骤S1:得到文本的词序列和句法依存树;步骤S2:对文本进行分字得到文本的字序列,得到包含上下文信息的字向量序列;步骤S3:根据词序列对字向量序列进行融合,获得词向量序列;步骤S4将句法依存树转化为图结构,得到更多信息的词向量序列;步骤S5:利用卷积神经网络对词向量序列进行向量特征融合并映射为固定长度的向量;步骤S6:将词向量序列输入多层感知机得出分类结果。本发明充分利用了文本内的上下文信息和语法关系,使用预训练模型和图卷积网络极大的促进模型学习文本的内在语义。

    提取文字图片及其描述的方法和系统

    公开(公告)号:CN113111869B

    公开(公告)日:2022-12-09

    申请号:CN202110368879.5

    申请日:2021-04-06

    Abstract: 本发明提供了一种提取文字图片及其描述的方法和系统,包括:从文件中抽取图片及其相关描述;判断图片中是否包含子图,若不包含子图则返回图片及其描述并结束;若包含子图则基于YOLO4模型进行目标检测,对子图进行识别切割;基于YOLO4目标检测模型检测子图的图片序号;基于CRNN算法,识别检测到的图片序号;根据图片序号信息对文本描述进行拆分及重新组合;将切割好的图片与其对应的文本描述匹配并返回。本发明可抽取文件中的图片及其描述,若图片中包含子图,则将子图进行切割并与其对应描述对齐,实现了将文件中的图片数据进行整理的目的。

    基于Transformer模型的实体关系抽取方法和系统

    公开(公告)号:CN113806514A

    公开(公告)日:2021-12-17

    申请号:CN202111101997.6

    申请日:2021-09-18

    Abstract: 本发明提供了一种基于Transformer模型的实体关系抽取方法和系统,包括:对非结构化文本进行数据处理,得到实体以及对应关系;根据关系类型,将关系抽取转换成填空的形式;基于Transformer结构,构建联合抽取模型,在编码器进行实体抽取,在非自回归解码器进行关系抽取;在解码器输入关系模板,基于前馈神经网络的复制机制,输出具有对应关系的实体对;通过两阶段排序策略和负采样机制训练模型,并对联合抽取模型效果的进行测试,并依据测试结果调整联合抽取模型。通过本发明可以实现在非结构化文本中进行特定关系的抽取,并识别出对应的实体,从而利用文本中有价值的信息。

    实体名称归一化系统及其方法、计算机可读介质

    公开(公告)号:CN112613318A

    公开(公告)日:2021-04-06

    申请号:CN202011640532.3

    申请日:2020-12-31

    Abstract: 本发明提供了一种实体名称归一化方法,其特征在于,包括:准备待归一化的名字记录以及相对应的标注名称记录用于训练;利用自然语言处理深度学习模型对标注名称记录组成的语料库进行字符级别的语言模型预训练;将标注名称记录按照设定的规则划分为训练集和测试集;利用训练集对预训练完成的自然语言处理深度学习模型进行微调训练;利用测试集验证预训练完成的自然语言处理深度学习模型的准确度及时间性能;将利用训练集、测试集进行微调训练、验证完成的自然语言处理深度学习模型对待归一化的实体名称进行归一化处理。本发明通过预训练字符级别语言模型来提取任意名称的特征向量,从而通过训练不同名称之间的距离度量来完成名称归一化任务。

    基于分割绘图法的网络布局方法、系统及介质

    公开(公告)号:CN110853120A

    公开(公告)日:2020-02-28

    申请号:CN201910954321.8

    申请日:2019-10-09

    Abstract: 本发明提供了一种基于分割绘图法的网络布局方法、系统及介质,包括:图分割步骤:根据原始数据使用启发式算法对全图进行分割得到多个子图;块间布局步骤:根据分割结果,基于图布局的力引导模型生成子图的块间布局;子图布局步骤:使用力引导模型对子图分别布局,得到最优的子图布局;拼接步骤:根据子图的块间布局对子图进行拼接,得到初期成图;调整步骤:根据力引导模型对初期成图的布局进行调整,得到最优的全图布局。本发明基于分割绘图法对超大规模网络进行布局,大幅提高了网络布局算法可处理的数据体量,突破了网络可视化算法百万量级的壁垒。

Patent Agency Ranking