-
公开(公告)号:CN116562251B
公开(公告)日:2024-09-27
申请号:CN202310569275.6
申请日:2023-05-19
申请人: 中国矿业大学(北京)
IPC分类号: G06F40/18 , G06F40/205 , G06F40/284 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种面向证券信息披露长文档的表格分类方法,具体如下:步骤1、获得证券信息披露长文档的PDF文件,并进行解析;步骤2、依据关键词和上下文抽取算法,从解析后的PDF结构的证券信息披露长文档中抽取待分析的表格及其上下文;步骤3、预处理表格及其上下文,形成词嵌入模型训练上下文样本集合与表格分类样本集合;步骤4、通过上下文样本集合训练词嵌入模型;步骤5、使用训练获得的词嵌入模型对预处理后的表格及其上下文进行词嵌入表示,并使用不同的多尺度卷积神经网络,对表格及其上下文进行特征提取;步骤6、对提取到的表格及其上下文特征采取特征扩展融合方式,得到特征融合结果进行表格分类。本发明能快速准确的获取待分析表格。
-
公开(公告)号:CN118673919A
公开(公告)日:2024-09-20
申请号:CN202410713191.X
申请日:2024-06-04
申请人: 中国矿业大学(北京)
IPC分类号: G06F40/295 , G06F16/35 , G06F18/25 , G06N3/0442 , G06N3/0455 , G06N3/0464
摘要: 本发明公开了一种融合段落和文档特征的金融公告事件抽取方法,涉及金融领域与信息抽取技术领域,具体如下:步骤1.对金融公开数据集ChFinAnn中的金融公告文本进行数据预处理工作,将金融公告划分为段落;步骤2.利用Fin‑BERT预训练模型、卷积神经网络以及自注意力机制对金融公告进行段落特征的提取;步骤3.利用word2vec模型和双向长短期记忆网络对金融公告进行文档特征的提取;步骤4.将经过Fin‑BERT预训练模型得到的段落分类向量送入卷积神经网络,对金融公告中的事件进行分类判断;步骤5.将提取到的段落特征与文档特征融合后,通过双向长短期记忆网络与条件随机场对金融公告中的事件进行事件论元识别抽取。本发明达到了较好的事件抽取性能,具有较高的准确率。
-
公开(公告)号:CN116311259B
公开(公告)日:2024-03-12
申请号:CN202211562314.1
申请日:2022-12-07
申请人: 中国矿业大学(北京)
IPC分类号: G06V30/14 , G06V30/146
摘要: 本发明公开了一种PDF业务文档的信息抽取方法,涉及文件信息抽取和数据处理领域,包括如下步骤:步骤1、对PDF业务文档的每个页面进行解析,得到表格线列表;步骤2、若能够为一个字符对象生成最小单元格,则判定该字符对象为表格字符;否则判定该字符对象为非表格字符;步骤3、对所有的非表格字符以坐标信息进行拼接、分段,完成非表格区域的文本抽取,并得到每个非表格字符段的中心点的坐标;步骤4、根据非表格字符段的中心点的坐标,对所有最小单元格所属的表格区域进行划分,得到表格区域列表;步骤5、对表格区域列表完成结构和区域文本的抽取。本方法能够提高PDF业务文档,尤其是包含复杂表格的金融披露文档中信息抽取的精度。
-
公开(公告)号:CN116698609A
公开(公告)日:2023-09-05
申请号:CN202310700011.X
申请日:2023-06-13
申请人: 国家能源集团宁夏煤业有限责任公司 , 中国矿业大学(北京)
发明人: 李永亮 , 黄海鹏 , 吕兆海 , 滕仁崇 , 刘晓明 , 张森 , 李立波 , 张杰文 , 孙昊 , 陈小磊 , 李小龙 , 黄辉 , 沈铭华 , 王志乾 , 雷学涛 , 刘尚 , 姚帅 , 查伏强 , 魏巍 , 王胜 , 杨志华 , 徐斌
摘要: 本发明提供了一种二维相似模型试验装置,包括:支撑架;加压组件,包括多个加压囊,多个加压囊均设置在支撑架上,多个加压囊之间具有用于容纳待试验件的试验空间,多个加压囊均用于压设在待试验件上;各个加压囊均为柔性件且均具有用于容纳液体的容纳腔;储液箱,用于储存液体;液压伺服控制机构,多个加压囊和储液箱均与液压伺服控制机构相连通;液压伺服控制机构包括伺服控制器,以通过伺服控制器实时调节进入容纳腔内的液体量,以调节加压囊作用于待试验件上的荷载,本发明的二维相似模型试验装置解决了现有技术中的有围压试验存在围压不均匀的问题。
-
公开(公告)号:CN116562251A
公开(公告)日:2023-08-08
申请号:CN202310569275.6
申请日:2023-05-19
申请人: 中国矿业大学(北京)
IPC分类号: G06F40/18 , G06F40/205 , G06F40/284 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种面向证券信息披露长文档的表格分类方法,具体如下:步骤1、获得证券信息披露长文档的PDF文件,并进行解析;步骤2、依据关键词和上下文抽取算法,从解析后的PDF结构的证券信息披露长文档中抽取待分析的表格及其上下文;步骤3、预处理表格及其上下文,形成词嵌入模型训练上下文样本集合与表格分类样本集合;步骤4、通过上下文样本集合训练词嵌入模型;步骤5、使用训练获得的词嵌入模型对预处理后的表格及其上下文进行词嵌入表示,并使用不同的多尺度卷积神经网络,对表格及其上下文进行特征提取;步骤6、对提取到的表格及其上下文特征采取特征扩展融合方式,得到特征融合结果进行表格分类。本发明能快速准确的获取待分析表格。
-
公开(公告)号:CN116311259A
公开(公告)日:2023-06-23
申请号:CN202211562314.1
申请日:2022-12-07
申请人: 中国矿业大学(北京)
IPC分类号: G06V30/14 , G06V30/146
摘要: 本发明公开了一种PDF业务文档的信息抽取方法,涉及文件信息抽取和数据处理领域,包括如下步骤:步骤1、对PDF业务文档的每个页面进行解析,得到表格线列表;步骤2、若能够为一个字符对象生成最小单元格,则判定该字符对象为表格字符;否则判定该字符对象为非表格字符;步骤3、对所有的非表格字符以坐标信息进行拼接、分段,完成非表格区域的文本抽取,并得到每个非表格字符段的中心点的坐标;步骤4、根据非表格字符段的中心点的坐标,对所有最小单元格所属的表格区域进行划分,得到表格区域列表;步骤5、对表格区域列表完成结构和区域文本的抽取。本方法能够提高PDF业务文档,尤其是包含复杂表格的金融披露文档中信息抽取的精度。
-
公开(公告)号:CN106605882A
公开(公告)日:2017-05-03
申请号:CN201510702451.4
申请日:2015-10-27
申请人: 中国矿业大学(北京)
IPC分类号: A23L21/15 , A23L33/10 , A23L33/15 , A23L33/175
CPC分类号: A23V2002/00 , A23V2200/30 , A23V2200/324 , A23V2250/032 , A23V2250/0612 , A23V2250/063 , A23V2250/0644 , A23V2250/2108 , A23V2250/5036 , A23V2250/60 , A23V2250/7042 , A23V2250/7044 , A23V2250/7052 , A23V2250/706
摘要: 一种具有保健功能的果冻及其制备方法。本发明提供一种具有缓解体力疲劳、增强免疫力功能的保健果冻,所述果冻以重量百分比计采用如下配方:白砂糖14‑18wt%、纯化魔芋精粉0.05‑0.15wt%、Kappa型‑卡拉胶0.07‑0.17wt%、KCl0.08‑0.18wt%、柠檬酸0.3wt%、柠檬酸钠0.16wt%、牛磺酸0.01‑0.03wt%、D‑氨基葡萄糖盐酸盐0.01‑0.04wt%、左旋肉碱0.001‑0.005wt%、咖啡因0.001‑0.005wt%、肌醇0.001‑0.005wt%、赖氨酸0.002‑0.006wt%、维生素B20.0001‑0.001wt%、烟酰胺0.0003‑0.002wt%、维生素B20.0001‑0.0007wt%、维生素B60.00002‑0.0006wt%、维生素B10.00002‑0.0006wt%、维生素B121×10‑7‑5×10‑7wt%、柳橙浓缩汁1‑6wt%、余量为纯净水。本发明还涉及该保健果冻的制造方法,所述方法包括如下步骤:溶胶液制备、维生素混合液制备、其他功能性营养素溶液制备、熬煮、调配、调酸、灌装、杀菌、烘干、挑选、包装入库等步骤。
-
公开(公告)号:CN115468865A
公开(公告)日:2022-12-13
申请号:CN202210887499.7
申请日:2022-07-26
申请人: 国家能源集团宁夏煤业有限责任公司 , 中国矿业大学(北京)
发明人: 李永亮 , 黄海鹏 , 孙昊 , 蒙鹏科 , 杨仁树 , 刘小明 , 李小龙 , 沈铭华 , 张森 , 李立波 , 路绍杰 , 陈小磊 , 范子儀 , 吕凤圆 , 王志乾 , 黄辉 , 吕兆海
摘要: 本发明提供了一种锚定件剪切试验装置及锚定件剪切试验方法,其中,锚定件剪切试验装置,包括:第一固定框;多个第一千斤顶;第二固定框;多个第二千斤顶;第三千斤顶,设置于第一固定框和第二固定框之间,第四千斤顶,相对于第一固定框可移动地设置,第四千斤顶位于试验位置时,第三千斤顶的抵顶部和第四千斤顶的抵顶部之间形成第三夹持空间;第一试块,位于第一夹持空间内;第二试块,位于第二夹持空间内;第三试块,位于第三夹持空间内,其中,第一试块、第二试块以及第三试块上均设置有与锚杆或者锚索过盈配合的第一过孔。本申请的技术方案有效地解决了相关技术中的锚杆或者锚索在剪切应力作用下,受力情况不明确的问题。
-
公开(公告)号:CN110763512A
公开(公告)日:2020-02-07
申请号:CN201911217406.4
申请日:2019-12-03
申请人: 中国矿业大学(北京)
IPC分类号: G01N1/08
摘要: 本发明公开了一种实验室用小型多钻头立式钻孔取芯机,包括基座(1)、液压升降装置(2)、中空立臂(3)、电动机(5)、机箱(8)、钻具箱(9)、试件盘移动控制装置(10);其中立臂(3)固定在基座(1)上,液压升降装置(2)底部固定在基座(1)上;电动机固定在中空立臂(3)上;由传统的一次下刀取出单个岩样改变为利用五个钻头同时取芯,由一个主传动杆带动四个副传动杆进行工作,同时可实现大小钻头的切换且保证充分取样,皮带与皮带轮间采用锯齿形啮合连接传动方式,保证传动顺利进行。
-
-
-
-
-
-
-
-