一种面向XBRL领域本体的语义基元提取方法

    公开(公告)号:CN111797635A

    公开(公告)日:2020-10-20

    申请号:CN202010677371.9

    申请日:2020-07-14

    Applicant: 暨南大学

    Inventor: 潘定 叶迪 梁倬骞

    Abstract: 发明公开了一种面向XBRL领域本体的语义基元提取方法,具体步骤为:步骤1、通过会计词典中提取、整理会计术语的定义文本;步骤2、对文本进行切词、去停用词和去重处理;步骤3、构建会计术语有向网络图;步骤4、基于会计词典构建网络图后,利用MATLAB R2016a计算出各节点的PageRank值,作为语义基元提取的依据,该面向XBRL领域本体的语义基元提取方法,解决了目前基于当前流行的机器学习算法试图解决语义基元提取难点,该种方法虽然有效地减少了人工以及时间成本,但抽取出的术语存在大量噪声、领域特性不突出且无法验证其有效性的问题。

    一种年报中的金融领域事件句提取方法

    公开(公告)号:CN111666769A

    公开(公告)日:2020-09-15

    申请号:CN202010528238.7

    申请日:2020-06-11

    Applicant: 暨南大学

    Abstract: 发明公开了一种年报中的金融领域事件句提取方法,具体步骤为:步骤1、输入财务报告数据,步骤2、对数据进行预处理,步骤3、选取基于感知机序列标注的命名实体识别,步骤4、改进基于TextRank的关键词提取算法,步骤5、输出得出文本关键词,本发明涉及金融领域事件句提取技术领域。该年报中的金融领域事件句提取方法,解决了TextRank关键词提取算法分词时忽略命名实体,关键词提取计算算法不理想,以及容易被噪声信息干扰导致提取关键词错误的问题。

    一种基于语言模型的年报语料库构建方法

    公开(公告)号:CN110928989A

    公开(公告)日:2020-03-27

    申请号:CN201911059126.5

    申请日:2019-11-01

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于语言模型的年报语料库构建方法,具体步骤为:步骤1、通过网络爬取进行数据收集,并使用PDFBox进行数据提取;步骤2、利用正则表达式进行目录提取;步骤3、运用语言模型进行数据分析;步骤4、进行模型训练并建立语料库,本发明涉及语料库构技术领域。该基于语言模型的年报语料库构建方法,解决了一般的规则对种类繁多、各式各样的标题适应性很差,需要人为不断修改规则进行改良,加上财务报告中含有众多表格,从中产生了许多干扰项,对机器自动识别造成阻碍的问题。

    一种基于opencv库的文本版面识别方法

    公开(公告)号:CN110889401A

    公开(公告)日:2020-03-17

    申请号:CN201911059127.X

    申请日:2019-11-01

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于opencv库的文本版面识别方法,一种基于opencv库的文本版面识别方法,具体步骤为:步骤1、通过Smallpdf将所需pdf文件转成多张图片,每一页pdf一张图;步骤2、使用OpenCV对图片进行膨胀操作;步骤3、调用开源的Tesseract OCR API进行文字识别本发明涉及文本版面识别技术领域。该基于opencv库的文本版面识别方法,解决了常常由于文本标题的格式不规范、不统一的问题,给计算机的自动识别带来困难,最后的提取结果会不够精准,常有赘余,难以广泛应用题的问题。

    一种基于事件关联的桌面云搜索方法

    公开(公告)号:CN102508857B

    公开(公告)日:2013-10-02

    申请号:CN201110299737.4

    申请日:2011-09-29

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于时间关联的桌面云搜索方法,具体步骤是:(1)对存储本地文件使用的历史文件数据库进行监控,当这些文件被修改时则执行步骤(2)的操作;(2)内核给程序发出一个时间通知来唤醒程序,经过对上述对象事件的判定来构建结构体,然后执行步骤(3);(3)把步骤(2)中构建的结构体发送到预先约定的消息队列中,然后进程继续阻塞,等待下一个时间的到来,继续执行步骤(1);(4)对消息队列中的消息进行读取;(5)为用户提供一个图形前端界面;(6)程序搜索;(7)显示搜索结果。本发明将模糊的记忆和其相应的历史事件关联起来,通过关联的历史,也就是数据起源的方式,来准确定位搜索的信息。

    一种网络鲁棒性评估方法及系统

    公开(公告)号:CN111488711A

    公开(公告)日:2020-08-04

    申请号:CN202010282838.X

    申请日:2020-04-08

    Applicant: 暨南大学

    Inventor: 郑桦 邓原 梁倬骞

    Abstract: 本发明属于网络检测技术领域,尤其涉及一种网络鲁棒性评估方法及系统。所述方法包括:获取网络的初始参数,根据所述初始参数获取所述网络的初始负载模型,所述初始参数包括:所述网络的初始节点数、初始边数、初始随机游走者数、负载容限参数和负载削减参数;通过卷积神经网络模型用于对特征进行提取,并通过特征进行特征学习,网络中模拟基于随机游走的网络故障,并根据所述初始参数和所述初始负载模型对鲁棒图进行表征学习,提高了网络鲁棒图的获取的准确性。进一步,根据网络故障后网络重新稳定时对应的目标网路巨分量来评估网络的鲁棒性,不需要网络中所有节点的连接情况,数据处理量较小,提高了网络鲁棒性评估的速度和精度。

    一种基于动态信息分配的非等间隔联邦滤波方法

    公开(公告)号:CN111397597A

    公开(公告)日:2020-07-10

    申请号:CN202010269012.X

    申请日:2020-04-08

    Applicant: 暨南大学

    Inventor: 郑桦 邓原 梁倬骞

    Abstract: 本发明公开的属于动态信息技术领域,具体为一种基于动态信息分配的非等间隔联邦滤波方法,该方法如下:步骤一:设定主滤波器和子滤波器数量,进行信息平均分配;步骤二:设定检测信息,进行故障检测;步骤三:产生故障时,对产生故障的子滤波器进行数据消除;步骤七:代入到整体单元中后,对递进时产生的过渡信息进行刮削,刮削后进行刷新即可,能够针对产生的传感器故障,进行整体降级,使全局滤波器和局部滤波器呈比例状进行重置,同时在故障隔离后,重新调整故障的局部滤波器,使其呈递进式的过渡到整体单元中,再通过对过渡时间段进行刮削,有效的减少了故障恢复时长,提高故障恢复能力。

    一种年报文本结构识别方法

    公开(公告)号:CN110287784A

    公开(公告)日:2019-09-27

    申请号:CN201910416590.9

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本结构识别方法,体步骤为:步骤1:利用标题规则抽取TXT版本年报中的行,作为候选第一标题;步骤2:利用OpenCV基于视觉的图像处理技术,识别出PDF文件中具有标题特征的候选第二标题;步骤3:比对候选第一标题和候选第二标题形成候选第三标题;步骤4:利用信息熵计算标题行的左右互信息,对候选第三标题进行筛选形成企业年报小标题;步骤5:整理年报小标题形成企业年报目录结构涉及年报文本结构识别技术领域。该年报文本结构识别方法解决了PDF财务报告中不仅内嵌多种多样的表格,还嵌有类型各异的文件,这些表格和文件具有独立表格和独立文件的结构,分析难度大的问题。

    一种年报文本标题自动标注系统

    公开(公告)号:CN110287458A

    公开(公告)日:2019-09-27

    申请号:CN201910416616.X

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本标题自动标注系统,其具体方法为:A、对不同级别的一级标题和二级标题都要进行两次标注;B、匹配一级标题,第一次标注将完全和标题模板匹配,以及通过相似度计算达到阈值的一级标题别添加M、S标注,并筛选越级标注,第二次标注将通过相似度计算而标注的标题进行二次匹配涉及年报文本标题标注技术领域。该年报文本标题自动标注系统,发明选择采用机器视觉的方法对财务报告文本版面进行识别,并将机器视觉和规则统计文本抽取方法有机结合起来,以解决较难准确的对标题进行标注的问题。

    一种基于事件关联的桌面云搜索方法

    公开(公告)号:CN102508857A

    公开(公告)日:2012-06-20

    申请号:CN201110299737.4

    申请日:2011-09-29

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于时间关联的桌面云搜索方法,具体步骤是:(1)对存储本地文件使用的历史文件数据库进行监控,当这些文件被修改时则执行步骤(2)的操作;(2)内核给程序发出一个时间通知来唤醒程序,经过对上述对象事件的判定来构建结构体,然后执行步骤(3);(3)把步骤(2)中构建的结构体发送到预先约定的消息队列中,然后进程继续阻塞,等待下一个时间的到来,继续执行步骤(1);(4)对消息队列中的消息进行读取;(5)为用户提供一个图形前端界面;(6)程序搜索;(7)显示搜索结果。本发明将模糊的记忆和其相应的历史事件关联起来,通过关联的历史,也就是数据起源的方式,来准确定位搜索的信息。

Patent Agency Ranking