基于字典和序列标注模型实体属性抽取方法、系统及设备

    公开(公告)号:CN111611799B

    公开(公告)日:2023-06-02

    申请号:CN202010377921.5

    申请日:2020-05-07

    摘要: 本发明公开了一种基于字典和序列标注模型的实体属性抽取方法、系统及设备,所述方法包括:根据预先创建的字典对输入文本进行分词处理,得到分词后的文本,并且得到分词后的文本中的属性名和与属性名对应的实体,创建包含实体和属性名的一个或多个数据节点;依次抽取每个数据节点中的属性名,将该属性名的标签定义为key,将其他属性名的标签定义为NN,结合定义的属性名的标签,将分词后的文本输入到预先训练好的序列标注模型中,得到分词后的文本中所有词对应的标签,根据所有词对应的标签的特定含义确定该属性名对应的属性值,进而得到输入文本中所有包含有实体、属性名和属性值的最终实体属性结果。

    一种基于字典的搜索词query纠错方法及系统

    公开(公告)号:CN116187303A

    公开(公告)日:2023-05-30

    申请号:CN202310215206.5

    申请日:2023-02-28

    发明人: 刘弦弦

    摘要: 本说明书实施例提供了一种基于字典的搜索词query纠错方法及系统,其中,方法包括:获取领域相关专业术语;对所述领域相关专业术语进行预处理,得到所述专业术语的子词,生成专业术语白字典;通过所述白字典对用户输入的搜索词query中的词语进行分析纠错。提高能够搜索引擎的纠错效率和准确率,节省用户的查询时间。

    基于句子关联的篇章语义自动识别方法及系统

    公开(公告)号:CN114154506A

    公开(公告)日:2022-03-08

    申请号:CN202110980677.6

    申请日:2021-08-25

    摘要: 本发明公开了一种基于句及子关联的篇章语义自动识别方法及系统,方法包括:按照篇章在标注语料中构建原始句子和篇章语义的对应关系;对原始句子进行缩并得到新句子,构建新句子和篇章语义的对应关系,将新句子和对应的语义标签按照字典的形式保存为1列,生成语义字典;对语义字典进行字典标注,将标注字典中的序列按字输出句子和语义标签2列,根据按字输出的2列句子和语义标签,进行CRF模型的训练,构建CRF模型;通过CRF模型对输入文档进行语义标签预测,通过语义字典对输入文档进行语义标签预测,以根据语义字典确定的语义标签为优先,将通过语义字典查询到的语义标签和CRF模型预测到的语义标签进行融合,得到输入文档的最终语义标签。

    基于知识图谱最短路径查询的搜索系统、方法及设备

    公开(公告)号:CN111611343A

    公开(公告)日:2020-09-01

    申请号:CN202010350391.5

    申请日:2020-04-28

    摘要: 本发明公开了一种基于知识图谱最短路径查询的搜索系统、方法及设备,该系统包括:应用层,接收用户的输入信息,并向用户展示搜索结果;加工层,根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点或根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;模型层,保存概念图谱、实例图谱、实例同义词、概念同义词;数据层,对原始数据进行管理。

    一种变速流水线环境下的不合格品剔除装置及方法

    公开(公告)号:CN111570331A

    公开(公告)日:2020-08-25

    申请号:CN202010363250.7

    申请日:2020-04-30

    摘要: 本发明公开了一种变速流水线环境下的不合格品剔除装置及方法,该装置包括多个光电开关设置于流水线两侧任意一侧;信息采集器设于流水线首端;剔除装置设于流水线尾端;工控机根据接收的图像通过产品检测算法确定产品信息的正误,若判断产品信息有误,则产品经过最后一个光电开关时,工控机根据各光电开关传输的时间点计算产品此时的初始速度、初始加速度,根据设定的产品剔除区长度,通过匀加速运动计算方法确定产品剔除时间,工控机向剔除装置发送剔除指令,剔除装置根据接收的剔除指令剔除产品操作。本装置实现不干扰生产流程、不需要设置剔除停留即可实现匀速流水线或匀变速流水线条件下通过动态跟踪产品位置从而快速剔除不合格产品。

    协议转换网关、纺织机监控系统及方法

    公开(公告)号:CN111555967A

    公开(公告)日:2020-08-18

    申请号:CN202010329274.0

    申请日:2020-04-23

    摘要: 本发明公开了一种协议转换网关、纺织机监控系统及方法,所述协议转换网关包括:纺织机接口模块,采用轮询的方式通过第一协议与纺织机进行通讯,采集第一协议纺织机数据;上位机接口模块,通过第二协议与上位机进行通讯,将数据发送到上位机;单片机,驱动并控制协议转换网关中的各个模块,并对采集的第一协议纺织机数据进行解析并存储到第一存储器,从第一存储器读取第一协议纺织机数据,将第一协议纺织机数据转换为第二协议上位机数据,并将转换后的第二协议上位机数据存储到第二存储器;存储器,用于存储第一协议纺织机数据和第二协议上位机数据;电源端子接口,用于为协议转换网关供电;拨码开关窗口,用于对协议转换网关的地址进行拨码设置。

    基于内容的大文本高阶语义张量化分类方法和系统

    公开(公告)号:CN107506415B

    公开(公告)日:2020-07-21

    申请号:CN201710687437.0

    申请日:2017-08-11

    摘要: 本发明公开了一种基于内容的大文本高阶语义张量化分类方法,包括:步骤一、构造类的DEC张量模型;步骤二、获取待分类的大文本中的部分文本,利用部分文本构建大文本的DEC张量,将其DEC张量和类的特征张量逻辑相乘,之后按照DEC的3个维度全部降维相加,得到大文本属于该类的强度,展示输出结果。本发明还公开了一种基于内容的大文本高阶语义张量化分类系统,包括:基础语料层,用于存储DEC张量模型要素和模型加工所需要的语料样本;DEC语义处理层,用于完成大文本的分词和DEC张量化,实现对张量模型的计算和调用;应用层,用于完成用户输入文本的接收和展示分类结果。本发明解决了计算资源不足和文本理解准确性之间矛盾。

    基于全文的大文本CRF和规则分类方法和系统

    公开(公告)号:CN107368610B

    公开(公告)日:2020-07-17

    申请号:CN201710685936.6

    申请日:2017-08-11

    IPC分类号: G06F16/35

    摘要: 本发明提供了一种基于全文的大文本CRF和规则分类方法和系统,是条件随机场和规则分类方法相结合,对大文本的全文进行分类。对输入大文本的标题部分采用基于语义的统计CRF分类方法;对大文本的正文部分采用基于规则的词袋分类方法;最后按照CRF分类结果为主规则分类结果为辅的方式对分类结果进行整合、去重、排序,输出语义层次和字符层次整合的最终分类结果。这种方法由于解决了标题的高度抽象性和正文的实体繁杂性之间的矛盾,实现了对文本不同视角的认识,满足了不同人群对大文本的个性化认识,具有全文分类整体准确度高的特点。

    一种利乐包流水线喷码信息采集设备

    公开(公告)号:CN111398173A

    公开(公告)日:2020-07-10

    申请号:CN202010374413.1

    申请日:2020-05-06

    IPC分类号: G01N21/01 G01N21/898

    摘要: 本发明提供了一种利乐包流水线喷码信息采集设备,包括:壳体、光电开关、相机和光源;所述壳体的下侧具有与利乐包流水线的形状相匹配的检测口,所述光电开关、相机和光源均连接在所述壳体中;所述光电开关位于所述利乐包流水线的侧方,所述相机和光源位于所述利乐包流水线的上方。本发明在利乐包流水线上设置了由光电开关、相机和光源组成的一套图像采集装置,光电开关用于检测利乐包流水线上是否有利乐包通过,相机用于在光电开关检测到利乐包流水线上有利乐包通过时给利乐包拍照,光源用于在相机拍照的时候进行光照,本装置能够实时反馈利乐包流水线上的利乐包喷码信息,且采集到的的信息为照片的形式,方便工人对生产进行实时监控。