-
公开(公告)号:CN111428764B
公开(公告)日:2022-06-03
申请号:CN202010185125.1
申请日:2020-03-17
Applicant: 电子科技大学
IPC: G06V10/762 , G06K9/62 , G06F16/53 , G06F16/55
Abstract: 本发明公开了一种用于图像类别识别的图像聚类方法,属于于图像处理技术领域。本发明通过基于泰森多边形的k均值算法改进,达到更精准和高效地实现数据对象聚类和区分数据对象之间的不同,通过基于加权平均值法的k均值算法改进,进一步提高聚类效率,通过基于主成分分析法的k均值算法改进,把多维的数据特征降维,以方便使用泰森多边形初始化,最终得到改进的k均值算法,从而基于该改进的k均值算法实现本发明的图像聚类处理,提升图像的管理和检索性能。
-
公开(公告)号:CN111428764A
公开(公告)日:2020-07-17
申请号:CN202010185125.1
申请日:2020-03-17
Applicant: 电子科技大学
Abstract: 本发明公开了一种用于图像类别识别的图像聚类方法,属于于图像处理技术领域。本发明通过基于泰森多边形的k均值算法改进,达到更精准和高效地实现数据对象聚类和区分数据对象之间的不同,通过基于加权平均值法的k均值算法改进,进一步提高聚类效率,通过基于主成分分析法的k均值算法改进,把多维的数据特征降维,以方便使用泰森多边形初始化,最终得到改进的k均值算法,从而基于该改进的k均值算法实现本发明的图像聚类处理,提升图像的管理和检索性能。
-
公开(公告)号:CN111310478A
公开(公告)日:2020-06-19
申请号:CN202010193466.3
申请日:2020-03-18
Applicant: 电子科技大学
IPC: G06F40/30 , G06F40/216 , G06F40/205
Abstract: 本发明公开了一种基于TF-IDF和词向量的相似句子检测方法,属于属于自然语言处理技术领域。本发明利用TF-IDF,对每一个词语加入了权重,用于体现词语的重要程度及对整句相似度计算的影响,越重要的词语,其TF-IDF值越大,对相似度的影响也越大;同时针对基于共现词的Jaccard算法未涉及语义层面的相似度对比,不能处理同义词和近义词的问题,本发明利用词向量对其进行了改进,使其能够在语义层面进行相似度计算。同时,本发明所提出的相似句子的检测方法,使得对句子中的词语进行同义词替换后,也不会影响两个句子的相似度,因此可以将本发明所提出的句子相似度方法用于中文文章的查重,文献检索等。
-
公开(公告)号:CN111310478B
公开(公告)日:2023-09-19
申请号:CN202010193466.3
申请日:2020-03-18
Applicant: 电子科技大学
IPC: G06F40/30 , G06F40/216 , G06F40/205
Abstract: 本发明公开了一种基于TF‑IDF和词向量的相似句子检测方法,属于属于自然语言处理技术领域。本发明利用TF‑IDF,对每一个词语加入了权重,用于体现词语的重要程度及对整句相似度计算的影响,越重要的词语,其TF‑IDF值越大,对相似度的影响也越大;同时针对基于共现词的Jaccard算法未涉及语义层面的相似度对比,不能处理同义词和近义词的问题,本发明利用词向量对其进行了改进,使其能够在语义层面进行相似度计算。同时,本发明所提出的相似句子的检测方法,使得对句子中的词语进行同义词替换后,也不会影响两个句子的相似度,因此可以将本发明所提出的句子相似度方法用于中文文章的查重,文献检索等。
-
公开(公告)号:CN111382575A
公开(公告)日:2020-07-07
申请号:CN202010197606.4
申请日:2020-03-19
Applicant: 电子科技大学
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N3/04
Abstract: 本发明公开了一种基于联合标注和实体语义信息的事件抽取方法,自然语言智能处理技术领域。本发明的事件抽取方法,首先采用BERT模型作为特征提取器;其次,基于字特征输入建模,不进行分词操作,并采用BIO标注,降低触发词识别的错误;再将抽取得到的事件通过计算事件相似度进行同类型事件的事件元素融合。从而使得本发明所提取的文本对象的特征信息更丰富、降低中文文本语料分词的粒度不同所导致的触发词的识别准确率的影响,以及避免因同一事件的事件元素信息可能出现在多个不同的段落或句子对事件抽取的准确性的影响。
-
-
-
-