一种面向电商数据的商标侵权分析方法及系统

    公开(公告)号:CN114529784B

    公开(公告)日:2022-11-18

    申请号:CN202210153495.6

    申请日:2022-02-18

    摘要: 本发明提出了一种面向电商数据的商标侵权分析方法,通过构建商标检测模型和商品检测模型;利用商品检测模型提取品牌商的标准商品特征信息,并确定应用商标检测模型中哪几种商标分类进行检测;获取待侵权判断的商品特征信息并设置侵权阈值,计算每种商品的标准商品特征信息与待侵权判断的商品特征信息的相似度,若存在相似度大于侵权阈值的商品,则使用商标检测模型对待侵权判断的商品信息进行识别,若存在对应的商标分类,则判断此商品的商标为不当使用。本发明还提供一种商标侵权分析系统,通过训练商标检测模型和商品检测模型,综合电商平台相关的商品信息数据对商标侵权进行分析,有效提高针对电商平台的商标侵权判断方法的可行性和准确性。

    一种基于大语言模型和主题模型的网民观点分析方法

    公开(公告)号:CN117688182A

    公开(公告)日:2024-03-12

    申请号:CN202311719713.9

    申请日:2023-12-14

    发明人: 陈学言 王波 林泳

    摘要: 本发明涉及一种基于大语言模型和主题模型的网民观点分析方法。本发明通过综合考虑不同维度的信息,如TF‑IDF、关键词、主题模型和命名实体识别等,能够准确地分析和总结网民观点,并生成准确的观点情感结果。它能够从多个角度分析观点,发现不同维度的共性和差异,为决策提供更全面的参考。利用大语言模型处理和分析大量的文本数据,减少了人工干预的需求,提高了效率和可扩展性。该方法能够节省时间和人力成本,并能够处理大规模的数据,从而更全面地了解和总结观点。另外,可以根据具体需求进行定制和调整,包括设置TF‑IDF阈值、预定义关键词码表、调整主题模型参数、更替大语言模型prompt等,这使得技术能够适应不同领域和应用场景的需求。

    一种海外社交媒体语言与地域预测方法

    公开(公告)号:CN116720082A

    公开(公告)日:2023-09-08

    申请号:CN202310703455.9

    申请日:2023-06-14

    摘要: 本发明涉及一种海外社交媒体语言与地域预测方法。本发明通过分析博主发布的推文中使用的语言种类,对博主所在地域进行初步推测;分析博主关注的用户和互动最频繁的用户的地域信息,通过对这些关联人员地域数据的统计和分析,为博主地域预测提供进一步的依据;本方法结合了博主发文的语言种类和关联人员地域信息,从而提高预测的精度。此外,该技术可以动态调整预测模型,利用机器学习算法随着数据的更新不断进行调优,进一步提高预测性能,保持模型的时效性和可靠性。这种技术具有广泛适用性,可以应用于社交媒体平台的博主地域预测,并为广告投放、市场调查、舆情分析等相关业务提供有力支持。

    一种营商政策系统的构建方案及系统

    公开(公告)号:CN115953041A

    公开(公告)日:2023-04-11

    申请号:CN202211724821.0

    申请日:2022-12-30

    发明人: 陈学言 田平 刘源

    摘要: 本发明涉及一种营商政策系统的构建方案及系统。本发明基于大数据平台能力,获取国内政府网站全部公开政策资讯,多重组合算法区分政策和资讯信息,包括站点算法、板块算法、链接算法、索引算法,融合线下汇编政策,保障数据广度,同时,构建营商环境知识图谱,扩展营商环境政策库识别范围;另一方面,基于营商环境文本分析模型及知识图谱,识别分类实体隐性关系及关系的动态变化,精准识别、分类、分析政策,建立特有的政策影响力分析模型,从影响广度和影响深度2个方向进行深度分析。

    一种搜索引擎的千人千面程度测评方法

    公开(公告)号:CN114201412B

    公开(公告)日:2022-05-06

    申请号:CN202210140563.5

    申请日:2022-02-16

    IPC分类号: G06F11/36 G06F17/18

    摘要: 本发明公开了一种搜索引擎的千人千面程度测评方法、系统及计算机可读存储介质,方法包括以下步骤:S1:定义品牌的用户群体;S2:根据已定义的用户群体设置虚拟用户,根据虚拟用户设计养成计划;S3:定义虚拟用户养成的成功指标及搜索引擎千人千面的程度指标;S4:利用所述养成计划进行虚拟用户养成,根据虚拟用户养成的成功指标选择已养成的虚拟用户;S5:利用已养成的虚拟用户搜索待测评的关键词,根据搜索结果得到搜索引擎的千人千面程度。本发明通过设置虚拟用户及养成计划,并定义虚拟用户养成的指标及千人千面的程度指标同时结合线性回归分析的散点图能够高效且直观的对搜索引擎进行千人千面程度测试。

    一种基于图片信息聚类的信息批量提取方法

    公开(公告)号:CN114202761A

    公开(公告)日:2022-03-18

    申请号:CN202210140562.0

    申请日:2022-02-16

    IPC分类号: G06V30/148 G06V30/18 G06K9/62

    摘要: 本发明公开了一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质,方法包括:从待识别的图像中提取出商品对象和文字对象并分类编号,确定每个对象的坐标系;对得到的不同对象边缘打点并确定所打点的坐标;将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;将组合的对象继续与其他对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续与其他不同类对象碰撞计算,直到所有对象均组合,输出组合对象。本发明能够实现复杂背景中关联对象的组合识别并进行信息提取。

    一种搜索引擎的千人千面程度测评方法

    公开(公告)号:CN114201412A

    公开(公告)日:2022-03-18

    申请号:CN202210140563.5

    申请日:2022-02-16

    IPC分类号: G06F11/36 G06F17/18

    摘要: 本发明公开了一种搜索引擎的千人千面程度测评方法、系统及计算机可读存储介质,方法包括以下步骤:S1:定义品牌的用户群体;S2:根据已定义的用户群体设置虚拟用户,根据虚拟用户设计养成计划;S3:定义虚拟用户养成的成功指标及搜索引擎千人千面的程度指标;S4:利用所述养成计划进行虚拟用户养成,根据虚拟用户养成的成功指标选择已养成的虚拟用户;S5:利用已养成的虚拟用户搜索待测评的关键词,根据搜索结果得到搜索引擎的千人千面程度。本发明通过设置虚拟用户及养成计划,并定义虚拟用户养成的指标及千人千面的程度指标同时结合线性回归分析的散点图能够高效且直观的对搜索引擎进行千人千面程度测试。

    一种舆情事件中提取重要观点的方法

    公开(公告)号:CN116150461A

    公开(公告)日:2023-05-23

    申请号:CN202211724763.1

    申请日:2022-12-30

    发明人: 陈学言 田平 王垒

    摘要: 本发明涉及一种舆情事件中提取重要观点的方法。本发明利用了机器学习和算法模型,基于互信息和左右交叉熵从海量文本中抽取出行业内特定短语和专有名词,基于glove模型利用行业内语料训练词向量模型,利用词向量召回与“说”和“表示”的近义词,抽取出来的专有名词词典,并依据专家规则把属于言论观点的句子进行召回,利用NER模型判断观点中表述者字段是否包含业务指定的实体类型,对观点进行筛选利用句法依存树分析表述者字段的词汇依赖关系,从中表述者实体关系,作为重要观点依据。本技术可扩展至多个行业多种类型事件,不局限于单一数据类型,支持多种数据类型,对大数据量下的多种观点进行了聚类,便于查看理解。

    一种政务舆情知识图谱的构建方法

    公开(公告)号:CN116127093A

    公开(公告)日:2023-05-16

    申请号:CN202211724825.9

    申请日:2022-12-30

    发明人: 陈学言 田平 王波

    IPC分类号: G06F16/36 G06F16/901

    摘要: 本发明涉及一种政务舆情知识图谱的构建方法。本发明基于bert模型,将实体抽取任务转换成问答任务,同时基于机制,通过构建领域内问答模板,从而提高模型的泛化能力,并且在图谱生成阶段通过前处理和后处理构建专业的政务舆情知识图谱。在数据的抽取上通过政务标签抽取出了政务舆情相关性比较强的舆情数据,增强了标注工作的有效性;本方法在实体对齐中使用了实体向量提取和合并的技术,在准确性得到保证的情况下,减少了标注和模型训练的工作量;在图谱生成的过程中针对性的使用了前后处理的规则,有效过滤了杂质。

    一种基于图片信息聚类的信息批量提取方法

    公开(公告)号:CN114202761B

    公开(公告)日:2022-06-21

    申请号:CN202210140562.0

    申请日:2022-02-16

    IPC分类号: G06V30/148 G06V30/18 G06K9/62

    摘要: 本发明公开了一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质,方法包括:从待识别的图像中提取出商品对象和文字对象并分类编号,确定每个对象的坐标系;对得到的不同对象边缘打点并确定所打点的坐标;将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;将组合的对象继续与其他对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续与其他不同类对象碰撞计算,直到所有对象均组合,输出组合对象。本发明能够实现复杂背景中关联对象的组合识别并进行信息提取。