-
公开(公告)号:CN111159410A
公开(公告)日:2020-05-15
申请号:CN201911410177.8
申请日:2019-12-31
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
摘要: 本发明公开了一种文本情感分类方法、系统、装置及存储介质,该方法包括:对文本进行预处理;对预处理后的文本进行统计量计算,得到文本向量;采用卡方统计方法对文本向量进行特征选择,提取出特征向量;对特征向量进行权重计算,得到各个特征向量的权重;结合各个特征向量的权重,基于支持向量机对文本进行分类。该系统包括:预处理模块,统计模块、特征模块、权重模块和分类模块。该装置包括存储器以及用于执行上述文本情感分类方法的处理器。通过使用本发明,可提高文本分类的准确率。本发明作为一种文本情感分类方法、系统、装置及存储介质,可广泛应用于文本分类领域。
-
公开(公告)号:CN111160024B
公开(公告)日:2023-08-15
申请号:CN201911392455.1
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F40/284
摘要: 本发明公开了一种基于统计的中文分词方法、系统、装置和存储介质,其中方法包括:获取目标文本;根据预置语料库对目标文本进行分词处理,识别出第一概率和第二概率;结合第一概率与第二概率对目标文本所含的词进行逆向匹配,输出若干个分词路径,各所述路径含若干个分词节点;结合维特比算法和预置比例因子对各所述分词路径上各分词节点的词进行逆向递归处理,获取最优分词序列;根据最优分词序列生成分词结果,从而提高中文分词处理的分词准确率,并通过预置比例因此降低计算量,降低成本。
-
公开(公告)号:CN111160024A
公开(公告)日:2020-05-15
申请号:CN201911392455.1
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F40/284
摘要: 本发明公开了一种基于统计的中文分词方法、系统、装置和存储介质,其中方法包括:获取目标文本;根据预置语料库对目标文本进行分词处理,识别出第一概率和第二概率;结合第一概率与第二概率对目标文本所含的词进行逆向匹配,输出若干个分词路径,各所述路径含若干个分词节点;结合维特比算法和预置比例因子对各所述分词路径上各分词节点的词进行逆向递归处理,获取最优分词序列;根据最优分词序列生成分词结果,从而提高中文分词处理的分词准确率,并通过预置比例因此降低计算量,降低成本。
-
-