Generative-discriminative language modeling for controllable text generation

Invention Grant

US11481552B2 Generative-discriminative language modeling for controllable text generation 有权

Please log in to see more content

Patent Title: Generative-discriminative language modeling for controllable text generation
Application No.: US17011939

Application Date: 2020-09-03
Publication No.: US11481552B2

Publication Date: 2022-10-25
Inventor: Ben Krause , Akhilesh Deepak Gotmare
Applicant: salesforce.com, inc.
Applicant Address: US CA San Francisco
Assignee: salesforce.com, inc.
Current Assignee: salesforce.com, inc.
Current Assignee Address: US CA San Francisco
Agency: Haynes and Boone, LLP
Main IPC: G06F40/274
IPC: G06F40/274 ; G06F40/284 ; G10L15/183 ; G06F40/216

Generative-discriminative language modeling for controllable text generation

Abstract:

The embodiments describe a generative-discriminative (GeDi) language modeling for determining a next token in a text sequence. A class conditional language model and a positive control code determine a first class conditional probability for each token candidate. The class conditional language model and a negative control code determine a second class conditional probability for the each token candidate. A logarithmic probability difference between the first class conditional probability and the second class conditional probability is determined for each token candidate. An unconditional language model determines an unconditional probability for each token candidate. A combined probability is determined by combining the unconditional probability and the logarithmic probability difference for each token candidate. The next token is selected from the token candidates based on the combined probabilities of the token candidates.

Public/Granted literature

US20210374341A1 GENERATIVE-DISCRIMINATIVE LANGUAGE MODELING FOR CONTROLLABLE TEXT GENERATION Public/Granted day:2021-12-02

Information query

Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/20	.自然语言分析（自然语言的语义分析入G06F40/30）
G06F40/274	..将代码转换为单词；预先猜测部分单词输入