摘要:
L'invention est relative à un limiteur de débit d'une transmission de données selon la technique du seau à jetons, comprenant un compteur de jetons (10) configuré pour être incrémenté à une cadence déterminant le débit moyen de la transmission ; un diviseur de fréquence (12') connecté pour commander l'incrémentation du compteur de jetons à partir d'une horloge (CK), le diviseur ayant un taux de division entier (N) ; et un modulateur (14) configuré pour alterner le taux de division entre deux entiers différents (N, N+1) de manière à faire tendre le débit moyen résultant vers un débit programmé entre deux débits correspondant respectivement aux deux entiers.
摘要:
L'invention est relative à un procédé de synchronisation de processus parallèles, comprenant les étapes consistant à répartir plusieurs fils d'exécution d'un programme entre des unités de traitement (PUO... PU3) ; configurer un registre de synchronisation (20') dans chaque unité de traitement de sorte que son contenu soit écrasé seulement par des bits qui sont à 1 dans des mots écrits dans le registre de synchronisation ; et attribuer une position de bit distincte des registres de synchronisation à chaque fil d'exécution. Lorsqu'un fil d'exécution courant d'une unité de traitement courante a atteint un point de synchronisation, l'unité de traitement courante écrit dans les registres de synchronisation de toutes les unités de traitement un mot dans lequel la position de bit attribuée au fil d'exécution courant est à 1, et suspend le fil d'exécution courant. Lorsque tous les bits attribués aux fils d'exécution sont à 1 dans le registre de synchronisation d'une unité de traitement courante, l'exécution des fils de programme suspendus est reprise dans l'unité de traitement courante, et le registre de synchronisation de l'unité de traitement courante est réinitialisé.
摘要:
L'invention est relative à un processeur ayant plusieurs anneaux de protection (PL) et comprenant un système de gestion d'anneaux de protection (BCU) dans lequel les attributions d'exceptions ou de ressources privilégiées à des anneaux de protection sont définies par une table programmable (REO).
摘要:
L'invention concerne un procédé de mise à jour d'une variable partagée entre plusieurs coeurs de processeur. Les étapes suivantes sont mises en oeuvre à l'exécution dans un des coeurs d'une instruction atomique de lecture-modification-écriture de portée locale (AFA) avec comme paramètre l'adresse mémoire (al) de la variable partagée : réaliser les opérations de l'instruction atomique dans une ligne de cache (L(al)) attribuée à l'adresse mémoire ; et verrouiller la ligne de cache localement (LCK) tout en autorisant un accès à la variable partagée à des coeurs connectés à une autre mémoire cache de même niveau pendant l'exécution de l'instruction atomique de portée locale.
摘要:
L'invention est relative à un procédé de synchronisation de processus parallèles, comprenant les étapes consistant à répartir plusieurs fils d'exécution d'un programme entre des unités de traitement (PUO... PU3) ; configurer un registre de synchronisation (20') dans chaque unité de traitement de sorte que son contenu soit écrasé seulement par des bits qui sont à 1 dans des mots écrits dans le registre de synchronisation ; et attribuer une position de bit distincte des registres de synchronisation à chaque fil d'exécution. Lorsqu'un fil d'exécution courant d'une unité de traitement courante a atteint un point de synchronisation, l'unité de traitement courante écrit dans les registres de synchronisation de toutes les unités de traitement un mot dans lequel la position de bit attribuée au fil d'exécution courant est à 1, et suspend le fil d'exécution courant. Lorsque tous les bits attribués aux fils d'exécution sont à 1 dans le registre de synchronisation d'une unité de traitement courante, l'exécution des fils de programme suspendus est reprise dans l'unité de traitement courante, et le registre de synchronisation de l'unité de traitement courante est réinitialisé.
摘要:
The invention relates to a processor core including an N-bit system memory interface; a register file comprising a plurality of general purpose registers ($r) of capacity less than N bits; a set of N-bit vector registers ($a); in its instruction set, a register manipulation instruction (VLOAD, VALIGN) executable with the following parameters: a) a value (BLTF) defining in the set of vector registers a buffer area formed by a plurality of consecutive vector registers, and b) a reference to a first general purpose register ($rV), the first general purpose register containing an index (idx) identifying a vector register ($a(B+idx)) within the buffer area; and an execution unit (10, 20) configured to, upon execution of a register manipulation instruction, read or write, in one cycle, N bits in a vector register identified from the value defining the buffer area and the index contained in the first general purpose register ($rV).
摘要:
A method is disclosed for block processing two matrices stored in a same shared memory, one ([a]) being stored by rows and the other ([b]) being stored by columns, using a plurality of processing elements (PE), where each processing element (PE0) is connected to the shared memory by a respective N-bit access and to a first adjacent processing element (PE1) by a bidirectional N-bit point-to-point link. The method comprising the following steps carried out in one processor instruction cycle: receiving (LV) in the processing elements (PE0-PE3) respective different N-bit segments of a same one of the two matrices ([b]) by the respective memory accesses; and exchanging (SEND.PE1, RECV.PE1) with the first adjacent processing element (PE1), by means of the point-to-point link, N-bit segments of a first ([a]) of the two matrices which were received in the adjacent processing elements (PE0, PE1) in a previous instruction cycle.
摘要:
L'invention concerne un procédé de traitement de données par un processeur, le procédé comprenant des étapes consistant à : recevoir par le processeur, une instruction comprenant un code d'operateur associé à trois références de registres contenant des opérandes de multiplication (a1, b1, a2, b2), un opérande d'addition (c) et un résultat (rs) d'opérateur, le code d'opérateur désignant un opérateur (OP) configuré pour calculer des produits de paires d'opérandes de multiplication et additionner les produits avec l'opérande d'addition, décoder l'instruction par un décodeur d'instructions du processeur, pour déterminer l'opérateur à exécuter et les registres contenant les opérandes à fournir à l'opérateur et le résultat de l'opérateur, exécuter l'opérateur par un circuit de calcul arithmétique du processeur, appliqué aux opérandes dans les registres désignés par les références de registres, et charger le résultat (rs) de l'opérateur dans le registre désigné pour recevoir le résultat.
摘要:
L'invention est relative à un processeur comprenant un bus de données de N bits configuré pour accéder à une mémoire ; une unité centrale de traitement (CPU) connectée au bus de données ; un coprocesseur couplé à l'unité centrale, comprenant des registres de travail (V) de N bits ; une unité de traitement d'instructions dans l'unité centrale, configurée pour, en réponse à une instruction machine de lecture-dispersion reçue par l'unité centrale, accéder en lecture à une adresse mémoire et déléguer au coprocesseur le traitement du mot correspondant (W) de N bits arrivant sur le bus de données ; une unité de commande de registres dans le coprocesseur, configurée par l'unité centrale en réponse à l'instruction de lecture-dispersion, pour diviser le mot (W) arrivant sur le bus de données en K segments et écrire les K segments à une même position dans K registres respectifs (V0-V3), la position et les registres étant désignés par l'instruction de lecture-dispersion.