Segueix

Comencem l'activitat a :mastodon: amb un fil d'un dels projectes que tenim,

Per què és important el projecte de ? Especialment en el cas :senyera:
voice.mozilla.cat

Hem fet diverses crides a participar en el projecte . Volem explicar-vos per què aquest projecte és important.

1. Les grans empreses disposen de grans quantitats de dades que són la sang dels sistemes d’aprenentatge automàtic. Per a les aplicacions de reconeixement de veu, el primer entrebanc és tenir les dades, és a dir les veus.

Mostra el fil

2. No existeix cap conjunt gratuït de dades de veu en :senyera: i el cost d'elaboració d'aquest tipus de dades és molt elevat. Això dificulta que els productes i serveis lingüístics incloguin el :senyera:

Mostra el fil

3. El projecte facilita que els parlants d'una llengua elaborin un corpus d'enregistraments de veu de forma col·laborativa i gratuïta:
S'enregistren milers de talls de veu i després es revisen. De forma anònima i segura. voice.mozilla.org

Mostra el fil

4. L'objectiu que ens hem marcat és recollir 1.000 hores d'enregistraments. Són les que calen per entrenar sistemes de xarxes neuronals amb bona qualitat. Però el més important és que aquestes dades seran públiques, i inclouran veus de diferents accents, gènere i edat.

Mostra el fil

5. Un altre entrebanc és la llicència que s'aplica a les dades. Les dades del es publiquen en llicència CC0, que és molt semblant al domini públic i permet qualsevol ús de les dades, lliure o comercial. voice.mozilla.org

Mostra el fil

6. usarà les dades de per a crear models de reconeixement en :senyera: i en altres llengües, i els usarà en navegadors i altres aplicacions de programari lliure.

Mostra el fil

7. El més important és que, en usar la llicència CC0 per a les dades del , qualsevol particular, empresa o associació podrà crear els seus models sense restriccions a partir d’aquestes dades.

Mostra el fil

8. Les dades de es podran usar per a afegir el català a assistents lliures, com per exemple el . També les podran usar les gran empreses si decideixen afegir el :senyera: als assistents d'Apple, Google, Amazon o Microsoft.

Mostra el fil

9. Els grups d'investigació i recerca de les universitats, i les petites empreses, tindran disponible un corpus de dades de veu en :senyera: i en altres llengües que altrament no podrien aconseguir. voice.mozilla.org

Mostra el fil

10. És per tots aquests motius que us demanem de col·laborar en el . Si cadascú enregistra 120 talls de veu i en valida 240 podrem assolir l'objectiu fàcilment: voice.mozilla.org/ca

i Bon Any Nou a tothom!

Mostra el fil

@Lluisa al voice.mozilla.org/ca no hi ha cap selecció. Tothom pot participar-hi des del minut 1, amb mòbil o ordinador d'escriptori, enregistrant o validant talls de veu.

Inicia la sessió per participar a la conversa
mastodont.cat, xarxa social pels catalans d'arreu.

Servidor social en català per a la comunitat de llengua i cultura catalanes d'arreu d'internet.