wavekat
voce documentazione blog
← torna al blog

Common Voice Explorer — ascolta le voci del mondo

· Eason Guo
#strumenti #dati-aperti #voice-ai

Se ti sei mai chiesto come suonino migliaia di voci umane reali — età, accenti e lingue diversi — esiste un dataset per questo. Si chiama Mozilla Common Voice ed è una delle più grandi raccolte aperte di parlato registrato al mondo.

Persone da ogni parte leggono volontariamente frasi ad alta voce e donano le proprie registrazioni. Il risultato è una libreria enorme e multilingue di voci reali — liberamente disponibile per chiunque.

C’è solo un problema: esplorarla davvero è difficile.

Il dataset è enorme, gli strumenti no

Common Voice contiene milioni di clip audio in decine di lingue. Per scorrerlo, di solito dovresti scaricare gigabyte di dati, scrivere script per analizzare i file di metadati e allestire la tua catena di riproduzione. Va bene se sei uno sviluppatore, ma esclude tutti gli altri — ricercatori, linguisti, team di prodotto, persone curiose che vogliono semplicemente sentire come suonano i dati.

Ci è sembrata un’occasione mancata.

Così abbiamo costruito Common Voice Explorer

Common Voice Explorer è un semplice strumento web che ti permette di sfogliare il dataset direttamente nel browser. Nessun download, nessuno script, nessuna configurazione.

Common Voice Explorer — cerca, filtra e ascolta le clip direttamente nel browser

Ecco cosa puoi fare:

È pensato per dare la sensazione di sfogliare una libreria musicale, solo che invece di canzoni esplori parlato reale di persone reali in tutto il mondo.

Per chi è?

Onestamente — per chiunque sia curioso dei dati vocali.

Non serve essere tecnici per usarlo. Se sai usare una barra di ricerca e cliccare play, sei a posto.

Perché è importante per noi

In WaveKat stiamo costruendo strumenti di AI vocale per le piccole imprese. Quel lavoro dipende da dati vocali di alta qualità. Common Voice è una delle risorse aperte più importanti in questo ambito e crediamo che renderlo più accessibile vada a vantaggio di tutti — non solo degli ingegneri.

I dati aperti hanno valore solo se le persone possono davvero esplorarli. È questo il divario che volevamo colmare.

Provalo

Common Voice Explorer è online su commonvoice-explorer.wavekat.com. Accedi con GitHub, accetta i termini d’uso e inizia a esplorare.

C’è anche una breve demo su YouTube se vuoi prima vederlo in azione.

← torna al blog